An evolutionary approach for improving the quality of automatic summaries Kokou Valentin Seminar Maschinelles Lernen und Experimentelles Design Constantin.

Slides:

Advertisements

Ähnliche Präsentationen

Anzahl der ausgefüllten und eingesandten Fragebögen: 211

Advertisements

Elternfragebogen 2009 Die Auswertung ist da mit super Ergebnissen!

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.

Normalverteilte Zufallsvariablen

LS 2 / Informatik Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)

Genetische Algorithmen für die Variogrammanpassung

= = = = 47 = 47 = 48 = =

Statistiken und Tabellen

Übersicht DIALIGN = DIagonal ALIGNment

Genetische Algorithmen

Genetische Algorithmen

EF: Standards + H2O red = H2O.

Genetische Algorithmen

Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.

Grundkurs Theoretische Informatik, Folie 2.1 © 2006 G. Vossen,K.-U. Witt Grundkurs Theoretische Informatik Kapitel 2 Gottfried Vossen Kurt-Ulrich Witt.

Mh9S170Nr6 a. x1= –9; x2 = 1 b. x1= –4; x2 = 1 c. x1= 1; x2 = 2 d. leer e. x1= –15; x2 = 4,2 f. x1= –3,53; x2 = 1,28 g. leer h. x1= 0,2; x2 = 2 i. x1=

Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.

Kursleitung: Hier ist Platz für Ihren Namen

Differentielles Paar UIN rds gm UIN

Prof. Dr. Bernhard Wasmayr

Studienverlauf im Ausländerstudium

Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)

Prof. Dr. Bernhard Wasmayr VWL 2. Semester

AWA 2007 Natur und Umwelt Natürlich Leben

Blütenbehandlung 2009–2011 (% der Anbaufläche)

Zerlegung von Quadraten und ????

Unfallprävention auf Autobahnen

Prof. Dr. Günter Gerhardinger Soziale Arbeit mit Einzelnen und Familien Übersicht über die Lehrveranstaltung Grundlegende Bestimmungsfaktoren der Praxis.

Die Geschichte von Rudi

Zusatzfolien zu B-Bäumen

AGOF facts & figures: Branchenpotenziale im Internet Q4 2013: Entertainment Basis: internet facts / mobile facts 2013-II.

Eine Einführung in die CD-ROM

GBI Genios Wiso wiso bietet Ihnen das umfassendste Angebot deutsch- und englischsprachiger Literatur für die Wirtschafts- und Sozialwissenschaften. Wir.

Dokumentation der Umfrage

Wir üben die Malsätzchen

Titelmasterformat durch Klicken bearbeiten Textmasterformate durch Klicken bearbeiten Zweite Ebene Dritte Ebene Vierte Ebene Fünfte Ebene 1 Development.

Addieren und Subtrahieren von Dezimalzahlen

Messung der Ionisierungsenergie von Wasserstoff

Das entscheidende Kriterium ist Schönheit; für häßliche Mathematik ist auf dieser Welt kein beständiger Platz. Hardy.

Der Ablauf eines Clear Rex Klärzyklus

PROCAM Score Alter (Jahre)

Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.

L.O.C. Mehrzweckreiniger 1 l Konzentrat 9,00 € ( GP 6,91 €)

Eine lllustration der Herausforderungen des Stromsystems der Zukunft

AGOF facts & figures: Branchenpotenziale im Internet Q1 2014: Reise & Touristik Basis: internet facts / mobile facts 2013III.

Szenisches Lernen Wie Theaterelemente den Unterricht bereichern

Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.

MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO

Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.

Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.

Zusammengestellt von OE3DSB

Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)

QUIPS 2011 Qualitätsverbesserung in der postoperativen Schmerztherapie.

Dokumentation der Umfrage BR P2.t Ergebnisse in Prozent n= 502 telefonische CATI-Interviews, repräsentativ für die Linzer Bevölkerung ab 18 Jahre;

Technische Frage Technische Frage Bitte löse die folgende Gleichung:

Unternehmensbewertung Thomas Hering ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List of Figures Tabellenübersicht.

Forschungsprojekt Statistik 2013 „Jugend zählt“ – Folie 1 Statistik 2013 „Jugend zählt“: Daten zur Arbeit mit Kindern und Jugendlichen.

AGOF facts & figures: Branchenpotenziale im Internet Q2 2014: Parfum & Kosmetik Basis: internet facts / mobile facts 2014-I.

Gedankenlesen Durch Studien fand man heraus, dass Gedanken in einem gewissen Maße lesbar sind.

Folie Einzelauswertung der Gemeindedaten

ÖGB BÜRO CHANCEN NUTZEN

1 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt Modalverben.

Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.

1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.

Monatsbericht Ausgleichsenergiemarkt Gas – Oktober

AGOF facts & figures: Branchenpotenziale im Internet Q3 2014: Telekommunikation Basis internet facts / mobile facts 2014-II.

Evolutionärer Entwurf neuronaler Netze

Präsentation transkript:

An evolutionary approach for improving the quality of automatic summaries Kokou Valentin Seminar Maschinelles Lernen und Experimentelles Design Constantin Orasan

Referenz Constantin Orasan (2003): An Evolutionary Approach for Improving the Quality of Automatic Summaries. In: Proceedings of the ACL 2003 Workshop on Multilingual Summarization and Question Answering, Sapporo, Japan 2

Überblick automatische Zusammenfassungen Corpusanalyse Methoden Algorithmen Evaluation Zusammenfassung 3

Automatische Zusammenfassung 2 Ansätze für automatische Zusammenfassungen extract and rearrange wichtigsten Sätze aus dem Text extrahieren versuchen die Sätze kohärent neu anzuordnen bevorzugt wenn robuste Methoden benötigt understand and generate den Text verstehen Kurzbeschreibung generieren Methoden abhängig von der Domäne um zu verstehen 4

Automatische Zusammenfassung continuity principle benötigt mind. 2 aufeinanderfolgende Äußerungen Diese beziehen sich auf die gleiche Entität – Tom hat sich ein Auto gekauft – Es ist 12 Jahre alt – Der Motor muss augestauscht werden. 5

Corpusanalyse 146 menschliche Kurzbeschreibungen aus JAIR automatischer Test durch ein simples Skript prüft Übereinstimmung von Head Noun Phrase 75% der Paare erfüllen das Prinzip 6

Corpusanalyse Äußerungen welche das Prinzip verletzen werden manuell geprüft Verbindung zwischen Äußerungen durch rhetorische Beziehungen (57%) Wörter wurden durch semantisch äquivalente ersetzt (34%) Verzweigungen in der Diskursstruktur durch bestimmte Wörter (9%) 7

Corpusanalyse continuity principle vorhanden in von Menschen produzierten Kurzbeschreibungen nicht bewusste Nutzung des Prinzips bessere Ergebnisse bei automatischen Zusammenfassungen trotzdem nicht sicher dass man kohärenten Text bekommt 8

Methoden Minimierung der continuity principle Verletzungen Programm muss wichtigen Information erkennen Informationen zusammenhängend wiedergeben 2 Methoden um Sätze zu bewerten – Content basierende Bewertung – Kontext basierende Bewertung 2 Algorithmen nutzen gleiche Content basierende Bewertung 9

Methoden Content-basierende Bewertung Keyword : TF-IDF Indicator phrase: Meta-diskurs Marker (in this paper, we present) Wert wird erhöht oder verringert Location method: wichtige Sätze am Anfang und Ende des Documents Title and headers: Werte werden erhöht Special formating rules: Sätze mit Gleichungen werden ausgeschlossen da selten in Abstracts 10

Methoden Kontext basierende Bewertung Wert wird erhöht wenn Satz und Vorgänger oder Nachfolger continuity principle erfüllen Wenn nicht, wird der Wert verringert erhöht wird mit dem TF-IDF der gemeinsamen NP Köpfe verringert mit dem höchste TF-IDF des Dokuments 11

Algorithmen Given an extract {S summ1, S summ2,..., S summ m } and S the sentence which is considered for extraction 1.Find S prec and S next from the extract which are the closest sentence before and after S in document 2.Adjust the score S considering the context S prec,S,S next. 12

Algorithmen Greedy Algorithmus alle noch nicht entnommenen Sätze werden bewertet der Satz mit höchstem Wert wird entnommen Algorithmus wird wiederholt bis verlangte Länge der Zusammenfassung erreicht ist 13

Algorithmen Genetische Algorithmen codieren das Problem als Chromosomen Länge der Chromosomen = Anzahl der Sätze der Zus. nicht sicher das beste Ergebnis zu bekommen Integer Werte statt binäre Codierung (3,8,10 usw.) jeder Wert bezeichnet die Position des Satzes im Dokument 14

Algorithmen

Algorithmen Fitnessfunktion: Summe der Werte welche in Chromosomen eingetragen sind Selektion: weighted roulette wheel (fitteres ) Genetische Operatoren: – single point crossover – two mutation operators 16

Algorithmen Single point crossover 17

Algorithmen first mutation operator second mutation operator 18

Algorithmen First mutation operator soll zufällige Sätze einfügen um dem Algorithmus zu helfen Second mutation operator fügt zusammenhängende Sätze ein welche die Kohärenz der Zusammenfassung zu verbessern jeder Operator hat eine bestimmte Wahrscheinlichkeit Generell startet Population mit zufällig generierten Chromosomen Population: 500 Chromosomen in 100 Generationen Lösung für Problem ist das Chromosom mit höchsten Fitnesswert 19

Evaluation Wörter aus 10 wissen. Texten 8 versch. Zusammenfassungen von jedem Text jede einzelne von Menschen gelesen und geprüft Qualität der Zusammenfassung wird gemessen : – Kohärenz – Zusammenhang – Aussagekraft 20

Evaluation Kohärenz wird gemessen an der Anzahl der Diskursbrüche Brüche entstehen wenn ein Satz scheinbar isoliert ist Meisten markiert durch bestimmte Phrasen: – Firstly – Secondly – However – On the other hand 21

Evaluation In kürzeren Zusammenfassung haben Kontext Informationen weniger Einfluss auf Diskursbrüche Indicating Phrases haben größeren Einfluss als continuity principle Bei längeren Zusammenfassung bessere Ergebnisse erzielt GA in allen Fällen besser als Basic Method Greedy sehr nah an Basic Method continuity principle unterschiedliche Beeinflussung der Ergebnisse je nach Text 22

Evaluation MethodTextTotal TFIDF12(29)5(13)17(33)10(16)7(10)12(19)9(15)14(18)12(35)8(15)106(203) Basic8(24)4(11)11(23)5(7)4(6)7(14)9(8)12(11)10(16)7(12)77(132) Greedy8(20)4(7)12(20)4(10)4(7)8(16)11(7)8(9)9(14)8(12)76(122) Evolutionary6(11)3(9)14(16)4(5)4(4)7(9)7(3)8(3)9(9)5(6)67(75) Maximum15(39)12(21)20(51)13(20)7(13)15(23)14(23)15(25)17(44)11(40)139(299) Tabelle 1: Anzahl der Diskursbrüche in den Zusammenfassungen 23

Evaluation Verbesserung der lokalen Kohesion hat untergeordneten Effekt auf baumelnde Referenzen Anzahl der Referenzen verringert sich durch GA Greddy auch hier nicht besser als Basic Method Häufigsten Referenzen beziehen sich auf Bilder, Tabellen – As we showed in Table 3… – How you see in Figure 2… Oft kein Text und deswegen sollte es nicht vorkommen in Zusammenfassung 24

Evaluation MethodTextTotal TFIDF12(31)3(25)22(35)13(15)4(10)14(22)14(16)11(22)12(19)9(15)144(210) Basic12(26)2(23)17(19)7(13)2(7)11(20)10(9)10(8)6(12)8(15)85(162) Greedy11(19)3(14)15(20)4(19)3(9)13(23)16(10)4(11)7(12)7(14)83(151) Evolutionary8(18)3(16)15(18)6(6)2(6)9(12)10(7)4(5)5(13)7(12)69(113) Tabelle 2: Anzahl der baumelnden Referenzen in den Zusammenfassungen 25

Evaluation Content- basierende Metrik zur Beurteilung Kontext- basierender Methoden Berechnet die Ähnlichkeit zwischen Zusammenfassung und Originaldokument Gute Ergebnisse liegen bei einem Wert nahe 1 GA erzielt für einige Texte die besten Ergebnisse Greedy scheint nützliche Informationen auszuschliessen Für einige Texte schlechtere Ergebnisse als bei Basic und Baseline 26

Evaluation MethodText TFIDF0.84 (0.92) 0.85 (0.95) 0.84 (0.93) 0.92 (0.87) 0.87 (0.94) 0.80 (0.90) 0.86 (0.87) 0.92 (0.86) 0.82 (0.89) 0.88 (0.85) Basic0.81 (0.91) 0.85 (0.87) 0.87 (0.90) 0.93 (0.87) 0.89 (0.93) 0.88 (0.87) 0.89 (0.83) 0.90 (0.89) 0.68 (0.88) 0.92 (0.86) Greedy0.87 (0.90) 0.85 (0.) (0.89) 0.93 (0.88) 0.86 (0.95) 0.84 (0.74) 0.78 (0.85) 0.90 (0.86) 0.58 (0.86) 0.90 (0.88) Evolutionary0.82 (0.86) 0.88 (0.95) 0.84 (0.91) 0.94 (0.89) 0.86 (0.88) 0.87 (0.88) 0.90 (0.88) 0.86 (0.87) 0.81 (0.82) 0.88 (0.91) Tabelle 3: Ähnlichkeiten zwischen Zusammenfassung und Originaldokument 27

Evaluation Vergleichen der Ergebnisse Baseline : TF-IDF (Satz mit höchstem TF-IDF Wert) content-basierende Methode (alle Parameter ) Greddy Algorithmus (+ Kontext Informationen) Genetische Algorithmus (+ Kontext Informationen) wie Sätze aus dem Dokument extrahiert werden 28

Zusammenfassung Zwei Algorithmen kombinieren Content und Kontext Informationen Greedy wählt immer einen Satz nach dem anderen aus – Einmal ausgewählt kann er nicht verworfen werden GA bestimmt ein Set von extrahierten Sätzen – Überwindet die Begrenzung des Greedy Algorithmus GA konsistent bessere Ergebnisse als die andern Methoden Teilweise textabhängig wie sehr continuity principle Ergebnisse beeinflusst 29

Diskussion Da continuity principle manchmal zu geringer Effekt – Kombination der Centering Theory Prinzipien Algorithmus auf andere Textarten anwenden – Sportartikel, Wirtschaftstexte 30