Assoziative lexikalische Ketten

Slides:



Advertisements
Ähnliche Präsentationen
Statistische Aspekte der PSG
Advertisements

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Grundstudiumspraktikum “Maschinelle Übersetzung”
Meine Familie Hier ist mein Vater, Gomez Hier ist meine Mutter, Morticia Hier ist meine Groβmutter, Mami Hier ist mein Onkel, Onkel Fester ©MFL Sunderland.
Arbeits- und Organisationspsychologie
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Telling Time in German Deutsch 1 Part 1 Time in German There are two ways to tell time in German. There are two ways to tell time in German. Standard.
Doris Kocher, PH Freiburg
Grammatikentwicklung
Dissimilation und ihre Bedeutung für den diachronen Lautwandel
Einführungssitzung Architekturen interoperabler Systeme für raumzeitliche Prozesse Einführungssitzung Lars Bernard, Udo Einspanier,
Reguläre Sprachen Karin Haenelt.
© Karin Haenelt 2006, Äquivalenzen Reg.Ausdrücke, Reg.Sprachen, EA ( ) 1 Reguläre Sprachen Karin Haenelt.
© Karin Haenelt 2005, Endliche Automaten: Alphabet, Zeichenreihe, Sprache, Endliche Automaten Grundlagen: Alphabet, Zeichenreihe, Sprache.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher im Kurs erarbeitete Konzepte(1): Umgang mit einfachen Datentypen Umgang mit Feldern Umgang mit Referenzen.
Semantisch gestützte Suche im Internet
1 Reverse Engineering WS 07 / 08 A. Zündorf. Fachgebiet Software Engineering Übersicht © Albert Zündorf, Kassel University 2 Organisatorisches.
A definite relative pronoun must agree in gender and number with the noun or pronoun to which it refers which is often called the antecedent. The case.
Semantic Web-Anwendungen auf Basis des BAM-Portals Ein Prototyp Volker Conradt.
Die Geschichte von Rudi
Knowledge Discovery mit Wordnet und Alembic Workbench
1 Knowledge Discovery mit Wordnet und Alembic Workbench (Julia Faion) (Markus Reiter)
Im Internet geht alles schneller, aber es dauert länger
Anglo-Amerikanische Korpuslinguistik Anglo-American Corpus Linguistics Erstellt von Gudrun Krenn Slawische Korpuslinguistik SE SS 2006 Dr. Branko Tošović
You need to use your mouse to see this presentation
Inhaltsverzeichnis Polnische Athlet über ihn Er als Schriftsteller Robert und Tanzen mit den Stars Show Erfolge Kreuzworträtsel.
Lexikalische Semantik
Abteilung für automatische Sprachverarbeitung
Hauptseminar SS 2006 Hinweise für Autoren.
Übung zu Einführung in die LDV I
An Austrian Text Book For students age 17 – 18 years.
Deutsch Zwei
1 von 7 ViS:AT BMUKK, IT – Systeme für Unterrichtszwecke 05/11 EZ, CR Social Networks – Soziale Netzwerke Virtuelle Science Cafes & Diskussionsforen für.
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Universität StuttgartInstitut für Wasserbau, Lehrstuhl für Hydrologie und Geohydrologie Copulas (1) András Bárdossy IWS Universität Stuttgart.
How Does Fuzzy Arithmetic Work ? © Hartwig Jeschke Institut für Mikroelektronische Schaltungen und Systeme Universität Hannover
English Grammar Die Zeiten der englischen Sprache für Franziska
Referentin: Lydienne Reith
GERMAN 1013 Kapitel 2 2. Die Familie die Großeltern die Eltern die Kinder die Geschwister die Enkel der Großvater der Vater der Sohn der Bruder die Großmutter.
1 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt Modalverben.
Numbers Greetings and Good-byes All about Me Verbs and Pronouns
 Every part in a sentence has a grammatical function. Some common functions are: - Subject - Verb - Direct object / accusative object - Indirect object.
Die Fragen Wörter Wer? Was? Wann?.
Monatsbericht Ausgleichsenergiemarkt Gas – Oktober
Nominative & Accusative Basic Rules for Relative Pronouns in German:
Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Lexikalische Datenbanken WordNet – RussNet EuroWordNet und Global WordNet Association.
Sprachprodukttechnologie SS 2001G. Heyer 1 Sprachstatistik  Grundlegende Definitionen  Alphabet Sei NL eine natürliche Sprache und sei A eine Menge von.
What is a “CASE”? in English: pronouns, certain interrogatives
What is a “CASE”? in English: pronouns, certain interrogatives
Interrogative Words. Interrogative words, also called question words are used to ask for information.
type / function / form type of words:
Adjektive + Komparativ
© Crown copyright 2011, Department for Education These materials have been designed to be reproduced for internal circulation, research and teaching or.
Kapitel 2 Grammar INDEX 1.Adjectives. Verbs, Present Tense (Review) 1.Auf Klebepapier schreib was du erinnerst über Deutsche Verben 2.Notizen über Present.
Kapitel 4 Grammar INDEX 1.Ordinal Numbers 2.Relative Pronouns and Relative Clauses 3.Conditional Sentences 4.Posessive: Genitive Case.
10.3 Lektion 10 Geschichte und Gesellschaft STRUKTUREN © and ® 2012 Vista Higher Learning, Inc Der Konjunktiv I and indirect speech —Ich komme.
Kapitel 9 Grammar INDEX 1.Formal Sie- Command 2.There Is/There Are 3.Negation: Nicht/Klein.
The PageRank Axioms Johannes Zaunschirm. Überblick / Outline  Alon Altman and Moshe Tennenholtz. “Ranking Systems: The PageRank Axioms”., 2005  Basisstruktur.
Word order: 1.In a main clause the VERB is the second idea: Helgakommteben aus der Bäckerei This may not be the second word Meiner Meinung nachsind Hobbys.
Interrogatives and Verbs
Dom zu Lübeck The Lübeck Cathedral (German: Dom zu Lübeck, or colloquially Lübecker Dom) is a large brick Lutheran cathedral in Lübeck, Germany and part.
Van der Meer AJ, Feld JJ, Hofer H J. Hepatol Oct 22
Freizeit Thema 5 Kapitel 1 (1)
Grundlagen Englisch Passive voice HFW Bern.
Uranus. Uranus is the seventh in terms of distance from the Sun, the third in diameter and the fourth in mass of the planet of the Solar System. It was.
type / function / form type of words:
The Conversational Past
 Präsentation transkript:

Assoziative lexikalische Ketten Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen Lexical Chainer [Brunn01] Prototyp – Entwurf einer Implementierung Mögliche Ergänzungen - Kritik 28.05.2002

Psycholinguistischer Ansatz – mentales Lexikon 1 Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung psycholinguistische Erkenntnisse (Hypothesen) über die Strukturierung des „mentalen Lexikons“ Assoziationsexperimente zeigen: association: noun – noun: 79 % association: adjective – adjective 65 % association: verb – verb: 43 % Folgerung: vermutlich stärkere Zusammenhänge innerhalb einer syntaktischen Kategorie (=> WordNet) Alternative Erklärung: assoziationspsychologische Experimente mit isolierten Wortformen 28.05.2002

Psycholinguistischer Ansatz – mentales Lexikon 2 Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung 28.05.2002 [Aitch97], S. 109

Realisierung in WordNet Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung Verschiedene Relationen: Antonymie Synonymie Meronymie etc. Topical hierarchies bei Substantiven Entailment Relations (?) bei Verben N-dimensional hyperspaces (?) bei Adjektiven [Fellb] 28.05.2002

Kollokationen – Kollokationsgraphen 1 Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung „Als Kollokationen wollen wir hier Paare von Wortformen bezeichnen, die signifikant häufig gemeinsam in einem Satz auftreten, bezogen auf die Menge der vorliegenden Beispielsätze.“ http://wortschatz.uni-leipzig.de/html/faq/koloka.html Die Kollokationen eines Wortes lassen sich auch graphisch darstellen in Kollokationsgraphen 28.05.2002

Kollokationen – Kollokationsgraphen 2 Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung dog – Detailstufe 1 28.05.2002

Kollokationen – Kollokationsgraphen 3 Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung dog – Detailstufe 2 28.05.2002

Kollokationen – Kollokationsgraphen 4 Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung dog – Detailstufe 3 28.05.2002

Lexical Chainer [Brunn01] Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung Brunn, Meru et.al.: Text Summarization using lexical Chains. 2001. (DUG) Lexikalische Ketten werden zur Zusammenfassung von Texten eingesetzt: Schritte (siehe Prototyp): Besonderheit: - noun filtering [Brunn01]: Trenung von „Information“ und „Rauschen“: nouns, die zum Text/Inhalt gehören Substantive, die Teil des Themas (subjects) sind, sind wichtiger andere Substantive verdecken oft den Zusammenhang, werden gefiltert probeweise einfache Heuristiken: NPs in Nebensätzen seien unwichtiger 28.05.2002

Part-of-Speech-Tagging pyWordNet -> WordNet Prototyp Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung Segmentation einzelne Sätze Satzzeichen bearbeiten Vorgaben des jeweilige Taggers beachten ... Part-of-Speech-Tagging Brill-Tagger (Einschränkung: englisch, UNIX/LINUX) pyWordNet -> WordNet Lexical Relations – Ausgabe als html-Datei (xml-Datei ?) 28.05.2002

Beispiel 1: Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung High Bone Density Due to a Mutation in LDL-Receptor–Related Protein 5 Osteoporosis is a major public health problem of largely unknown cause. Loss-of-function mutations in the gene for low-density lipoprotein receptor–related protein 5 (LRP5), which acts in the Wnt signaling pathway, have been shown to cause osteoporosis–pseudoglioma. Methods We performed genetic and biochemical analyses of a kindred with an autosomal dominant syndrome characterized by high bone density, a wide and deep mandible, and torus palatinus. Results Genetic analysis revealed linkage of the syndrome to chromosome 11q12–13 (odds of linkage, >1 million to 1), an interval that contains LRP5. Affected members of the kindred had a mutation in this gene, with valine substituted for glycine at codon 171 (LRP5V171). This mutation segregated with the trait in the family and was absent in control subjects. The normal glycine lies in a so-called propeller motif that is highly conserved from fruit flies to humans. Markers of bone resorption were normal in the affected subjects, whereas markers of bone formation such as osteocalcin were markedly elevated. Levels of fibronectin, a known target of signaling by Wnt, a developmental protein, were also elevated... 28.05.2002

Beispiel 2: Num-ber Word Form Sen-tence Hypernym Hyponym Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung Num-ber Word Form Sen-tence Hypernym Hyponym Member Meronym Part Holonym Substance Holonym 1 'High' 2 'Bone' [18, 42, 45, 56, 64, 19] [18, 42, 45, 56, 64] 3 'Density' [57] 4 'Mutation' 5 'Protein' [12, 49, 51] 6 'Osteoporosis' 7 'health' 8 'problem' 9 'mutation' 10 'gene' [22, 25] 11 'lipoprotein' [12, 49, 51, 57] 12 'protein' 13 '5' 14 'acts' 15 'pathway' 16 'Method' 17 'syndrome' 18 'bone' [19] 19 'mandible' 28.05.2002

Mögliche Ergänzungen – Kritik 1 Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung Mengen ohne Oberbegriffe (außerhalb der Hierarchien) fehlen fehlende syntagmatische Relationen: inhaltlich ähnliche Begriffe, sog. Kohyponyme (Schafe und Rinder zu Schweine – Bauerhof) Kombinationen von Namen (Bill zu Clinton, Romeo zu Julia) Verb-Nomen-Kombinationen (beißen - Hund - Herrchen) 28.05.2002

Mögliche Ergänzungen – Kritik 2 Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung Folge: fehlende Bezüge zwischen verschiedenen Wortklassen Vernetzung innerhalb bestimmter Domänen, Beispiele: Sport Wirtschaft Einkaufen ... Möglichkeit ausloten, vorhandene Domänen-/Sachgebiets-Klassifikationen zu nutzen, z.B. Klassifikation der Schlagwort-Norm-Datei (SWD) der Deutschen Bibliothek, Frankfurt (???) 28.05.2002

Mögliche Ergänzungen – Kritik 3 Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung weitere semantische Relationen, z.B. [STE90] ??? 28.05.2002

Literatur Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung [Aitch97] Aitchison, Jean: Wörter im Kopf. Eine Einführung in das mentale Lexikon. Max Niemeyer: Tübingen 1997. [Brunn01] Brunn, Meru; Chali, Yllias; Pichak, Christopher J.: Text Summarization using lexical Chains. 2001. http://www-nlpir.nist.gov/projects/duc/duc2001/final_duc_papers/lethbridge.pdf [Fellbaum] Fellbaum, Christiane: Ein semantisches Netz als Bedeutungstheorie. In: Herrmann/Grabowski: Bedeutung,...???, S. 211-230 [Gar96] Garman, Michael: Accessing the mental lexicon. In: Psycholinguistics. University Press: Cambridge 1996. S. 239-298 [Mill93] Miller, George; Fellbaum, Christiane et. al.: Introduction to WordNet. An online lexical database. 1993. (5papers.pdf) http://www.cogsci.princeton.edu/~wn/. [Quast98a] Quasthoff, Uwe: Projekt Deutscher Wortschatz. In: Heyer / Wolff (Hrsg.): Linguistik und neue Medien, DUV 1998. http://wortschatz.uni-leipzig.de/Papers/Projekt_Wortschatz_97.pdf [Quast98b] Quasthoff, Uwe:Deutscher Wortschatz im Internet. LDV-Forum 2/1998 http://wortschatz.uni-leipzig.de/Papers/DeutscherWortschatzimInternet.doc [STE90] Steele, J.: Meaning-text theory: linguistics, lexicography and implications, University of Ottawa Press; Ottawa, London, Paris, 1990 28.05.2002