Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Übung Datenbanksysteme WS 2003/ Übung Datenbanksysteme Entwurf eines Bibliothekssystems
Seminar Textmining WS 06/07 Themen Übung 11 unsupervised vs. supervised Symbolfolgen, Kunstsprachen Page Rank.
Seminar Textmining WS 06/07 Aufgaben II 1.Dokumente im VSM 2.Ranking 3.Term-Term-Korrelation 4.Relevance Feedback 5.Termgewichtung.
Seminar Textmining WS 06/07 Themen I Übung in erster Linie um zugrundeliegende Methoden zu verstehen. D.h. es gibt immer einen/mehrere Themenschwerpunkte,
Seminar Textmining WS 06/07 Themen Übung 8 Stemming Crawling.
Seminar Textmining WS 06/07 Aufgaben III Termgewichtung Postings Datei Clustering.
Seminar Textmining WS 06/07 Aufgaben I 1.Metadaten 2.Einfache Inverse Liste 3.Modifizierte Inverse Liste für komplexere Anfragen 4.Boolsches Retrieval.
Seminar Textmining WS 06/07 Themen Übung 8 Diskussion über Erkennung von Eigennamen Question Answering Stemming.
Seminar Textmining WS 06/07
Seminar Textmining WS 06/07 Aufgaben IV Postings Datei Clustering Probabilistisches Information Retrieval.
WS 05/06Automatische Akquisition linguistischen Wissens1 Partielles Wissen erweitern 1.Zusammenhang mit bisherigen Algorithmen 2.Vom offensichtlichen zum.
Maschinelle Übersetzung I
On a Buzzword: Hierachical Structure David Parnas.
Kapitel 7.2 Dining philosophers problem
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Manuelle Verfahren Klassifizierung Hier werden Dokumente in ein fest vorgegebenes System.
Klassifizierung der sprachlichen Unterschiede zwischen Intonationsmelodien Jonathan Harrington.
Algorithmentheorie 6 – Greedy-Verfahren
Vorlesung Informatik 3 Einführung in die Theoretische Informatik (06 – Reduktion endlicher Automaten) Prof. Dr. Th. Ottmann.
Algorithmentheorie 7 – Bin Packing
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Integrierte Übersetzungsprozesse
Sprachkonstruktion I Konstruktion einer neuen Sprache Einladung zu einem Sprachexperiment Sie sind eingeladen, sich an einem Sprachexperiment zu beteiligen.
Indexierung - Verschlagwortung
Relevanz Ranking Bisher: Sind wir davon ausgegangen, dass das Ergebnis des Rankings des statistischen Verfahrens in den Index geschrieben wird und dem.
Relevanz Ranking Bisher:
Grammatikentwicklung
Grundlagen der Künstlichen Intelligenz
Raid 0.
Entitäten Extraktion Einführung
Entitäten Extraktion Wichtige Schritte Petra Maier WS 05/06.
ProQuest Business Databases
Was atmet. Eine Rose. Die Haut. Ein Molekül. Holz
Die „Erweiterte Suche“
Tipps für die Einfache Suche. Setzt du deine zusammengehörigen Suchbegriffe in Anführungszeichen, erhältst du dann nur jene Ergebnisse die genau die eingegebene.
Grammatik: Satzbau und Wortbildung
Don`t make me think! A Common Sense Approach to Web Usability
Die feinen Lederhandschuhe
Diplomingenieure.
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Autor: Vera Aleksić , Graz Breaking the Language Barrier Sprachtechnologieprodukte der Firma Linguatec, München: - Personal Translator
Französisch-Slawische Korpuslinguistik Французско- славянская корпусная лингвистика Aigner Ruth Prenn Linde SE Korpuslinguistik O. Univ.-Prof. Dr. Branko.
Hoffnung in Hoffnungslosigkeit
Wer weiß, gewinnt Wissens- und Medienplattformen im Internet w w w. s a f e r i n t e r n e t. a t.
Erstellen einer Greenmap mit berufsberatenden, -vermittelnden u
Hast du deinen Ordner oder deine Datei im PC verloren?
Datei -> Optionen -> …
Trust and context using the RDF- Source related Storage System (RDF‑S3) and easy RQL (eRQL) Karsten Tolle und Fabian Wleklinski.
Elternabend der Schule … vom …
Nicht alles muss man mit einem Zitat belegen.
Technik schädlicher Software
Bfu – Beratungsstelle für Unfallverhütung Transit NXT von STAR in der bfu Feierabendgespräch Tecom, 11. Juni 2014, Bern Antonio Cifelli, Übersetzer
Willkommen bei der Präsentation von interessanten Eigenschaften der Wörterbücher Lingea Lexicon. Unter den Seiten können Sie mit Hilfe von Tasten und Maus.
Grammatikalische Begriffe im Unterricht
Äquivalenz.
Lernen, lernen ©SOMM2010.
Konzept Hilfsmittel für Wörterlernen Simplistischer Seitenaufbau à la Google Multimedia – und mehrsprachige Suche Unterstützung für 42 Sprachen Ergebnisse.
Maya Kindler 5c. Man kann fertige Templates downloaden! Eine sehr gute Plattform ist joomlaos. Man.
Arbeiten mit WordSmith 4. Inhalt 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus) 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus)
Deutsche Wörterbücher Part 3 Tipps zum richtigen Umgang mit deutschen Wörterbüchern Developed by Elisabeth Wielander, Aston University.
Leseverstehen Strategien für das erfolgreiche Lesen Transition Module 3 developed by Elisabeth Wielander.
Trainingscamp Hörverstehen Katharina Leiss  In Teil 1 gibt es 6 Punkte.  In Teil 2 gibt es 7 Punkte.  In Teil 3 gibt es 7 Punkte. A2 bekommst.
Trainingscamp Leseverstehen Katharina Leiss 2016.
Sozialpsychologie WS 10/11 Henrik Singmann Session 8.
„Warum ist Sia translations das Richtige für mich?“ „Warum ist Sia translations das Richtige für mich?“ Was bekommen Sie automatisch von uns? KKostenlose.
Leseverstehen Strategien für das erfolgreiche Lesen
Suchen und Finden Wie verwende ich Suchmaschinen richtig?
Erstellung der Diagnostischen Hausarbeiten
Einführung: Statistische Verfahren der automatischen Indexierung
 Präsentation transkript:

Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!

Seminar Textmining WS 06/07 Arten von Problemen mit Multilingualität Was ist: –Multilingual document –Multilingual collection –Multilingual system –Cross-language system –Translingual system Technische Probleme –Charactersets, Fonts, Lokalisierungen, Segmentierungen Inhaltliche Probleme –Inkompatible Morphologien –Unterschiedlicher Sprachaufbau, Grammatik, semantik –Lassen sich unterschiedliche Inhalte dennoch nutzen?

Seminar Textmining WS 06/07 Aufgabe Formulieren Sie ein System, welches aus einem Parallelkorpus Anfragen in einer Sprache Dokumente aus beiden Sprachen retrieven kann. 2 Gruppen: Eine setzt auf qualitative manuelle Annotationen usw., die andere auf rein statistische Verfahren. Diskutieren Sie bei dem Vorschlag der jeweils anderen Gruppe für welche Sprachpaare welche Probleme auftreten würden.

Seminar Textmining WS 06/07 Beispiel Assisting Translators in Indirect Lexical Transfer System, welches beim Übersetzen hilftSystem –Insbesondere bei indirekten Übersetzungen –Lets have a walk > Lass uns einen Spaziergang machen / eine Runde drehen / frische Luft schnappen / nach draussen gehen Verwendet Kookkurrenzbasierte semantische Wortähnlichkeit, um zu Wort-Wort Übersetzung aus Wörterbuch semantisch ähnliche Wörter zu finden Dabei wird jedes Wort übersetzt und nur im Zielsprachigen Korpus vorkommende Phrasen mit diesen Wörtern angezeigt Erreicht damit 50% höheren Recall als bisherige Systeme! Damit wurde lediglich Wissen in der Zielsprache genutzt, um Übersetzungsqualität zu erhöhen.

Seminar Textmining WS 06/07 Interaktivität Beim Suchen: –Spezifikation der Suchsprache explizit oder inhärent (also keine explizite Unterscheidung der Sprachen im Index) –Spezifikation der Antwortseiten explizit oder nicht. –Wenn Explizit – wie erkennt man dann die Sprache eines Dokuments? Oder pro Satz? Oder pro Domainname? … Beim Übersetzen: –Auswahl der besten Übersetzung oder vorgenerierung

Seminar Textmining WS 06/07 Woher kommt Wissen? Wortübersetzungen –Aus manuell erstellen Wörterbüchern –Oder aus statistischer Alinierung von Wörtern aus parallelen Korpora Übersetzungen von Phrasen –Parser in Quell- und Zielsprache –Statistische Korrelation von Konstruktionen (funktioniert mit unsupervised Parsing evtl. besser als mit supervised, siehe Rens Bod) Referenzauflösungen –Peter warf den Stein. Er fiel ins Wasser.Ist ambig –Peter threw the stone. He fell into the water.Ist falsch