Seminar Textmining WS 06/07 Themen I Übung in erster Linie um zugrundeliegende Methoden zu verstehen. D.h. es gibt immer einen/mehrere Themenschwerpunkte,

Slides:



Advertisements
Ähnliche Präsentationen
Steffen Maretzke October 2010 pers com
Advertisements

Informatik II: Algorithmen und Datenstrukturen SS 2013
Starter Activity: Create a mind map on your own, with as many German words as you can think of to do with holidays!
Wo bleibt Dein Glaube? Gedanken zum neuen Jahr
Seminar Textmining WS 06/07 Aufgaben V Bemerkung zu clustering Probabilistic IR Indexierung von Dokumenten Thesauri.
Seminar Textmining WS 06/07 Themen Übung 11 unsupervised vs. supervised Symbolfolgen, Kunstsprachen Page Rank.
Seminar Textmining WS 06/07 Aufgaben II 1.Dokumente im VSM 2.Ranking 3.Term-Term-Korrelation 4.Relevance Feedback 5.Termgewichtung.
Seminar Textmining WS 06/07 Themen Übung 8 Stemming Crawling.
Seminar Textmining WS 06/07 Aufgaben III Termgewichtung Postings Datei Clustering.
Seminar Textmining WS 06/07 Aufgaben I 1.Metadaten 2.Einfache Inverse Liste 3.Modifizierte Inverse Liste für komplexere Anfragen 4.Boolsches Retrieval.
Seminar Textmining WS 06/07 Themen Übung 8 Diskussion über Erkennung von Eigennamen Question Answering Stemming.
Seminar Textmining WS 06/07 Aufgaben IV Postings Datei Clustering Probabilistisches Information Retrieval.
Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!
Übung 6.6Schranken 1.Angenommen, Ihr Algorithmus habe einen Aufwand von g(n) = 5n 3 + n für alle n a)Geben sie eine obere Schranke O(g(n)) an. b)Beweisen.
SEMINAR ZUM OC F-PRAKTIKUM Tipps zur Vortragstechnik Clemens Richert Institut für Organische Chemie Universität Karlsruhe (TH) 03. Mai 2004.
SEMINAR ZUM OC F-PRAKTIKUM Tipps zur Vortragstechnik Clemens Richert Institut für Organische Chemie Universität Karlsruhe (TH)
Anwendung von Arbeitstechniken bei der Texterschließung
für die Erstellung einer Präsentation
Lesestrategien Vor dem Lesen 1 Erwartungen an den Text formulieren
? Was ist Informatik? Was ist Informatik? Alexander Lange
So funktioniert die Börse. …zunächst in englisch, dann in deutsch Once upon a time in a village, a man appeared and announced to the villagers that he.
Don`t make me think! A Common Sense Approach to Web Usability
Kapitel 6 Wiederholung von Frau Klamer.
Den menschen verstehen lernen
Die Deutsche Politik.
Männer ....
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Freitag den 5. Juli Probleme in der Schule. Starteraktivität Finde diese Wörter im Wörterbuch um/ziehen wechseln verlieren bestehen bekommen zu/nehmen.
Text : © Gerd Hess automatisch.
Eichendorff Jung Alt Lubowitz.
TOBIAS GONSCHOREK   Der weg zum Erfolg.
Wer weiß, gewinnt Wissens- und Medienplattformen im Internet w w w. s a f e r i n t e r n e t. a t.
Das perfekte Herz.
Textverarbeitungsprogramme
Ihr Weg ins Internet Die entscheidenden Faktoren für eine erfolgreiche Internetstrategie.
Vortrag: Visual Basic Neuerungen Autor : Dennis Hoyer
Eines Tages stand ein junger Mann mitten in der Stadt und erklärte,
Deutsch Zwei Guten Morgen! Heute ist Montag! Die Sinnfrage: Was machst du für deine Gesundheit? Das Ziel: You will discuss healthy.
Darvas Strategie Erich Joos Trendfolge-Strategie Nur Longseite Kaufe Ausbrüche aus Konsolidierungsphasen am Allzeithoch Verkaufe bei Schwäche.
in der Stadt und erklärte, er habe das schönste Herz im ganzen Tal.
Normal Word Order Peter schwimmt. Inverted Word Order Schwimmt Peter?
Jesus, wir heißen Dich Willkommen (Jesus, we welcome you)
Es gib jede Menge einzelne Wörter, alle mit dem dazugehörigen Bild…
Manuels Schulaufgabenvorbereitung
Emotionale Intelligenz
Es lohnt sich wirklich, die Texte in aller Ruhe mal durchzulesen.
Stephanie Müller, Rechtswissenschaftliches Institut, Universität Zürich, Rämistrasse 74/17, 8001 Zürich, Criminal liability.
You need to use your mouse to see this presentation © Heidi Behrens.
Spiegelbild “Reflection” Unheilig
Turkish Assimilation in Germany The past, the present, the future.
Das Lied der Liebe Text von Rumi bitte klicken!
© Crown copyright 2011, Department for Education These materials have been designed to be reproduced for internal circulation, research and teaching or.
Kapitel 4 Grammar INDEX 1.Ordinal Numbers 2.Relative Pronouns and Relative Clauses 3.Conditional Sentences 4.Posessive: Genitive Case.
Das schönste Herz Eines Tages stand ein junger Mann mitten in der Stadt und erklärte, dass er das schönste Herz im ganzen Tal habe. Eine große Menschenmenge.
Imperativ What is the Imperative used for?
Das Wetter Lernziele: Heute: The „Wenn“ clause! - To describe and report the weather - To discuss activities done in different types of weather - To compare.
DA- und WO- Verbindungen Wie gut verstehst du sie?
Warum musste Jesus sterben? 3. Alpha-Abend.
The World of Work Wir sind zu konsumorientiert! Diskutieren Sie! Objective: To discuss the view that society is too consumerist.
Indico Meeting Dennis Klein 4. August Übersicht  Korrespondenz CERN  Trouble Ticket Queue  Integration GSI-Accounts  Subversion & Wiki  Todo.
Auffassung zur Wissenschaft Ziele: Sie beziehen die Informationen von der Internetseite "Understanding Science" auf Psychologie. Entwicklungsimpuls zu.
DA- und WO- Verbindungen Wie gut verstehst du sie?
My great friends let this not come to you as Meine großen Freunde, lasst dies nicht zu uns kommen, als.
“werden” has four meanings or applications in German.
I'm inspired by people that are different in their own ways
Grundlagen Englisch Passive voice HFW Bern.
You need to use your mouse to see this presentation
Safe but attractive. Bike accessories
Students have revised SEIN and HABEN for homework
 Präsentation transkript:

Seminar Textmining WS 06/07 Themen I Übung in erster Linie um zugrundeliegende Methoden zu verstehen. D.h. es gibt immer einen/mehrere Themenschwerpunkte, aber auch Platz für Diskussion und Fragen, die gemeinsam bearbeitet werden. Themenschwepunkte heute: Automatische Text, Absatz, Satz und Wortalinierung Automatische Übersetzung Zeitreihenanalyse Themen nächstes Mal: Terminologieextraktion Visualisierung semantischer Netze

Seminar Textmining WS 06/07 Alinierung Ziel bei Wörterbuchgenerierung ist erstellen oder vergrössern von Wörterbüchern. Anfang meist bei Textalinierung, d.h. zwei Texte sind gegeben, von welchen bekannt ist, dass sie den gleichen Inhalt haben. Dann Absatzalinierung (meist trivial) und Satzalinierung (nicht trivial). Anschliessend Wortalinierung (schwierig).

Seminar Textmining WS 06/07 Linktypen Gegeben seien zwei Sätze. Geben Sie eine Wortalinierung an. And the aboriginal people dont have any money. Die Ureinwohner aber nutzen keine Währung. Welche Linktypen lassen sich ableiten? Was bedeutet das für die automatische Wortalinierung?

Seminar Textmining WS 06/07 Wortalinierung, Wörterbuchgenerierung Gegeben seien zwei alinierte Absätze in Deutsch und Englisch. Erstellen Sie eine perfekte Satz- und Wortalinierung. Circa 1,000 years ago, the continent of Australia was full with intelligent life, being the original location of the lost city of Atlantis and the landing area for a peaceful alien civilization (see Cylons). Since these heady days, Australia has never regained any lifeforms that could be defined as intelligent. Shortly thereafter, the current day inhabitants who call themselves Aboriginals invaded the continent. Vor ungefähr 1,000 Jahren war der Kontinent Australien voll von intelligentem Leben. Schliesslich war es der Ort der verlorenen Stadt Atlantis, aber auch wegen der Landung von friedlichen Außerirdischen (siehe Cylons). Seit jenen schönen Tagen allerdings, wurden auf Australien keine Wesen mit nennenswerter Intelligenz beobachtet, insbesondere seit der Kontinent von den heutigen Einwohnern überrannt wurde, die sich Aboriginees nennen.

Seminar Textmining WS 06/07 Wortalinierung Was fällt Ihnen dabei auf? Erstellen Sie eine Wortalinierung nach dictionary match + exact match + Wortlänge Algorithmus. Bekannte Übersetzungen: continent - Kontinentalien- Fremd Australia - AustralienSince- seit years - Jahrenever- niemals full - volldefined- definiert with - mitcurrent- Strom of - vonthe- der area- Raumcall- rufen Welche Fehler entstehen? Was fällt Ihnen ein, um diese zu vermeiden? Wieviel Prozent des Lexikons wurden wirklich genutzt?

Seminar Textmining WS 06/07 Automatische Übersetzung Gegeben der erste Satz von Folie 4: Circa 1,000 years ago, the continent of Australia was full with intelligent life, being the original location of the lost city of Atlantis and the landing area for a peaceful alien civilization (see Cylons). Angenommen, Sie haben ein Wörterbuch, wo zu jedem Wort die direkte Übersetzung steht. Wie sieht die Übersetzung aus? Dagegen sagt Babelfish: Vor Circa Jahren, der Kontinent von Australien war mit intelligentem Leben voll und war die ursprüngliche Position der verlorenen Stadt von Atlantis und des Landungbereichs für eine ruhige ausländische Zivilisation (sehen Sie Cylons). Was macht Babelfish besser? Und vor allem, wie? Und was schafft es nicht?

Seminar Textmining WS 06/07 Zeitreihenanalyse Wichtige Faktoren beim Vergleich zweier Woerter –Relative Haeufigkeit statt absoluter –Korrelation zwischen Wörtern per Tag, Text oder Satz Welche Faktoren gibt es beim Neologismensuchen zu beachten? –Wirklich neu? –Wirklich Dauerhaft? –Zu jedem Neologismus gibt es eine Langform? (siehe LASER) Zusätzlich zu den im Seminar gezeigten, welche Möglichkeiten zur Visualisierung von Zeitbasierten Abhängigkeiten fallen Ihnen noch ein? –Graphenbasiert?