Seminar Textmining WS 06/07 Themen Übung 8 Diskussion über Erkennung von Eigennamen Question Answering Stemming.

Slides:



Advertisements
Ähnliche Präsentationen
Polynomial Root Isolation
Advertisements

Die Mailing-Liste der Musterlösung
Claudio Moraga; Gisbert Dittrich
WS Prof. Dr. Th. Ottmann Algorithmentheorie 09 - Suche in Texten KMP, BM.
Wo sind wir eigentlich? Bei diesen Websites lohnt sich das Anklicken.
Wo sind wir eigentlich? Bei diesen Seiten lohnt sich das Anklicken.
Suche in Texten (Stringsuche )
Seminar Textmining WS 06/07 Aufgaben II 1.Dokumente im VSM 2.Ranking 3.Term-Term-Korrelation 4.Relevance Feedback 5.Termgewichtung.
Seminar Textmining WS 06/07
Seminar Textmining WS 06/07 Themen I Übung in erster Linie um zugrundeliegende Methoden zu verstehen. D.h. es gibt immer einen/mehrere Themenschwerpunkte,
Seminar Textmining WS 06/07 Themen Übung 8 Stemming Crawling.
Seminar Textmining WS 06/07 Aufgaben III Termgewichtung Postings Datei Clustering.
Termextraktion Ziele der Extraktion Stand der Extraktionsprogramme
Seminar Textmining WS 06/07 Aufgaben I 1.Metadaten 2.Einfache Inverse Liste 3.Modifizierte Inverse Liste für komplexere Anfragen 4.Boolsches Retrieval.
Seminar Textmining WS 06/07
Seminar Textmining WS 06/07 Aufgaben IV Postings Datei Clustering Probabilistisches Information Retrieval.
Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!
Binnendifferenzierung im Mathematik-Unterricht der SEK II
Listen [mia, vincent, jules, yolanda] [mia, robber(honey_bunny), X, 2, mia] [] [mia, [vincent, jules], [butch, girlfriend(butch)]] [[], dead(zed), [2,
Übung 6.6Schranken 1.Angenommen, Ihr Algorithmus habe einen Aufwand von g(n) = 5n 3 + n für alle n a)Geben sie eine obere Schranke O(g(n)) an. b)Beweisen.
ein historisch neues Phänomen?
WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.
1WS 06/07 Organisatorisches 1.Vorlesung am Montag, : 9-11 Uhr in Gebäude 106, Raum Podcasts: Probleme mit der Videoqualität sind behoben.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Algorithmentheorie 7 – Bin Packing
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
Tutorium
STLB-Bau Kundenmanager
Was atmet. Eine Rose. Die Haut. Ein Molekül. Holz
Ideen der Informatik Suchen und Sortieren [Ordnung muss sein…]
AutorHeidi Sigrist-Jost ThemaErfahrungen MusikPiano Solo Theme by Alan Silvestri pps & Fotos byMonika Müller © of fotos and pps by monika müller
Computational Thinking Suchen und Sortieren [Ordnung muss sein…]
Wo liegt die Erde im Sonnensystem?
Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Information und Kommunikation
§3 Allgemeine lineare Gleichungssysteme
Gleichungen und Gleichungssysteme
Die Struktur von Untersuchungen
Interrogatives asking for person thing / concept condition amount
Unser Sonnensystem Teil 4
Der Mond Warum ist das so?
Autor Heidi Sigrist-Jost Thema Erfahrungen
Jamshid Azizi: Folie Isomorphietest Jamshid Azizi
Context-awareness Andreas Bossard, Matthias Hert.
Aufgaben Version 1: Es soll eine Wetterstation mit folgenden zwei Anzeigen implementiert werden: Aktuelle Wetterbedingungen mit Temperatur und.
Entdeckungen 1: das mittelalterliche Weltbild
Wie entsteht eine Mondfinsternis ?
Übung 4.1 Strukturierte Datentypen
MARS Der Rote Planet.
Numerische Analyse von Rotman-Linsen zur Strahlformung von Antennengruppen.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation III Vorlesung 1 WS 2001/02 Punkt-in-Landkarte I (Streifenkarte)
Astronomie NWT9 Teil 5 GZG FN Sj. 08/09
Präsentation Fotos vom Universum Atlantis -.
Doku-Teilabschnitt: 1 von Bürgerkommission Hagsfeld e.V. Freitag, 06. März 2009
Habe ich den Heiligen Geist?
Vergleiche von Adjektiven
Institut für Softwarewissenschaft – Universität WienP.Brezany 1 Beispiele (Frist: ) Beispiel 1: Sei  = {a, b} ein Alphabet und Q = {q 0, q 1 } eine.
Präsentation Unser Sonnensystemm Atlantis - Es ist 10:58:14 Uhr !!!
Mechanik II Lösungen.
Mechanik I Lösungen.
E r f a h r u n g e n.
Jupiter und seine Monde Rainer Christiansen Fachhochschule Flensburg
AIRBUS 380 Ist ein Großraumflugzeug des europäischen Herstellers Airbus Seine Spannweite beträgt Meter, ist 73 Meter lang und ist damit das Größe.
1 DAS ÖSTERREICHISCHE GALLUP INSTITUT TV-Impacttest Marke „Sujet“ tt.mm.jjjj.
Joshua Antlfinger und Frauke Schrader. Was ist THE Port? Hackathon 2014 Teams Themen und Lösungen Unsere Tätigkeiten Hackathon 2015.
Lesen Sie den Text und suchen Sie die Antworten auf die folgenden Fragen. Schreiben Sie auf ein neues Blatt Papier in kompletten Sätzen: Was für ein Land.
 Präsentation transkript:

Seminar Textmining WS 06/07 Themen Übung 8 Diskussion über Erkennung von Eigennamen Question Answering Stemming

Seminar Textmining WS 06/07 1. Erkennung von Eigennamen Beispiele für relevante Entitäten in dem TIMEX Format: all of :24 a.m. Chicago time several million New Pesos more than 95% in North and South America the U.S. Fish and Wildlife Service the Clinton government Microsoft chairman Bill Gates said yesterday

Seminar Textmining WS 06/07 2. Question Answering Beantworten Sie die folgende Frage schriftlich –Abstand von Erde und Mond? –Was ist die schönste Stadt? Vergleichen Sie Ihre Antworten Gegeben sei ein Textstück mit der Antwort auf diese Frage Heute kann man die Entfernung des Mondes entweder mit Radar- oder Laserlichtlaufzeit extrem präzise bestimmen. Dazu sendet man ein Radarsignal oder einen Laserstrahl auf den Mond und wartet, wie lange es dauert, bis die Reflektion zurückkommt. Es sind etwas mehr als 2 Sekunden. Der Wert der mittleren Entfernung Erde-Mond ist km. Deutlich abgeschlagen sind dagegen Metropolen wie Paris (Rang 33), London (39) und New York (47). Auf den ersten drei Plätzen liegen wie im Vorjahr Zürich, Genf und Vancouver. Auch sonst gab es nur marginale Verschiebungen gegenüber der letzten Studie. Formulieren Sie einen allgemeinen Algorithmus, der die Antwort aus diesem und anderen Texten möglichst eindeutig extrahiert

Seminar Textmining WS 06/ Was im Web vorkommt 8. Treffer: Der Abstand Erde - Sonne beträgt ^11 m, der Abstand Erde - Mond ^8 m Treffer: Sydney- die schönste Stadt der Welt - by move! multimedia und move! images Viele fantastische Bilder und... Hilfreich? Offenbar gibt es verschiedene Sorten von Fragen und nur einige sind sinnvoll (automatisch) beantwortbar

Seminar Textmining WS 06/ Typen von Fragen und Antworten (CLEF) Faktoid: –Fragen nach Person, Zeit, Ort, Organisation, Mass, Anzahl, Objekt (Woraus besteht Magma?) oder anderes. Definition: –Fragen der Sorte Was/Wer ist X? als auch nach Personen, Organisationen,Objekten und anderem. Liste von Elementen Frage: –Fragen, die eine Antwort mit einer Liste mit begrenzter Anzahl von Elementen erwarten –(Nenne alle Flughäfen in London) Alle Fragen können temporal eingegrenzt sein.

Seminar Textmining WS 06/ Automatisches FAQ Sammelsystem Formulieren Sie einen Algorithmus, der FAQs getrennt nach Fragen und Antworten aus dem Web sammelt, unter der Annahme, dass ein guter crawler gegeben ist. Welche Probleme könnten auftreten?

Seminar Textmining WS 06/07 3. Stemming Was ist Stemming? Wofür ist es nützlich? Welche Sorten von Stemming gibt es? Für welche Sprachen funktioniert welche Sorte wie gut?

Seminar Textmining WS 06/ Arten von Stemming Erklären und an Beispiel vorfüren und Sprachen nennen, wo das gut, oder schlecht funktioniert: –N-gram stemming –Affixabtrennung –Porter Algorithmus –Trie-basiertes Stemming Was ist under- und overstemming? Beispiele?

Seminar Textmining WS 06/07