Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

GATE/Annie Zara Kanaeva, November 2002, Information Extraction.

Ähnliche Präsentationen


Präsentation zum Thema: "GATE/Annie Zara Kanaeva, November 2002, Information Extraction."—  Präsentation transkript:

1 GATE/Annie Zara Kanaeva, November 2002, Information Extraction

2 Inhalt Anlegen der Dokumente Laden der sprachverarbeitenden Ressourcen Anlegen und Ausführung der Applikationen auf Dokumenten Anlegen eines Korpus Anlegen und Ausführung der Applikationen auf einem Korpus Überprüfung der Ergebnisse der Verarbeitung Zara Kanaeva, November 2002, Information Extraction

3 Anlegen der Dokumente “Language Resource”: –Lexikone –Korpora –Ontologien Format: –nicht strukturierte Texte –HTML –SGML –XML –RTF –E-Mail Zara Kanaeva, November 2002, Information Extraction

4 Die sprachverarbeitenden Komponenten “ Processing Resource”  Ontology, ProtegeOntology, Ontological Gazetteer SearchPR, LuceneSearchPR  Document  Corpus  AnnotationSchema  DocumentFormat components for XML, HTML, TXT, SGML, RTF, email  Unicode Tokeniser  ANNIE English Tokeniser  ANNIE Gazetteer  OntoText Gazetteer  Jape Transducer  ANNIE NE Transducer  ANNIE VP Chunker  ANNIE Sentence Splitter  Hepple POS Tagger  ANNIE OrthoMatcher  Flexible Exporter  Pipeline  Corpus Pipeline  Features Editor  Annotations Editor  Document Editor  Corpus Editor Zara Kanaeva, November 2002, Information Extraction

5 Laden der sprachverarbeitenden Komponenten  Komponenten, die man explizit lädt:  ANNIE English Tokeniser  ANNIE Gazetteer  ANNIE NE Transducer  ANNIE Sentence Splitter  Hepple POS Tagger  ANNIE OrthoMatcher  ANNIE Coreferencer  ANNIE VP Chunker ... Noch 7 Komponenten Zara Kanaeva, November 2002, Information Extraction

6 Anlegen und Ausführung der Applikationen auf Dokumenten Zara Kanaeva, November 2002, Information Extraction

7 Anlegen eines Korpus  Korpus – eine Sammlung von Dokumenten, die sowohl annotiert als auch nicht annotiert sein können Zara Kanaeva, November 2002, Information Extraction

8 Anlegen und Ausführung der Applikationen auf einem Korpus Zara Kanaeva, November 2002, Information Extraction

9 Überprüfung der Ergebnisse der Verarbeitung Zara Kanaeva, November 2002, Information Extraction

10 Installierte Unix-Version von GATE/Annie  Liegt unter : /import/raid/kanaeva/gate/  Aufruf: sh bin/gate.sh Zara Kanaeva, November 2002, Information Extraction

11 Literatur  http://gate.ac.uk/sale/talks/tutorial3/  http://gate.ac.uk/features.html  H.Cunningham, D. Maynard, K. Bontcheva, V. Tablan, C. Ursu, M. Dimitrov : “Developing Language Processing Components with GATE (a User Guide)“, The University of Sheffield 2001-2002 Zara Kanaeva, November 2002, Information Extraction


Herunterladen ppt "GATE/Annie Zara Kanaeva, November 2002, Information Extraction."

Ähnliche Präsentationen


Google-Anzeigen