GATE/Annie Zara Kanaeva, November 2002, Information Extraction
Inhalt Anlegen der Dokumente Laden der sprachverarbeitenden Ressourcen Anlegen und Ausführung der Applikationen auf Dokumenten Anlegen eines Korpus Anlegen und Ausführung der Applikationen auf einem Korpus Überprüfung der Ergebnisse der Verarbeitung Zara Kanaeva, November 2002, Information Extraction
Anlegen der Dokumente “Language Resource”: –Lexikone –Korpora –Ontologien Format: –nicht strukturierte Texte –HTML –SGML –XML –RTF – Zara Kanaeva, November 2002, Information Extraction
Die sprachverarbeitenden Komponenten “ Processing Resource” Ontology, ProtegeOntology, Ontological Gazetteer SearchPR, LuceneSearchPR Document Corpus AnnotationSchema DocumentFormat components for XML, HTML, TXT, SGML, RTF, Unicode Tokeniser ANNIE English Tokeniser ANNIE Gazetteer OntoText Gazetteer Jape Transducer ANNIE NE Transducer ANNIE VP Chunker ANNIE Sentence Splitter Hepple POS Tagger ANNIE OrthoMatcher Flexible Exporter Pipeline Corpus Pipeline Features Editor Annotations Editor Document Editor Corpus Editor Zara Kanaeva, November 2002, Information Extraction
Laden der sprachverarbeitenden Komponenten Komponenten, die man explizit lädt: ANNIE English Tokeniser ANNIE Gazetteer ANNIE NE Transducer ANNIE Sentence Splitter Hepple POS Tagger ANNIE OrthoMatcher ANNIE Coreferencer ANNIE VP Chunker ... Noch 7 Komponenten Zara Kanaeva, November 2002, Information Extraction
Anlegen und Ausführung der Applikationen auf Dokumenten Zara Kanaeva, November 2002, Information Extraction
Anlegen eines Korpus Korpus – eine Sammlung von Dokumenten, die sowohl annotiert als auch nicht annotiert sein können Zara Kanaeva, November 2002, Information Extraction
Anlegen und Ausführung der Applikationen auf einem Korpus Zara Kanaeva, November 2002, Information Extraction
Überprüfung der Ergebnisse der Verarbeitung Zara Kanaeva, November 2002, Information Extraction
Installierte Unix-Version von GATE/Annie Liegt unter : /import/raid/kanaeva/gate/ Aufruf: sh bin/gate.sh Zara Kanaeva, November 2002, Information Extraction
Literatur H.Cunningham, D. Maynard, K. Bontcheva, V. Tablan, C. Ursu, M. Dimitrov : “Developing Language Processing Components with GATE (a User Guide)“, The University of Sheffield Zara Kanaeva, November 2002, Information Extraction