Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Ulrich Stuller Geändert vor über 9 Jahren
1
GATE/Annie Zara Kanaeva, November 2002, Information Extraction
2
Inhalt Anlegen der Dokumente Laden der sprachverarbeitenden Ressourcen Anlegen und Ausführung der Applikationen auf Dokumenten Anlegen eines Korpus Anlegen und Ausführung der Applikationen auf einem Korpus Überprüfung der Ergebnisse der Verarbeitung Zara Kanaeva, November 2002, Information Extraction
3
Anlegen der Dokumente “Language Resource”: –Lexikone –Korpora –Ontologien Format: –nicht strukturierte Texte –HTML –SGML –XML –RTF –E-Mail Zara Kanaeva, November 2002, Information Extraction
4
Die sprachverarbeitenden Komponenten “ Processing Resource” Ontology, ProtegeOntology, Ontological Gazetteer SearchPR, LuceneSearchPR Document Corpus AnnotationSchema DocumentFormat components for XML, HTML, TXT, SGML, RTF, email Unicode Tokeniser ANNIE English Tokeniser ANNIE Gazetteer OntoText Gazetteer Jape Transducer ANNIE NE Transducer ANNIE VP Chunker ANNIE Sentence Splitter Hepple POS Tagger ANNIE OrthoMatcher Flexible Exporter Pipeline Corpus Pipeline Features Editor Annotations Editor Document Editor Corpus Editor Zara Kanaeva, November 2002, Information Extraction
5
Laden der sprachverarbeitenden Komponenten Komponenten, die man explizit lädt: ANNIE English Tokeniser ANNIE Gazetteer ANNIE NE Transducer ANNIE Sentence Splitter Hepple POS Tagger ANNIE OrthoMatcher ANNIE Coreferencer ANNIE VP Chunker ... Noch 7 Komponenten Zara Kanaeva, November 2002, Information Extraction
6
Anlegen und Ausführung der Applikationen auf Dokumenten Zara Kanaeva, November 2002, Information Extraction
7
Anlegen eines Korpus Korpus – eine Sammlung von Dokumenten, die sowohl annotiert als auch nicht annotiert sein können Zara Kanaeva, November 2002, Information Extraction
8
Anlegen und Ausführung der Applikationen auf einem Korpus Zara Kanaeva, November 2002, Information Extraction
9
Überprüfung der Ergebnisse der Verarbeitung Zara Kanaeva, November 2002, Information Extraction
10
Installierte Unix-Version von GATE/Annie Liegt unter : /import/raid/kanaeva/gate/ Aufruf: sh bin/gate.sh Zara Kanaeva, November 2002, Information Extraction
11
Literatur http://gate.ac.uk/sale/talks/tutorial3/ http://gate.ac.uk/features.html H.Cunningham, D. Maynard, K. Bontcheva, V. Tablan, C. Ursu, M. Dimitrov : “Developing Language Processing Components with GATE (a User Guide)“, The University of Sheffield 2001-2002 Zara Kanaeva, November 2002, Information Extraction
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.