Diplomarbeitsvortrag Ontologien, Information Extraction und Information Retrieval – eine Synthese Marcus Heidmann in Zusammenarbeit mit AIFB &

Slides:



Advertisements
Ähnliche Präsentationen
Web-Content-Management-Systeme
Advertisements

PG Intelligence Service
PG-402 Wissensmanagement: Ontologiebasierte Wissensextraktion
Pop Jazz C B A Jazz C A Lehrstuhl für Künstliche Intelligenz
Inhalt Saarbrücken,.
Recherchieren im Internet:. Überblick über den Suchraum Kataloge Suchmaschinen Datenbanken Metasucher.
Grundstudiumspraktikum “Maschinelle Übersetzung”
Daten fließen lassen XML in Microsoft Office 2003 Lorenz Goebel Frank Fischer
:35 Architektur Moderner Internet Applikationen – Sonderthema 1 Copyright ©2003 Christian Donner. Alle Rechte vorbehalten. Architektur Moderner.
ELearning – The Next Five Years AIFB Rudi Studer Learning Lab Lower Saxony Institute AIFB, University of Karlsruhe
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
16. Juni 2006 Stefan Ukena Burstein und McDermott: Ontology Translation for Interoperability Among Semantic Web Services Hamburg, 16. Juni 2006.
Ontologien- Query 1 Teil2
Semantic Integration Carola Eschenbach, Özgür Özçep Universität Hamburg, FB Informatik AB Wissens- und Sprachverarbeitung (WSV) Sommersemester 2006.
Das Substantiv (das Nomen)
DEPARTMENT FÜR INFORMATIK
Konzeption und Realisierung eines Text- Analysesystems zur Automatisierung der Bewerberauswahl von diesem Datenformat jede beliebige Anwendung adaptieren.
Wissensmanagement mit semantischen Netzen – Analyse und Vergleich verschiedener Softwarelösungen Autor: Holger Wilhelm Referentin: Prof. Dr. Uta Störl.
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Parser generieren Yet Another Compiler – Compiler YACC.
Grammatikentwicklung
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Manuelle Verfahren Klassifizierung Hier werden Dokumente in ein fest vorgegebenes System.
Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.
Semtation GmbH Christian Fillies Dr. Frauke Weichhardt
Wissensbasierte Daten- interpretation für einen automatisierten und adaptiven Inhaltsintegrationsprozeß Lyndon J B Nixon
Rollenspezifische Ontologien zur kontextsensitiven Unterstützung in Informationsbeschaffungsprozessen am Beispiel eines E-Government Helpdesks C. Fillies,
PinK Plattform für intelligente Kollaborationsportale Dr. Joachim Quantz, e.V. Berlin, 13. September 2005.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Michael Jiracek Harald Kolbe Roland Tresselt
SYSTRAN Information and translation technologies.
Grundlegende Analysen & Zwischendarstellungen
Sicherheit im Semantic Web Universität des Saarlandes FR 6.2 Informatik WS 05/06 HS Semantische Webdienste und Agenten Betreuer: Dr. Matthias Klusch Referentin:
- Die wichtigsten Wortarten im Überblick -
Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.
Kurzreferat Der Wissensbegriff auf einer Grundlage von: Towards the Semantic Web - Ontology-Driven Knowledge Management von: Lars Aßmann.
SEP Halgurt Mustafa Ali Can Önder Marius Morawski Matthias Seidl Themen: Integration von RDQL und OWQL innerhalb des Apache Cocoon Frameworks Semantische.
Entitäten Extraktion Einführung
Metadaten als Bausteine des Semantic Web META-LIB Workshop 22
Evaluation zum Projekt „Olympia für alle“
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Knowledge Discovery mit Wordnet und Alembic Workbench
1 Knowledge Discovery mit Wordnet und Alembic Workbench (Julia Faion) (Markus Reiter)
Taxonomie Lernziel Nomen Verb (vgl. Wiechmann J. 2006, S. 76ff)
Übersicht Motivation Konzeption Umsetzung/ Implementierung
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
Proseminar: „Webtechnologien für Ecommerce“
EScience eScience ist die globale Zusammenarbeit in Schlüsselgebieten der Forschung und die nächste Generation Werkzeuge, um diese Art von Forschung zu.
Anregung für die Gestaltung von differenzierten Aufgabenstellung
Suchen und Finden. Vielfältig vorgehen Kompetenzen aufbauen Recherche als Prozess Ziel: Ergebnismengen minimieren, Qualität maximieren.
Mini-VaKE Values and Knowledge Education für Volksschulkinder
Kriterien für das Bewerten von Ergebnismengen. Bewertungen im Suchprozess.
Informations-Forum: SAP Interoperabilität
Struktur von RDF Fabian Scheller.
Dokumentenablage und -Flut im Griff - mit unternehmensweiten Suchmaschinen Fachvortrag auf der I+E Messe Freiburg ©Semantec 2007 Dokumentenablage.
Ein Märchen..
Web-basierter Unterricht in der Computergraphik: Konzepte und Realisierung von interaktiven Online-Kursen Reinhard Klein, Frank Hanisch Wilhelm-Schickard.
Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München,
Eike Schallehn, Martin Endig
Thema Name des Vortragenden Ort, Datum
Industry / Academic Partnerships for XML E-Business Forum für den Finanzdienstleistungsbereich Institute of Information Systems J. W. Goethe-University.
Informationsrecherche & Analyse im Netz
Projektgruppe: Internetdienst zur Planung und Modellierung logistischer Netzwerke und Supply Chains Oldenburg, den Hahn/Behrens/Gaudig.
Semantic Web.
Entwicklung eines internetgestützten Expertensystems zur Prüfung des Anwendungsbereichs urheberrechtlicher Abkommen.
© 2003 ontoprise GmbH Semantisches Knowledge Retrieval am Beispiel des SemanticMiner™ WM2003 Luzern, Eddie Mönch.
Winter 2014/2015 Quelle: Statistik Austria * lt. TA, vorläufige Schätzung; Umsätze real: -0,5% Ankünfte: 17,5 Mio. (+3,6%) Inländer: 5,2 Mio. (+2,4%) Ausländer:
Kapitel 9 Grammar INDEX 1.Formal Sie- Command 2.There Is/There Are 3.Negation: Nicht/Klein.
1 Die Transnationalisierung der Schweizer Chefetagen Die Schweiz im Prozess der Transnationalisierung Janine, Silja, Veronica 13. Dezember 2011.
Bildungs- und Fachsprache: Beispiele
 Präsentation transkript:

Diplomarbeitsvortrag Ontologien, Information Extraction und Information Retrieval – eine Synthese Marcus Heidmann in Zusammenarbeit mit AIFB &

November 2001, Marcus Heidmann AIFB & Inhaltsübersicht 1.Problemstellung – Informationsextraktion 2.Einordnung der Arbeit in die Semantic Value Chain 3.Informationsextraktion 4.SMES Beispielanalyse 5.Prozess der Datenextraktion 6.Architekturüberblick SmesMiner 7.Demonstration des SmesMiner 8.Evaluation von SMES 9.Analyse der Firmennamenerkennung 10. Vergleich der Erkennungsleistung von Firmennamen 11. Zusammenfassung & Ausblick

November 2001, Marcus Heidmann AIFB & Problemstellung - Informationsrecherche Vision des Semantic Web: Maschinelle Agenten "verstehen" Informationen und unterstützen den Benutzer bei der Recherche Tim Berners-Lee Informationsrecherche zu viele Dokumente falsche Stichwörter Dokumente statt Antworten Eigennamen? Personen, Orte, Unternehmen Manuelle Extraktion von Informationen Informationsverknüpfung verschiedener Quellen

November 2001, Marcus Heidmann AIFB & Semantic Value Chain Generierung neuen Wissens durch Kombination der Information und Ableitung der Zusammenhänge Extraktion von Wissen und Verknüpfung von Inhalten mit den Wissensmodellen Anwendungen zum Aufsuchen und Finden von Wissen Werkzeugunterstützte Modellierung von Wissensbereichen und Domänen Knowledge Generation Knowledge Collecting Knowledge Retrieval Knowledge Modelling Faktengenerierung durch linguistische Analyse und Konzeptmapping SMES & Ontobroker Browserbasierte interaktive Abfragekomponente SmesMiner

November 2001, Marcus Heidmann AIFB & Informationsextraktion Tokenscanner Wortsegmentierung Syntaktische Analyse Parsing an die Börse (Präpositional-Phrase) die Börse (Nominal-Phrase) Verbgruppen Lexikalische Analyse Part-of-Speech Flexionsform Kompositerkennung Eigennamenerkennung Nomen (z.B. Aufgabe), Verb, Pronomen etc. Aufgaben (Genus:weiblich, Numerus:Plural) z.B. An- und Verkauf Firmen, Personen, Orte Token Klasse: Aufgabe (first_capital_word) Domänen Analyse Templatevereinigung Mustererkennung Der Umsatz beträgt 1,5 Mio AnkerZahl & WährungVerb

November 2001, Marcus Heidmann AIFB & SMES Beispielanalyse SMES SMES-Beispielausgaben von Marcus Heidmann. <W TC="31" POS="1" COMP="smes - beispiel ausgaben STEM="ausgabe" INFL="[ ]">SMES-Beispielausgaben von Marcus Heidmann Person ohne Titel Nomen

November 2001, Marcus Heidmann AIFB & Prozess der Datenextraktion Domänen Lexikon Fakten Ontobroker Ontologie HTML entfernen ASCII-Dateien AnalyseXML-Dateien AnalyseXML-Dateien SMES Konzept und Nomen Extraktion (XQL) Klassifizierung mit Domain Lexikon

November 2001, Marcus Heidmann AIFB & Architekturübersicht SmesMiner Fakten Basis Ontobroker Ontologie Synonym Wörterbuch Internet Dokumente Index Server Servlet SmesMiner

November 2001, Marcus Heidmann AIFB & SmesMiner DEMO

November 2001, Marcus Heidmann AIFB & Evaluation von SMES Analysebereich Anzahl Ausprägungen PrecisionRecall korrektfalschfehlt Firmennamen %80% Personennamen %90% Ortsbezeichnungen %86% Gesamt %83% Nomen %88% Analyse von 100 Testdokumenten durch manuellen Abgleich "wahre" Precision wahrscheinlich etwas niedriger Sehr gute Leistung bei der Eigennamenerkennung und der Identifikation von Nomen Probleme mit englischen Begriffen Lexikon aktualisieren

November 2001, Marcus Heidmann AIFB & Analyse der Firmennamenerkennung Analysebereich Anzahl Ausprägungen PrecisionRecall korrektfalschfehlt DAX %50% Dow Jones812188%30% Nemax %46% Nemax 50 (Variation) %98% Euro-Stoxx %46% Falsche Erkennung von zusammengesetzten Firmennamen, wenn ein Teil des Namens ein deutsches Wort ist (z.B. Münchener Rück, MAN) geringe Abdeckung des internen Firmennamenlexikons hohe Erkennungsleistung bei Gesellschaftsbezeichnungen durch Referenzauflösung

November 2001, Marcus Heidmann AIFB & Vergleich Firmennamen- Erkennungsleistung Systeme von MUC-7 (Englisch)

November 2001, Marcus Heidmann AIFB & Zusammenfassung & Ausblick 1.Konzepterkennung auf Dokumentenebene Unternehmen1 Unternehmen2 Kennzahl 1,25 Mio Person 2.Kontexterkennung 3.Zuordnung von Ausprägungen 4.Relationen zur Bildung von Ableitungen 5.Multilinguale Analyse

VIELEN DANK FÜR IHRE AUFMERKSAMKEIT Marcus Heidmann

Backup Folien

November 2001, Marcus Heidmann AIFB & Evaluation der Personennamen Personennamen

November 2001, Marcus Heidmann AIFB & Evaluation der Ortsbezeichnungen Ortsbezeichnungen

November 2001, Marcus Heidmann AIFB & Eigennamenerkennung Weighted Finite State Automaton

November 2001, Marcus Heidmann AIFB & SmesMiner – Anfrageerstellung

November 2001, Marcus Heidmann AIFB & SmesMiner - Dokumentenansicht

November 2001, Marcus Heidmann AIFB & SmesMiner – Ontobroker Ansicht

November 2001, Marcus Heidmann AIFB & SmesMiner – Einschränkung der Ergebnisse

November 2001, Marcus Heidmann AIFB & SmesMiner – Index Server Ansicht