1 Projektverbund Ontoverse Kooperatives vernetztes Wissensmanagement im Bereich Life Sciences Christof Rumpf Heinrich-Heine-Universität Düsseldorf 23.06.2005.

Slides:



Advertisements
Ähnliche Präsentationen
Alexander Stuber & Partner
Advertisements

AUTOKURATIERUNG & AUSSENPOLITIK HANS BERNHARD Netznetz.net, Depot, 18. November 2005.
Cadastre for the 21st Century – The German Way
Service Oriented Architectures for Remote Instrumentation
PRESENTATION HEADLINE
interdisciplinary joint projects method-oriented platforms
Finding the Pattern You Need: The Design Pattern Intent Ontology
E-Solutions mySchoeller.com for Felix Schoeller Imaging
Energy Supply in the Region Ulm / Neu-Ulm
H - A - M - L - E - IC T Teachers Acting Patterns while Teaching with New Media in the Subjects German, Mathematics and Computer Science Prof. S. Blömeke,
AUTOKURATIERUNG & AUSSENPOLITIK HANS BERNHARD Netznetz.net, Depot, 18. November 2005.
Herzlich Willkommen zum Informations-Forum: SAP Interoperabilität
Die ZBW ist Mitglied der Leibniz-Gemeinschaft Copyright © ZBW 2010 Seite 1 Potenziale semantischer Technologien für die Bibliothek der Zukunft Klaus Tochtermann.
© 2006 Open Grid Forum OGF26 - Chapel Hill, May 2009 Addressing Metadata Challenges OGF Digital Repositories RG.
1 | R. Steinbrecher | IMK-IFU | KIT – die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH) Natural Sources SNAP11.
Modulare Aufbereitung von Lehr-/Lerninhalten Khaldoun Ateyeh Peter C. Lockemann Jutta Mülle Universität Karlsruhe.
Fakultät für informatik informatik 12 technische universität dortmund Optimizations Peter Marwedel TU Dortmund Informatik 12 Germany 2009/01/17 Graphics:
Peter Marwedel TU Dortmund, Informatik 12
Fakultät für informatik informatik 12 technische universität dortmund Hardware/Software Partitioning Peter Marwedel Informatik 12 TU Dortmund Germany Chapter.
Current Drug Prescribing Based on: Signs and symptoms Average response Consequence:Some respond others do not some have adverse events.
Das Integrierte EU-Projekt ORCHESTRA - Konzeption einer offenen Dienstearchitektur im Kontext der INSPIRE-Initiative Ulrich Bügel, Thomas Usländer, Fraunhofer.
Welcome DTD. Document Type Definition Graphic Services/Everything you already know about presentations Was ist eine DTD? DTD ist eine Schemasprache.
Parsing Prolog Aufbaukurs SS 2000 Heinrich-Heine-Universität Düsseldorf Christof Rumpf.
POST MARKET CLINICAL FOLLOW UP
Deutsche Gesellschaft für Technische Zusammenarbeit GmbH Integrated Experts as interface between technical cooperation and the private sector – An Example.
Methods Fuzzy- Logic enables the modeling of rule based knowledge by the use of fuzzy criteria instead of exact measurement values or threshold values.
virtPresenter „lecture recording framework“
Linguistically Motivated Information Retrieval
Kapitel 1 zweite Stufe.
M A X - P L A N C K - G E S E L L S C H A F T Bericht des Partnerinstituts Sabine Krott 1.0 Pilotentreffen im Harnack-Haus, 8. Juni 2006 Distribution:
5 Jahre Semantic Network Service (SNS) Aktueller Stand und Ausblick Maria Rüther, Thomas Bandholtz,
Laurie Clarcq The purpose of language, used in communication, is to create a picture in the mind and/or the heart of another.
Machen Sie sich schlau am Beispiel Schizophrenie.
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
Sanjay Patil Standards Architect – SAP AG April 2008
| DC-IAP/SVC3 | © Bosch Rexroth Pneumatics GmbH This document, as well as the data, specifications and other information set forth in.
A good view into the future Presented by Walter Henke BRIT/SLL Schweinfurt, 14. November 2006.
Centre for Public Administration Research E-Government for European Cities Thomas Prorok
BAS5SE | Fachhochschule Hagenberg | Daniel Khan | S SPR5 MVC Plugin Development SPR6P.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
Extrusion of nickel–titanium alloys Nitinol to hollow shapes
Deutsch 1 G Stunde. Donnerstag, der 25. Oktober 2012 Deutsch 1, G Stunde Heute ist ein B- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
Deutsch 1 G Stunde. Donnerstag, der 18. Oktober 2012 Deutsch 1, G Stunde Heute ist ein E- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
Deutsch 1 G Stunde. Unit: Introduction to German & Germany Objectives: Learn phrases about date, weather and time-telling Presentations about the federal.
Deutsch 1 G Stunde. Unit: Introduction to German & Germany Objectives: Learn phrases about date, weather and time-telling Some organization items: grades,
INTAKT- Interkulturelle Berufsfelderkundungen als ausbildungsbezogene Lerneinheiten in berufsqualifizierenden Auslandspraktika DE/10/LLP-LdV/TOI/
States in the development of a new service During the development a service will pass through a chain of stages determining the service.
Institut für Öffentliche Dienstleistungen und Tourismus Informal learning for regional development Manfred Walser Towards a Knowledge Society: Is Knowledge.
Verben Wiederholung Deutsch III Notizen.
Template v5 October 12, Copyright © Infor. All Rights Reserved.
Faculty of Public Health Department of Health Economics and Management University of Bielefeld WP 3.1 and WP 4.1: Macrocost EUprimecare Plenary Meeting.
Univ.-Lektor Dipl.-Ing. Dr. Markus Schranz staatlich befugter und beeideter Ingenieurkonsulent für Informatik Web Application Engineering & Content Management.
Einführung Bild und Erkenntnis Einige Probleme Fazit Eberhard Karls Universität Tübingen Philosophische Fakultät Institut für Medienwissenschaft Epistemic.
Ein Projekt des Technischen Jugendfreizeit- und Bildungsvereins (tjfbv) e.V. kommunizieren.de Blended Learning for people with disabilities.
The Generation of formal Annotations The Role of Information Extraction in MUMIS.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
AS Thema Die Schule.
Adjectiv Endungen Lite: Adjective following articles and pre-ceeding nouns. Colors and Clothes.
Wind Energy in Germany 2004 Ralf Christmann, BMU Joachim Kutscher, PTJ
Globale Plattform-Entwicklung für steigende Nachhaltigkeit
RZPD Deutsches Ressourcenzentrum für Genomforschung GmbH DESPRAD-Meeting 02/09/2003 Steffen Schulze-Kremer (until 7/2003) Bernd Drescher (since 8/2003)
KIT – die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH) Vorlesung Knowledge Discovery - Institut AIFB Tempus fugit Towards.
Component 4 Frankfurt (Oder) & Slubice Seite 1 COMPONENT 4: – in Frankfurt (Oder) & Slubice 1.All participants presented themselves.
The Automatic Generation of Formal Annotations in a MultiMedia Indexing and Searching Environment Thierry Declerck, Peter Wittenburg and Hamish Cunningham.
Anmerkungen: Schriftgröße Überschriften immer einheiltich 32. Text bei HR Check Up Präsentation 33, bei Akademie 44. Textfarbe unterschiedliche Blautöne.
KGE Kommunalgrund GmbH Entwicklungsträger der Landeshauptstadt Magdeburg Presentation for the REDIS Project at the Interim Conference.
Technische Universität München 1 CADUI' June FUNDP Namur G B I The FUSE-System: an Integrated User Interface Design Environment Frank Lonczewski.
TUM in CrossGrid Role and Contribution Fakultät für Informatik der Technischen Universität München Informatik X: Rechnertechnik und Rechnerorganisation.
An Approach to standardize a Service Life Cycle Management
Leonardo da Vinci Zukunftsbau GmbH European basic qualifications for building professions.
 Präsentation transkript:

1 Projektverbund Ontoverse Kooperatives vernetztes Wissensmanagement im Bereich Life Sciences Christof Rumpf Heinrich-Heine-Universität Düsseldorf

2 Antragsrahmen Projektantrag im BMBF-Förderschwerpunkt eScience und vernetztes Wissensmangement Antragszeitraum 3 Jahre Antragsvolumen 2,3 Mio (ca. 13 Arbeitsplätze + ca Sachmittel)

3 Projektpartner

4 Ziele Erstellen einer Ontologie für die biomedizinische Domäne durch Verschmelzung vorhandener Ontologien Erstellen eines Informationsextraktionssystems basierend auf der Ontologie Erweiterung der Ontologie –webbasiert durch Anwender (Wikipedia) –halbautomatisch bei der Informationsextraktion

5 Was heisst Ontologie? Erstes Vorkommen des Wortes Ontologie in: Jacob Lorhard (1606) Ogdoas Scholastica. Philosophie: Ontologie ist die Wissenschaft vom Sein; Zweig der Metaphysik. KI und Wissensrepräsentation: Ontologie als formale Theorie über Eigenschaften und Relationen abstrakter Entitäten (Konzepte) aus einer Sprache (Vokabular, inbes. Nomen).

6 Konzepthierarchien Ontologien sind hierarchische Ordnungen von Konzepten (Subsumption) primäre hierarchiebildende Relationen: –is_aOber- / Unterbegriff –part_of Teil- Ganzesbeziehungen sekundäre Relationen: –synonym, antonym, subset, definition, has_property, …

7 Beispiel: Gene Ontology (GO) Molecular Function 7,493 terms Biological Process 9,640 terms Cellular Component 1,634 terms Total 18,767 terms Definitions: 16,696 (93.9 %) Quelle: ftp://ftp.geneontology.org/pub/go/teaching_resources/presentations/ _Purdue_edimmer.ppt

8 Ausschnitt GO-Hierarchie rote Pfeile: part_of blaue Pfeile: is_a Quelle: ftp://ftp.geneontology.org/pub/go/teaching_resources/ presentations/ _Purdue_edimmer.ppt

9 GO Terme [Term] id: GO: name: mitochondrion inheritance namespace: biological_process def: "The distribution of mitochondria\, including the mitochondrial genome\, into daughter cells after mitosis or meiosis\, mediated by interactions between mitochondria and the cytoskeleton." [PMID: , PMID: , SGD:mcc] is_a: GO: ! organelle inheritance is_a: GO: ! mitochondrion distribution [Term] id: GO: name: mitochondrial genome maintenance namespace: biological_process def: "The maintenance of the structure and integrity of the mitochondrial genome." [GO:ai] is_a: GO: ! mitochondrion organization and biogenesis [Term] id: GO: name: reproduction alt_id: GO: namespace: biological_process def: "The production by an organism of new individuals that contain some portion of their genetic material inherited from that organism." [GO:curators, ISBN: ] subset: goslim_generic subset: goslim_plant subset: gosubset_prok is_a: GO: ! development

10 Nutzen von Ontologien Ontologien enthalten semantische Relationen zwischen Konzepten und damit Wissen über die Welt bzw. eine Domäne Ontologien können der Konsensbildung in der Wissenschaft dienen Ontologien unterstützen Information Retrieval und Informationsextraktion

11 Aufbau von Ontologien manuell: Experten definieren Konzepte und Relationen – sehr zeitaufwändig automatisch: durch maschinelles Lernen auf der Grundlage von Datenbanken oder Texten (Informationsextraktion)

12 Ontoverse In Ontoverse soll eine Ontologie für die biomedizinische Domäne auf drei Wegen entstehen: –Verschmelzen vorhandener Ontologien –webbasierte kooperative manuelle Erweiterung im Stil von Wikipedias – semantisches Wiki –halbautomatische Erweiterung durch auf der Ontologie basierende Informationsextraktion

13 Verschmelzen von Ontologien Die Architektur der Ontoverse-Ontologie muss alle Relationen und Attribute einer zu verschmelzenden Ontologie abbilden können. Beim Verschmelzen müssen vollständige und partielle Übernahme von Konzepten berücksichtigt werden. Inkonsistenzen zwischen Ontologien müssen mit Hilfe eines Logikvalidierers erkannt und (manuell) aufgelöst werden.

14 semantisches Wiki kooperatives Ontologiedesign webbasierte Benutzerschnittstelle graphisches Visualisierungstool Authentifizierung von Autoren mit Signatur Markierung von Änderungen in der Ontologie mit Signatur und Zeitstempel (Trustcenter)

15 Informationsextraktion (IE) Bei der IE geht es um die automatische Gewinnung von strukturierter Information (relationale Datensätze) aus unstrukturierter Information (Texten). Bei der IE müssen Texte maschinell gelesen und partiell verstanden werden. Das Ontoverse-IE-System stützt sich auf die Ontoverse-Ontologie und soll gleichzeitig zur überwachten Erweiterung der Ontologie dienen.

PARADIME: 16 Task Specific Template Filling, based on the TDL Model « Die Spannungen in Mostar nehmen am 1.Jan zu, nachdem kroatische Polizisten einen 18jährigen Moslem erschossen haben, der... » DomainLex: shoot=Fight-Lex Merge types and Fill template Templatse Hierarchy Phrases Hierarchy Grammatical Functions Hierarchy Linked Types Shallow Text Processor... process=shoot SC= subj=croatian Police obj=18 years old Muslim DatePP = {1/1/1996} LocPP = {Mostar} Lookup in Domain Lexicon Select a linking type process=1=shoot SC= subj=2=croatian Police obj=3=18 years old Muslim DatePP=4={1/1/1996} LocPP= 5={Mostar} action=1=shoot attacker=2=croatian Police templ= attacked=3=18 years old Mulsim date=4= 1/1/1996 loc=5= Mostar Quelle: Günter Neumann (DFKI)

17 Teilaufgaben der IE Auf den MUC-1-7 ( ) wurden Teilaufgaben der IE spezifiziert und mit precision und recall bewertet (MUC-7): –NE: Named Entity Task (95/92%) –CO: Coreference Task (69/56%) –TE: Template Element Task (87/86%) –TR: Template Relation Task (86/67%) –ST: Scenario-Template-Task (65/42%)

Source: Jakub Piskorski, Feiyu XuSommersemester 2001 Language Technology (ST) Scenario Template requires filling a template structure with extracted information involving several relations or events of interest intended to be the MUC approximation to a real-world information extraction problem identification of partners, products, profits and capitalization of joint ventures Generic IE tasks for MUC-7

19 Module eines IE-Systems Tokenizer (Text Tokens) Part-of-Speech-Tagger (Wortarten) Termerkennung (named entities) Koreferenzauflösung (nominal, pronominal) Merger für Objekt-Templates Dependenz-Parser (grammatische Funktionen) Merger für Szenario-Templates

PARADIME: 20 The systematic separation of the NLP and the modeling components, dealing with two types of knowledge (1) m The linguistic analysis tools comprise (1) a tokenizer, a morphological analyzer (incl. compound analysis) and a POS filter for the lexical processing, and (2) a fragment recognizer for Named Entities and generic phrases (NP, PP, Verbgroup). On the top of this (3) a dependency based parser computes a flat (partial) analysis of the text, enriched with information about grammatical functions. [ PN Die Siemens GmbH] [ V hat] [ year 1988][ NP einen Gewinn] [ PP von 150 Millionen DM], [ Comp weil] [ NP die Auftraege] [ PP im Vergleich] [ PP zum Vorjahr] [ Card um 13%] [ V gestiegen sind]. The siemens company has made a revenue of 150 million marks in 1988, since the orders increased by 13% compared to last year. hat Obj Gewinn weil steigen Auftrag PPs {1988, von(150M)} Subj Siemens {im(Vergleich), zum(Vorjahr), um(13%) } PPs SC Comp Quelle: Günter Neumann (DFKI)

PARADIME: 21 Translation into meaningful semantic relations Linguistics...Uppsala´s main church... Ontology Database Syntacic relations between Uppsala and church Location City Building Church hasBuilding hasChurch Uppsala Church-1 hasChurch Quelle: Günter Neumann (DFKI)

PARADIME: 22 Iterative Ontology Development Design core ontology Ontology to extract information Use linguistic information to enhance the ontology Core Ontology Ontology after interation Quelle: Günter Neumann (DFKI)