Biomedizinische Ontologie

Slides:



Advertisements
Ähnliche Präsentationen
Ontology Tools II Jan Polowinski
Advertisements

Inhalt Saarbrücken,.
Protégé für Fortgeschrittene nach dem Pizza-Tutorial
Hauptseminar "Modellierung und das Semantische Web" - Kai-Uwe Gärtner, 1 Ontology Tools I Ein Überblick.
Idee und Realisierung des Internet der Zukunft
Vorstellung der Diplomarbeit
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Semantic Integration Carola Eschenbach, Özgür Özçep Universität Hamburg, FB Informatik AB Wissens- und Sprachverarbeitung (WSV) Sommersemester 2006.
DEPARTMENT FÜR INFORMATIK
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Java: Grundlagen der Sprache
Hochschule Merseburg, FB IKS
CIDOC-CRM Universität zu Köln Historisch-kulturwissenschaftliche Informationsverarbeitung AM 2 Dozent: Prof. Dr. Manfred Thaller Referent: Nelson Marambio.
Die Bestandteile des Semantic Web. Sematic Web soll das WWW erweitern und nicht neuerfinden Informationen sollen Maschinenlesbar sein Schemata beschreiben.
Beschreibung von Web Services Seminar Parallele und Verteilte Systeme
Jan Fienhold1 Institut für Informatik Betriebliche Informationssysteme OWL Web Ontology Language.
Ontologie(n) Ein Vortrag von Sven Liekenbrock
Stefan Schulz, Susanne Hanser, Rüdiger Klar
GMDS-Jahrestagung 2005, Freiburg Mittwoch, 14. September 2005
Explizite und editierbare Metainformationen für Software Muster.
GALEN Claudia Bärthel Inhalt Was ist GALEN? –Entwicklung –Komponenten Top Level Ontologie –Category Ontologie –Attribute Ontologie.
OWL-Web Ontology Language Eine Einführung
XML / RDF / OWL in Protégé Aufbau · OWL · Code · Demo · Ausblick
Diskussion Fundamentalkategorien nach Aristoteles Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2005/06 Diskusion Fundamentalkategorien.
Informationsarchitektur Beschreiben und Benennen
OWL-Web Ontology Language Eine Einführung
Fortgeschrittene Methoden der Wissensorganisation
RDF-Schema Seminar: „Semantic Web“ André Rosin,
Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Vorlesung: Einführung in der Bioinformatik
Data Documentation Initiative (DDI)
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
Biologische Datenbanken
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Arbeitsgruppe Dokumentenrepositorium Integration von Open Data Universitätsbibliothek.
Metadaten als Bausteine des Semantic Web META-LIB Workshop 22
INSTITUT FÜR DATENTECHNIK UND KOMMUNIKATIONS- NETZE 1 Harald Schrom ViEWcon08.
Semantic Web Services - An Introduction
Ontologien im Wissensmanagement
GI-Technologien zur Umsetzung der EU-Wasserrahmenrichtlinie (WRRL): Wissensbasen Teil 1: Einführung: Wissensbasis und Ontologie Reiner Borchert.
6. Medizinische Terminologien und Ontologien
Sesame Florian Mayrhuber
WebML for Semantic Web Michael Hertel.
Kathrin Grummich1, Katrin Jensen2 Christoph M Seiler1 Markus K Diener1
Arbeitsgruppe Medizinische Informatik Stefan Schulz.
Struktur von RDF Fabian Scheller.
Feedback from WWW )18-22 mai )sheraton hotel and towers congress center, new york city, USA 3)keine teilnehmerliste, meine schätzung: ca.
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
Wiss-Stadt Zentrum der Medizinischen Informatik, Klinikum der J.W.Goethe-Universität, © W.Giere 2001 Patient, Arzt und Wissenschaft Neue Möglichkeiten.
Semantic Interoperability for Health Network of Excellence 7. März 2012 Stefan Schulz, Catalina Martínez-Costa Institut für Medizinische Informatik, Statistik.
Fachdidaktik Englisch III – Classroom Management & ICT – Institut für Erziehungswissenschaft Abteilung Lehrerinnen- und Lehrerbildung Maturitätsschulen.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
IBMI - Medis Meeting ByMedConnect AP2 Anwendungsszenarien und Datenelemente - Datensatz Neuherberg,
Typische Fehler bei der Ontologie-Entwicklung
Entwicklungsstand von SNOMED CT Internationale Anwendungen
Seminar: Neue Ansätze der Künstlichen Intelligenz Seite 1Ulf Schneider02. Juli 2002 Ulf Schneider Neue Ansätze der Künstlichen Intelligenz: OIL Ontology.
„Wenn du den Fluss Halys überschreitest, wirst du
V11B SBML und Modell- Erstellung 22. Januar 2015.
Lexit.at Michael Hausenblas Semantische Darstellung und Abfrage von Rechtsnormen – IRIS 2004 Semantische Darstellung und Abfrage von Rechtsnormen am Beispiel.
FTS usage at GridKa Forschungszentrum Karlsruhe GmbH
Standortbestimmung und Perspektiven der Medizinischen Informatik als Wissenschaftliche Disziplin Stefan Schulz Arbeitsgruppe Medizinische Informatik.
Rules of Play - Game Design Fundamentals by Katie Salen and Eric Zimmerman Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung.
Beschreibungslogiken als Basis von OWL Institut für Informatik Betriebliche Informationssysteme Seminar: Semantic Web Services and Interfaces1 Beschreibungslogiken.
Institut für Informatik Betriebliche Informationssysteme S.Dietzold, T.Riechert, J.Lehmann, A.Aslam, M.Herrmann1 Semantic Web Services and Interfaces Sebastian.
Comprehensive Information Base (CIB) – ein Prototyp zur semantischen Datenintegration Stefan Arts
Pizza mit Schlagobers? Ontologien und nachhaltiges Wissensmanagement Stefan Schulz Institut für Medizinische Informatik, Statistik.
Integration of Medical data
Integrating Knowledge Discovery into Knowledge Management
 Präsentation transkript:

Biomedizinische Ontologie Stefan Schulz Institut für Medizinische Informatik, Statistik und Dokumentation Medizinische Universität Graz

Informationen im Behandlungsprozess 1812 2012 1550 v.Chr.

Datenexplosion in der biomedizinischen Forschung

Datenexplosion in der biomedizinischen Forschung Neue Generation von Gen-Sequenzern generiert 500 GB Daten pro Stunde (entspricht 1.000.000.000.000 Zeichen) PubMed-Literaturdatenbank: 21.763.549 Einträge ein wiss. Aufsatz pro Minute UNIPROT – Proteindatenbank 21.552.793 Proteine aus 7.048.241.206 Aminosäuren Quellen: http://web.expasy.org/docs/relnotes/relstat.html http://www.nlm.nih.gov/bsd/revup http://www.scientificcomputing.com/uploadedFiles/PDFs/White%20Papers/OcarinaLifeSciences.pdf

Großteil des Informationsvolumens als (computerlesbarer Text) Individuelles Faktenwissen Generalisiertes Regelwissen

Performanz der Informationsverarbeitung

Performanz der Informationsverarbeitung Verdoppelung in 9 Monaten Verdoppelung in 18 Monaten Verdoppelung in 12 Monaten 2 hoch Anzahl Personen Abbildung: Andreas Holzinger, Med. Univ. Graz

Menschliche Performanz 10.000 v.Chr 1950 2010

Mensch-Computer-Symbiose

Semantische Interoperabilität zwischen menschlichen und maschinellen Agenten Kranken- versorgung Daten Daten Gesundheits- wesen Bürger Daten Daten Wissenschaft

Standardisierte Sprache? Kranken- versorgung Daten Daten Bla Bla Gesundheits- wesen Bürger Daten Daten Wissenschaft

Standardisierte Sprache? Wozu? Dokumentenrecherche Informationsrecherche Wissensextraktion, Data Mining Question Answering Entscheidungsunterstützung in der Medizin Statistische Auswertungen Automatische Zusammenfassung von Forschungsdaten Qualitätssicherung in Medizin und Wissenschaft Leistungsabrechnung in der medizinischen Versorgung

Standardisierte Terminologien (> 100) im UMLS (Unified Medical Language System) International Classification of Primary Care International Classification of Primary Care 2nd Edition International Statistical Classification of Diseases and Related Health Problems JAMAS Japanese Medical Thesaurus (JJMT) Library of Congress Subject Headings LOINC 2.15 Master Drug Data Base McMaster University Epidemiology Terms Medical Dictionary for Regulatory Activities Terminology (MedDRA) Medical Entities Dictionary Medical Subject Headings MEDLINE (1996-2000) MEDLINE (2001-2006) MedlinePlus Health Topics_2004_08_14 Micromedex DRUGDEX Multum MediSource Lexicon NANDA nursing diagnoses: definitions & classification National Drug Data File Plus Source Vocabulary National Drug File - Reference Terminology National Library of Medicine Medline Data NCBI Taxonomy AI/RHEUM Alcohol and Other Drug Thesaurus Alternative Billing Concepts Beth Israel Vocabulary Canonical Clinical Problem Statement System Clinical Classifications Software Clinical Terms Version 3 (CTV3) (Read Codes) Common Terminology Criteria for Adverse Events COSTAR COSTART CRISP Thesaurus Current Dental Terminology 2005 (CDT-5) Current Procedural Terminology Diseases Database DSM-III-R DSM-IV DXplain Gene Ontology HCPCS Version of Current Dental Terminology 2005 (CDT-5) HCPCS Version of Current Procedural Terminology (CPT) Healthcare Common Procedure Coding System HL7 Vocabulary Version 2.5 HL7 Vocabulary Version 3.0 Home Health Care Classification HUGO Gene Nomenclature ICD10 ICD-9-CM ICPC ICPC2 - ICD10 Thesaurus ICPC2-ICD10 Thesaurus NCI SEER ICD Neoplasm Code Mappings NCI Thesaurus Neuronames Brain Hierarchy Nursing Interventions Classification Nursing Outcomes Classification Omaha System Online Congenital Multiple Anomaly/Mental Retardation Syndromes Online Mendelian Inheritance in Man Patient Care Data Set Perioperative Nursing Data Set Pharmacy Practice Activity Classification Physician Data Query Physicians' Current Procedural Terminology Quick Medical Reference (QMR) Read thesaurus Read thesaurus Americanized Synthesized Terms RXNORM Project SNOMED-2 SNOMED Clinical Terms SNOMED International Standard Product Nomenclature Thesaurus of Psychological Index Terms The Universal Medical Device Nomenclature System (UMDNS) UltraSTAR UMLS Metathesaurus University of Washington Digital Anatomist USP Model Guidelines Veterans Health Administration National Drug File WHO Adverse Reaction Terminology WHOART

Charakteristika der meisten biomedizinischen Terminologiesysteme Bedeutungseinheiten („Konzepte“) stehen für ein oder mehr synonyme Fachterme Bedeutungsrelationen verbinden die Bedeutungseinheiten in der Art eines semantischen Netzes „broader than“ / „narrower than“ „related to“ „part_of“ Implizite Kontexte Keine formale Semantik

Beispiel: Medical Subject Headings

Beispiel: Foundational Model of Anatomy

Beispiel: International Classification of Diseases (ICD 10) http://www.dimdi.de/static/de/klassi/diagnosen/icd10/htmlgm2012

Neuere Biomedizinische Terminologien Systematized Nomenclature of Medicine, Clinical Terms (SNOMED CT) NCI (Nat. Cancer Inst.) Thesaurus OBO (Open Biomedical Ontologies) Gene Ontology Chemical Entities of Biological Interest (ChEBI) Protein Ontology Phenotypic Quality

Neuere Biomedizinische Terminologien „Ontologie“: Schlagwort oder Paradigmenwechsel ?

„Ontologie“ in den Computerwissenschaften T. Gruber: „ontology: specification of a conceptualization“ Konsistente Menge logischer Axiome Formale Repräsentation von Domänenwissen („Jede Zelle hat eine Membran“) Termdefinitionen („Hepatitis  Entzündung mit Lokalisation Leber“) Zweckorientierte Repräsentation eines Diskursbereichs: „Deciding whether a particular concept is a class in an ontology or an individual instance depends on what the potential applications of the ontology are“ http://www-ksl.stanford.edu/kst/what-is-an-ontology.html http://www.ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-mcguinness-abstract.html

Beschreibungslogiken („Description Logics“) Entscheidbare Untermengen der Prädikatenlogik erster Stufe T-Box: Klassen, A-Box: Individuen Klassen sind Mengen von Individuen Relationen sind Mengen von Individuenpaaren FOL: x: instanceOf (x, Hepatitis)  instanceOf(x, Inflammation)  y: instanceOf(y, Liver)  hasLocation(x,y) DL: Hepatitis equivalentTo Inflammation and hasLocation some Liver http://dl.kr.org/ http://www.cambridge.org/gb/knowledge/isbn/item1174523/

Semantik der Beschreibungslogik ALC Franz Baader, Ian Horrocks, and Ulrike Sattler Chapter 3 Description Logics. In Frank van Harmelen, Vladimir Lifschitz, and Bruce Porter, editors, Handbook of Knowledge Representation. Elsevier, 2007.

Standardisierung der Beschreibungslogiken Web Ontology Language (OWL) Spezifikation des World Wide Web Consortiums (W3C) Basiert auf der RDF-Syntax (Semantic Web) OWL Sprachprofile: DL, EL, RL, QL Unterschiedliche Ausdrucksstärke Unterschiedliche Performanz http://www.w3.org/TR/owl2-overview/

Beschreibungslogiken: Werkzeuge Editoren: Protégé 4.2: (siehe Demo) Reasoner Pellet HermIT Fact++ http://www.w3.org/TR/owl2-overview/

Biomedizinische Ontologien 2000 - 2012 Medizin, Biologie: Inhalte,Terme Informatik: Sprachen, Werkzeuge Philosophie ??

Positionen der Angewandten Ontologie Angewandte Ontologie: wendet philosophische Ideen und Methoden aus der Ontologie an, um Ergebnisse der wissenschaftlichen Forschung aufzubereiten Aristotelischer Realismus, Abgrenzung von Descartes und Kant, Konstruktivismus und Postmoderne Ontologischer Perspektivismus: verschiedene Sichtweisen auf die eine Realität (z.B. Granularität) Vermittlung zwischen Medizinern / Biologen und Informatikern / Logikern: Aristotelische Definitionen (Definitio fit per genus proximum et differentiam specificam) abbildbar in Beschreibungslogiken Kritik an bestehenden Terminologiesystemen Upper Level Ontologies Nicola Guarino Trient, Italien Barry Smith Buffalo, USA

Upper-level Ontologien Vorgegebenes System von sich gegenseitig ausschließenden Kategorien Relationen und Axiome Gewollt: starke Einschränkung des Freiraums bei der Erstellung von Domänenontologien Typischer Produktionszyklus bei der Erstellung von Domänenontologien als Erweiterung von Upper-level Ontologien: Erstellung neuer Axiome Klassifikation der Ontologie Identifikation von Inkonsistenzen Behebung von Inkonsistenzen

Upper-level Ontologien: Beispiel BFO 2 Upper-level Ontologien: Beispiel BFO 2.0 (Basic Formal Ontology, Prototyp) Klassen Relationen

Schwächen bestehender Terminologie-systeme unter ontologischer Analyse Instanzen statt Unterklassen „Insulin instanceOf Peptide“ Oberklassen statt Rollen Fish subClassOf Food Epistemische Überlagerung Infection of unknown origin subClassOf Infection Verborgene Ambiguität Tumor subClassOf Pathological Process Tumor subClassOf Pathological Body Part Verwechslung Funktion / Prozess ATP transport subClassOf Biological Function ATP transport subClassOf Biological Process Verwechslung Prozess / Plan Planned Tonsillectomy subClassOf Tonsillectomy Verwechslung materielles Objekt / Informationsobjekt Thorax XRay subClassOf hasPart some Heart

Kontroversen: Adäquatheit des ontologischen Realismus Entsprechen alle relevanten biomedizinischen Terme Instanzen von Universalien? Sind Universalien überhaupt relevant? „Nicht insulinabhängiger Diabetes mellitus“? Ist der Universalienbegriff kompatibel mit der kontinuierlichen Beschaffenheit biologischer Objekte? Nicht referenzierende Terme in wissenschaftlichem Diskurs „forecast of solar cosmic rays radiation risk during a manned Mars mission”, “Experiments to determine whether the Higgs boson exists are currently being performed using the Large Hadron Collider (LHC) at CERN”. Epistemische Aspekte in klinischer Dokumentation „Verdachtsdiagnose Lungenembolie“, „möglicherweise bösartiger Tumor“, „Patient wurde auf Meningitis behandelt“, „erhöhtes Melanomrisiko“, „Blutgruppe unbekannt“ Upper-Level-Ontologien ignorieren Pluralismus von Weltbeschreibungen Semantic Web AAA slogan: „Anyone can say Anything about Any topic“

Ontologie-basierte medizinische Terminologiesysteme SNOMED CT: Internationaler terminologisch/ontologischer Standard für die gesamte Medizin, über 300.000 bedeutungstragende Einheiten („Konzepte“) Verwendung der Beschreibungslogik EL Langsame, aber stetige Inkorporierung ontologischer Prinzipien NCI Thesaurus: „Ontology-like vocabulary“ für die Tumorforschung, 34.000 Konzepte Batch-Konvertierung einer Thesaurusstruktur in Ontologiesprache OWL Unter DL-Semantik zahlreiche sachlich falsche Axiome: UreterSmallCellCarcinoma subclassOf DiseaseMayHaveFinding some Pain CalciumActivatedChlorideChannel2 subClassOf (GeneProductExpressedInTissue some Lung) and (GeneProductExpressedInTissue some MammaryGland) and (GeneProductExpressedInTissue some Trachea)

Ontologien in der Biologie: Pionier „Gene Ontology“ Part of (partonomy) Is a (taxonomy)

Weiterentwicklung zur OBO (Open biomedical Ontologies) Foundry Im Gegensatz zu medizinischen Ontologien kollaborative, arbeitsteilige „bottom up“ - Entwicklung Anknüpfend an den Erfolg der Gene Ontology Folgt Prinzip des Aristotelischen Realismus Eingebettet in BFO + RO (OBO Relation Ontology) Anspruch: orthogonale interoperable Referenzontologien Zunächst in OBO: proprietäre Syntax (mit teils unklarer Semantik) Zunehmend Einsatz von OWL-DL Smith, B.; Ashburner, M.; Rosse, C.; Bard, J.; Bug, W.; Ceusters, W.; Goldberg, L. J.; Eilbeck, K. et al. (2007). "The OBO Foundry: Coordinated evolution of ontologies to support biomedical data integration".Nature Biotechnology 25 (11): 1251–1255. doi:10.1038/nbt1346 33

OBO Foundry: Idealbild RELATION TO TIME GRANULARITY CONTINUANT OCCURRENT INDEPENDENT DEPENDENT ORGAN AND ORGANISM Organism (NCBI Taxonomy) Anatomical Entity (FMA, CARO) Organ Function (FMP, CPRO) Phenotypic Quality (PATO) Biological Process (GO) CELL AND CELLULAR COMPONENT Cell (CL) Cellular Component (FMA, GO) Cellular Function MOLECULE Molecule (ChEBI, SO, RnaO, PrO) Molecular Function Molecular Process 34

Anspruch und Wirklichkeit OBO Foundry - Prinzipien Einfache Subklassen-Hierarchien, multiple hierarchische Links werden inferiert. (Genus-species definitions) Realität: die meisten Ontologien haben bisher keine internen Äquivalenzaxiome “Cross products”: Definitionen über Einzelontologien hinweg: Calcitonin secreting cell (Cell Ontology) equivalentTo Secretory cell and secretes some Calcitonin (ChEBI) Heart development (Gene Ontology) equivalentTo Developmental process and hasParticipant some Heart (FMA) Bisher nur experimentell / teilautomatisch mit bekannten systematischen Fehlern 35

OBO Foundry Architektur Typische Axiome in Modulen A subclassOf B A subclassOf r some C Typische Axiome in “Cross Products” A equivalentTo r some D A equivalentTo (r some D) and (s some E) XP A OBO 2 OBO 1 XP F XP B XP C OBO 3 OBO 4 OBO 5 XP F XP D OBO OBO OBO OBO OBO XP E Mélanie Courtot, Frank Gibson, Allyson L. Lister, James Malone, Daniel Schober, Ryan R. Brinkman, and Alan Ruttenberg, MIREOT: The minimum information to reference an external ontology term. Applied Ontology, Vol. 6, Nr. 1 (2011) , p. 23-33 36

Ausblick: Biomedizinische Ontologien Ontology Engineering als Fachdisziplin in den Anfängen Keine allgemein akzeptierte „Good practice Guidelines“ Ontologiepflege viel aufwändiger als Terminologiepflege Bisher keine empirische Evidenz für die Überlegenheit philosophisch fundierter formaler Ontologien gegenüber nichtformalen Ansätzen Problem der Skalierbarkeit Ausdrucksarm aber performant ODER Ausdrucksstark und zu langsam

Offene Fragen zu Biomedizinischen Ontologien Verselbständigt sich die „Bottom-up“ – Methode, so dass qualitativ hochwertige interoperable Ontologien entstehen? Lässt sich die Erstellung hochwertiger Ontologien in einem Top-Down-Ansatz erreichen? Kann Konsens bezüglich einer Upper Level Ontology gefunden werden? Welches Potential besteht für die Verbesserung von Softwarewerkzeugen? Erreichen die Softwarewerkzeuge Industriestandard? Gibt es überzeugende Anwendungsfälle, die den Nutzen formaler Ontologie bestätigen? Hat „Applied Ontology“ das Potential, sich zur Ingenieursdisziplin auf philosophischer Grundlage weiter zu entwickeln ?

Weiterführende Literatur

Webseiten Description Logics: http://dl.kr.org/ Protégé: http://protege.stanford.edu/ Bioontologien: http://www.bioontology.ch/ Buffalo Ontology Site: http://ontology.buffalo.edu/smith/ OBO Foundry: http://obofoundry.org/ Bioportal: http://bioportal.bioontology.org/ SNOMED CT: http://www.ihtsdo.org/snomed-ct/ http://terminology.vetmed.vt.edu/sct/menu.cfm Eigene Website: http://purl.org/steschu ICBO FOIS 2012 (Graz): http://purl.org/icbofois2012