Die Bedeutung von Ontologien für die Integration medizinischer Daten

Slides:



Advertisements
Ähnliche Präsentationen
Unterstützen Klinikinformationssysteme Forschung und Lehre ?
Advertisements

16. Juni 2006 Stefan Ukena Burstein und McDermott: Ontology Translation for Interoperability Among Semantic Web Services Hamburg, 16. Juni 2006.
CIDOC-CRM Universität zu Köln Historisch-kulturwissenschaftliche Informationsverarbeitung AM 2 Dozent: Prof. Dr. Manfred Thaller Referent: Nelson Marambio.
Jan Fienhold1 Institut für Informatik Betriebliche Informationssysteme OWL Web Ontology Language.
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Spatial Decision Support Systems (SDSS)
Metadaten als Bausteine des Semantic Web META-LIB Workshop 22
Telematikplattform für Medizinische Forschungsnetze (TMF) e.V. Clinical Metadata Repository 4th German CDISC User Group Berlin, Thursday, 19 February 2009.
Arbeitsgruppe Medizinische Informatik Stefan Schulz.
Context-awareness Andreas Bossard, Matthias Hert.
© Copyright SEMCARE Consortium Kurzpräsentation für Vollversammlung MUG-IMI, Stefan Schulz, Markus Kreuzthaler Semantic Data Platform.
Systementwurf Dipl.-Inform. Med. Anton Brass Helmholtz Zentrum München IBMI München,
Semantic Interoperability for Health Network of Excellence 7. März 2012 Stefan Schulz, Catalina Martínez-Costa Institut für Medizinische Informatik, Statistik.
IBMI - Medis Meeting ByMedConnect AP2 Anwendungsszenarien und Datenelemente - Datensatz Neuherberg,
AP3 – Informationsmodell ByMedConnect Archetypen Hans Demski Helmholtz Zentrum München Arbeitsgruppe MEDIS Institut für Medizinsche und Biologische Bildgebung.
Semantic Web.
Standortbestimmung und Perspektiven der Medizinischen Informatik als Wissenschaftliche Disziplin Stefan Schulz Arbeitsgruppe Medizinische Informatik.
Synergien zwischen Bioinformatik und Medizinischer Informatik ?
Erstellung einer Roadmap für Profilbereiche der RWTH Aachen Video 3: Ressourcensicht und Ableiten von Fokusthemen.
VWA – die erste Säule der NRP PH Die VWA Schriftliche Arbeit Präsentation Diskussion.
E-Learning und Diversity Volker Mattick, IT & Medien Centrum, TU Dortmund AMH – Frühjahrstagung 2011, , Gießen.
- DRUGS KNOW HOW AlkoholCannabisEcstasyNikotin
Schreibwerkstatt. Anfrage Sehr geehrte Damen und Herren, für unsere Anlage benötigen wir ein Molekularsieb mit der Oberfläche von 600 m2/g. Deshalb bitten.
Ralf Möller, Institut für Informationssysteme, Universität zu Lübeck 1.
"Pat. mit rez. HWI und VUR" Die Herausforderung medizinischer Terminologie und Semantik Stefan Schulz, Institut für Medizinische Informatik, Statistik.
Gewusst wie - Literatur suchen und finden in der Unibibliothek
Aufgabe 1.
Objective C Universität zu Köln
Herzlich Willkommen zur
Ausgangssituation Megatrends der Gesundheitswirtschaft 4.0
Metadaten als Grundlage der MDI-DE
Geschlechtsaspekte bei Substanzgebrauchsstörungen
Optionswert und Klimapolitik
Qualität in der Lehrausbildung aus Sicht des ÖGB Alexander Prischl 23
Vorstellung der geplanten Projekte
Diskussion / Schlussfolgerung
Objective C Universität zu Köln
Agenda 1. Wo waren wir stehen geblieben. 2. Vorstellungsrunde 3
Bei dieser Präsentation wird sicher eine Diskussion mit dem Publikum entstehen, die zu Aktionsschritten führt. Verwenden Sie PowerPoint, um diese Aktionsschritte.
Die Bedeutung der Bindungstheorie für die Prävention psychischer Störung Carolin Zeugke Fachärztin für Kinder- und Jugendpsychiatrie und – psychotherapie.
Studiengang International Business
“<Titel>” Prozessbeschreibung
Mastercurriculum Biomedical Engineering
Teil A S Grundsätze Standards als allgemein verbindlicher Maßstab in heterogene Lerngruppen • lernprozessbegleitende Diagnostik,
Basiskurs Medienbildung Orientierungsstufe
Ontologien als Standards
Austrian Partnership Programme in Higher Education and Research for Development - appear
Niederschwelliges Vernetzungstreffen Österreich
Die abschließende Arbeit
7th German CDISC User Group Basel, 11. März 2010
Wozu SNOMED CT zur Datenintegration in MIRACUM?
Interface-Terminologien und Referenzterminologien Stefan Schulz Medizinische Universität Graz Josef Ingenerf Universität zu Lübeck.
Projektkurse.
Wo kann die Medizininformatik heute den Arzt bereits im Alltag unterstützen? Wie muss Dokumentation dafür gestaltet sein? Dr. Holger Storf, Medical.
Kurzeinführung in die Vorgehensweise
Stefan Schulz Medizinische Universität Graz purl.org/steschu
PI Infrastruktur in der Max-Planck-Gesellschaft
GO FAIR-Workshop: “GO BUILD - GO TRAIN - GO CHANGE”
Fachbereich Gesundheitsberufe Marc Bieri
Ausgewählte Folien für Lehreinheit C3
Projektvorschlag für ISO 9001:2008-Implementierung
Schätzmethoden: CoCoMo und FPA
Geschlechteraspekte bei Essstörungen
Fundus der BVB der Stadt Nürnberg Siegbert Rudolph
Präsentation Projektmanagment „V – MODELL“
POLITIKWISSENSCHAFT, SOZIOLOGIE und WIRTSCHAFTSWISSENSCHAFT
 Präsentation transkript:

Die Bedeutung von Ontologien für die Integration medizinischer Daten Stefan Schulz Medizinische Universität Graz stefan.schulz@medunigraz.at

FAIR - Prinzipien Wilkinson, Mark D., et al. "The FAIR Guiding Principles for scientific data management and stewardship." Scientific data 3 (2016): 160018.

FAIR - Prinzipien Manifest für die nachhaltige Nutzung von Objekten wissenschaft-licher Forschung (Daten, Workflows, Algorithmen) durch menschliche und maschinelle Agenten. F – Findable – Anreicherung wissenschaftlicher Daten mit Metadaten zur besseren Recherche A – Accessible – Erleichterung des Datenzugriffs durch wohldefinierte Benutzerrechte I – Interoperable – Verwendung international kompatibler Standards für semantische Annotationen und Metadaten R – Reusable –Wiederverwertbarkeit von semantischen Annotationen und Metadaten, um Daten verlässlich für andere Zwecke zu verwenden, incl. Kontext und Datenherkunft Wilkinson, Mark D., et al. "The FAIR Guiding Principles for scientific data management and stewardship." Scientific data 3 (2016): 160018.

FAIR vs. MI-I Datenintegrationszentrum

Herausforderung Datenintegration / Datensemantik Klinische Routinedaten Heterogenität: Formate (Text !), Kontexte, Herkunft, Qualität. Verwendungszweck: Dokumentation / Kommunikation, Abrechnung, Qualitätssicherung, nicht Wissenschaft Annotation mit semantisch präzisen Metadaten Kohortenbildung für wissenschaftliche Studien Datenanalyse, prädiktive Modelle Entscheidungsunterstützung (Versorgung, BI) Standardisierte semantische Ressourcen Terminologien, Ontologien, Informationsmodelle

Architektur CBmed – IICCAB Ontologies Terminologies IICCAB: Innovative Use of Information for Clinical Care and Biomarker Research: http://goo.gl/wHMedz

Architektur CBmed – IICCAB FAIR Clinical data prioritization / visualization Clinical decision support Business analytics / Prediction Cohort builder Electronic Health Record Systems FAIR FAIR Staging Area Clinical Data Warehouse CDW Medical Research Insights (MRI) Structured data Lab, Admin, QM, Registries des Magens als auch des Duodenums reichlich zähflüssiger Schleim, sangoinolent; die Schleimhaut ist insgesamt livide. Anhängend ein 7,5 x 4 x 1,5 cm großes Pankreaskopfsegment sowie ein 4 cm langer derber und bis 2,5 cm durchmessender knotiger Gewebsstrang, der an seinem Ende eine Fadenmarkierung aufweist. Hier auf lamellierenden, teilweise nodulär Connected Health Platform Semantic Enrichment Unstructured data (text) Text Mining De-Identification Ontologies Terminologies FAIR IICCAB: Innovative Use of Information for Clinical Care and Biomarker Research: http://goo.gl/wHMedz

Beispiel Datenintegration / Datensemantik: "Drogenmissbrauch bei Jugendlichen" Ich fange mit einem Beispiel an: "Drogenmissbrauch bei Jugendlichen"

Beispiel Datenintegration / Datensemantik: "Drogenmissbrauch bei Jugendlichen" Ich fange mit einem Beispiel an: "Drogenmissbrauch bei Jugendlichen"

Fragestellung: "Drogenmissbrauch bei Jugendlichen" Bildung prospektiver Kohorten Identifikation von Risikogruppen Monitoring von Interventionsmaßnahmen erfordert z.B. Datensammlung mittels Erhebungsbögen Analyse bestehender klinischer Daten Recherche in Fachliteratur Dieses in medizinischer Versorgung und Forschung überaus wichtige Thema spielt eine Rolle bei der Bildung entsprechender Kohorten, Identifikation von Risikogruppen, Monitoring von Maßnahmen, z.B. durch das Sammeln von Daten und die retrospektive Analyse von Daten, aber auch für Recherche in Fachliteratur.

Abgrenzungsproblem: "Drogenmissbrauch bei Jugendlichen" Name Azra Benjamin Chiara Alter 13 17 18 Droge MDMA (Ecstasy) Alkohol Nikotin Form Pillen (~ 100 mg) Pils (Bitburger) (~5.5 Vol.%) Zigaretten Marlboro Häufigkeit 2-3 Stück /Party 2 mal / Monat 2 * 0.5 Liter / Woche 1 - 2 Schachteln/Tag Ich beginne mit einer kleinen Übung : Hier sind drei junge Mannheimer. Azra nimmt ab und zu auf Partys Ecstasy, Benjamin trinkt pro Woche 2 Flaschen Bier und Chiara ist eine starke Raucherin. Die Frage an Sie: Bei welcher Person ist der Sachverhalt „Drogenmissbrauch bei Jugendlichen“ erfüllt? Warum ist ein Konsens schwierig? (Definitionen – Welche Begriffe müssen definiert werden?) Bei wem ist der Sachverhalt erfüllt?

Definition: "Jugendlicher" SNOMED CT undefiniert NCI Thesaurus 12 – 21 Jahre Pschyrembel zwischen  Pubertät und Erwachsenenalter (…) Duden (Rechtssprache) 14 – 18 Jahre WHO 10 – 19 Jahre Warum ist diese Frage schwer zu beantworten? Es gibt keine klaren Definitionen. Je nach Quelle sind die Altersgrenzen für „Jugendliche“ unterschiedlich, oder man verzichtet ganz auf eine Definition

Definition: "Droge" SNOMED CT "Illegal drug" "Psychoactive substance" NCI Thesaurus "Recreational Drugs": A drug used for personal enjoyment rather than for medicinal purposes Pschyrembel (…) psychotrope Substanzen, deren Besitz nach BTmG entweder verboten ist oder die in einer nicht bestimmungsgemäßen Form verwendet werden Duden Rauschgift Noch schwieriger ist es bei der Definition von Droge. In gängigen Definitionen kommen leicht zwei unterschiedliche Gesichtspunkte zum Tragen, nämlich die Wirkung einer Substanz auf die Psyche und die strafrechtliche Relevanz des Gebrauchs einer Substanz.

Definition: "Drogenmissbrauch" SNOMED CT PsychoactiveSubstanceAbuse   SubstanceAbuse  CausativeAgent.PsychoactiveSubstance NCI Thesaurus "Drug abuse": The use of a drug for a reason other than which it was intended (…). ICD-10 Psychische und Verhaltensstörungen durch psychotrope Substanzen – Schädlicher Gebrauch Pschyrembel (verweist auf ICD 10) Duden Missbrauch (übermäßiger Gebrauch; Abusus) von Drogen Und ebenso unklar ist die Definition von „Missbrauch“. Hier geht es teils um schädlichen Gebrauch, teils um unsachgemäßen Gebrauch von Substanzen im weitesten Sinne. Was also fehlt, sind präzise, international kompatible Definitionen. Präzision ist zunehmend ein Thema in der Medizin, siehe z.B. das Schlagwort "Precision Medicine" Frage an das Publikum: in welchem Bereich (außerhalb der Medizin) sind solche standardisierten Definitionen seit langem etabliert? Präzise, international kompatible Definitionen?

Industriestandards Name Euro-Flachstecker Steckdose (Brasilien) Code CEE 7/16 NBR 14136 Quelle IECEE (Europa) NBR (Brasilien) maximale Spannung 230 V AC 127 V / 220 V maximaler Strom 16 A 10 A Stifte / Löcher: Durchmesser 4 mm 4.8 mm (Schutzkontakt + 3mm) Stifte / Löcher: Abstand 17,5 mm Stifte: Länge 19 mm Vertiefung 10 mm Kontur Sechseck: (35,3 mm, 13.7 mm) Sechseck: 35,5 mm, 17mm Bei Industriestandards! Im Grunde sind Industriestandards eine Form von Ontologien, man nennt sie nur nicht so.

Industriestandards Name Euro-Flachstecker Steckdose (Brasilien) Code CEE 7/16 NBR 14136 Quelle IECEE (Europa) NBR (Brasilien) maximale Spannung 230 V AC 127 V / 220 V maximaler Strom 16 A 10 A Stifte / Löcher: Durchmesser 4 mm 4.8 mm (Schutzkontakt + 3mm) Stifte / Löcher: Abstand 17,5 mm Stifte: Länge 19 mm Vertiefung 10 mm Kontur Sechseck: (35,3 mm, 13.7 mm) Sechseck: 35,5 mm, 17mm Hier ein Beispiel aus der Elektrotechnik. Alle funktionsrelevanten Eigenschaften sind präzise definiert, so nicht nur Maximalspannung und Strom, sondern auch Abstand, Länge und Form der Kontakte, oder auch Form und Dimension des Sockels und der Vertiefung. Aus solchen Definitionen können sie im Voraus ableiten, dass Sie ihr Ladegerät mit Eurostecker in Brasilien, aber z.B. nicht in den USA benutzen können.

Ontologien als "begriffliche" Standards Name Person between 14 and (less than) 18 Years Code 133937008 Quelle SNOMED CT Oberklasse Person Min. Alter 14,000 Jahre Max. Alter 17,999 Jahre Interface-Terminologie (DE): Jugendlicher Teenager Adoleszent Heranwachsender Interface-Terminologie (DE): Psychoaktive Substanz Rauschgift Rauschmittel Droge Name Psychoactive substance Code 418149003 Quelle SNOMED CT Oberklasse Substance Definition Alkohol OR Nikotin OR Morphin OR Benzodiazepine OR Amphetamine OR LSD OR Cannabis OR …. Was heißt das nun für medizinische Ontologien? Im Grunde sind gute und präzise Standards nichts anderes als Ontologien Es heißt, dass für alle relevanten Gegenstände, also Objekte, Prozesse, Eigenschaften präzise Definitionen zu fordern sind. Solche Definitionen legen die Kriterien fest, um eine bestimmte Substanz als Droge oder eine bestimmtes Lebensalter als „Jugendalter“ zu klassifizieren.

Ontologien als "begriffliche" Standards Name Ethanol abuse Nicotin abuse MDMA abuse Code 15167005 724697004 724703003 Quelle SNOMED CT Oberklasse Psychoactive substance abuse  Substanz Ethanol Nicotin MDMA Grenzwert 20 30 ? Einheit g / Tag g / kg KG / Tag Schwieriger ist sicherlich die Definition von „Missbrauch“. Hier müssen für die einzelnen Substanzen Grenzwerte festgelegt werden und der globale Begriff „Drogenmissbrauch“ dann aus diesen Einzeldefinitionen zusammengesetzt werden. Interface-Terminologie (DE): Drogenmissbrauch Drogenabusus Substanzabusus Name Psychoactive substance abuse Code 91388009 Quelle SNOMED CT Oberklasse Substance abuse Definition Ethanol abuse OR Nicotin abuse OR MDMA abuse OR … OR…

Warum Ontologien in medizinischer Versorgung und Forschung? Technische Standards: Präzise Beschreibung von technischen Artefakten und Zuordnung zu Kategorien Sicherheit, Vergleichbarkeit, technische Kompatibilität, Austauschbarkeit von Komponenten Medizinische Ontologien Präzise Beschreibung von biologischen Gegenständen (Objekte, Prozesse, Eigenschaften) und deren Zuordnung zu Kategorien Patientensicherheit, Vergleichbarkeit, Datenintegration (FAIR) Überwindung der Unschärfe qualitativer verbaler Beschreibungen Mapping zu (häufig mehrdeutigen) lokalen Interface-Termen Tendenz: SNOMED CT, LOINC (Ontologien), HL7 (Informationsmodelle) Ich schließe ab: Präzise Ontologien sind in einer zunehmend mit dem Attribut „Precision“ versehenen Medizin ebenso wichtig wie technische Standards in der Elektrotechnik. Sie erlauben die eindeutige Zuordnung von Einzelobjekten, Prozessen und deren Merkmale zu definierten Kategorien oder Klassen. Erst dadurch werden die Unschärfe verbaler Beschreibungen und daraus folgende Fehlinterpretationen vermieden.

Eigene Arbeiten zu biomedizinischen Ontologien / semantischen Ressourcen 1997 Überleitungstabelle ICD-9 / ICD-10 (DIMDI) Ontologie gastrointestinaler Phänomene als LOOM-KB (DFG - MedSynDiKATe) Multilingualer medizinischer Subword-Thesaurus (DE, EN, ES, PT) (DFG: KoMoDoRe, Kooperationsprojekte DLR-IB) Semantische Repräsentation von Arzneiinformation (EU - PILLS) Multilinguales Medizinlexikon (EU – SemanticMining NoE) Gene Regulation Ontology (EU - BOOTStrep) DebugIT Core Ontology (EU - DebugIT) BioTop Upper Level Ontology (EU - @NEURIST, DFG - GoodOD) Validierung OBO Foundry Ontologies (DFG - GoodOD) Erstellung und Validierung von "Ontology Good Practice" – Kriterien (DFG - GoodOD): Standardentwicklung SNOMED CT (IHTSDO) Harmonisierung SNOMED CT – ICD11 (WHO - IHTSDO) OWL-DL - Version der Upper-Level-Ontologie Basic Formal Ontology V.2 Harmonisierung Ontologien – klinische Informationsmodelle (EU - SemanticHealthNet) Validierung SNOMED CT für klinischen Informationsaustausch (EU- ASSESS CT) Wissensakquisition aus MEDLINE-Metadaten (FWF - BMFACTS) Deutsche Interface-Terminologie für SNOMED CT (EU SEMCARE) Informationsmodellierung und SNOMED-Annotationen von Kliniktexten via NLP (FFG, SAP) Ontologie-Rekonstruktion / Dekonstruktion (EU-COST-GREEKC) Semantische Ressourcen für Datenintegration Schlaganfall (EU – PRECISE4Q) Fragen ? 2018