Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Die Bedeutung von Ontologien für die Integration medizinischer Daten

Ähnliche Präsentationen


Präsentation zum Thema: "Die Bedeutung von Ontologien für die Integration medizinischer Daten"—  Präsentation transkript:

1 Die Bedeutung von Ontologien für die Integration medizinischer Daten
Stefan Schulz Medizinische Universität Graz

2 FAIR - Prinzipien Wilkinson, Mark D., et al. "The FAIR Guiding Principles for scientific data management and stewardship." Scientific data 3 (2016):

3 FAIR - Prinzipien Manifest für die nachhaltige Nutzung von Objekten wissenschaft-licher Forschung (Daten, Workflows, Algorithmen) durch menschliche und maschinelle Agenten. F – Findable – Anreicherung wissenschaftlicher Daten mit Metadaten zur besseren Recherche A – Accessible – Erleichterung des Datenzugriffs durch wohldefinierte Benutzerrechte I – Interoperable – Verwendung international kompatibler Standards für semantische Annotationen und Metadaten R – Reusable –Wiederverwertbarkeit von semantischen Annotationen und Metadaten, um Daten verlässlich für andere Zwecke zu verwenden, incl. Kontext und Datenherkunft Wilkinson, Mark D., et al. "The FAIR Guiding Principles for scientific data management and stewardship." Scientific data 3 (2016):

4 FAIR vs. MI-I Datenintegrationszentrum

5 Herausforderung Datenintegration / Datensemantik
Klinische Routinedaten Heterogenität: Formate (Text !), Kontexte, Herkunft, Qualität. Verwendungszweck: Dokumentation / Kommunikation, Abrechnung, Qualitätssicherung, nicht Wissenschaft Annotation mit semantisch präzisen Metadaten Kohortenbildung für wissenschaftliche Studien Datenanalyse, prädiktive Modelle Entscheidungsunterstützung (Versorgung, BI) Standardisierte semantische Ressourcen Terminologien, Ontologien, Informationsmodelle

6 Architektur CBmed – IICCAB
Ontologies Terminologies IICCAB: Innovative Use of Information for Clinical Care and Biomarker Research:

7 Architektur CBmed – IICCAB
FAIR Clinical data prioritization / visualization Clinical decision support Business analytics / Prediction Cohort builder Electronic Health Record Systems FAIR FAIR Staging Area Clinical Data Warehouse CDW Medical Research Insights (MRI) Structured data Lab, Admin, QM, Registries des Magens als auch des Duodenums reichlich zähflüssiger Schleim, sangoinolent; die Schleimhaut ist insgesamt livide. Anhängend ein 7,5 x 4 x 1,5 cm großes Pankreaskopfsegment sowie ein 4 cm langer derber und bis 2,5 cm durchmessender knotiger Gewebsstrang, der an seinem Ende eine Fadenmarkierung aufweist. Hier auf lamellierenden, teilweise nodulär Connected Health Platform Semantic Enrichment Unstructured data (text) Text Mining De-Identification Ontologies Terminologies FAIR IICCAB: Innovative Use of Information for Clinical Care and Biomarker Research:

8 Beispiel Datenintegration / Datensemantik: "Drogenmissbrauch bei Jugendlichen"
Ich fange mit einem Beispiel an: "Drogenmissbrauch bei Jugendlichen"

9 Beispiel Datenintegration / Datensemantik: "Drogenmissbrauch bei Jugendlichen"
Ich fange mit einem Beispiel an: "Drogenmissbrauch bei Jugendlichen"

10 Fragestellung: "Drogenmissbrauch bei Jugendlichen"
Bildung prospektiver Kohorten Identifikation von Risikogruppen Monitoring von Interventionsmaßnahmen erfordert z.B. Datensammlung mittels Erhebungsbögen Analyse bestehender klinischer Daten Recherche in Fachliteratur Dieses in medizinischer Versorgung und Forschung überaus wichtige Thema spielt eine Rolle bei der Bildung entsprechender Kohorten, Identifikation von Risikogruppen, Monitoring von Maßnahmen, z.B. durch das Sammeln von Daten und die retrospektive Analyse von Daten, aber auch für Recherche in Fachliteratur.

11 Abgrenzungsproblem: "Drogenmissbrauch bei Jugendlichen"
Name Azra Benjamin Chiara Alter 13 17 18 Droge MDMA (Ecstasy) Alkohol Nikotin Form Pillen (~ 100 mg) Pils (Bitburger) (~5.5 Vol.%) Zigaretten Marlboro Häufigkeit 2-3 Stück /Party 2 mal / Monat 2 * 0.5 Liter / Woche 1 - 2 Schachteln/Tag Ich beginne mit einer kleinen Übung : Hier sind drei junge Mannheimer. Azra nimmt ab und zu auf Partys Ecstasy, Benjamin trinkt pro Woche 2 Flaschen Bier und Chiara ist eine starke Raucherin. Die Frage an Sie: Bei welcher Person ist der Sachverhalt „Drogenmissbrauch bei Jugendlichen“ erfüllt? Warum ist ein Konsens schwierig? (Definitionen – Welche Begriffe müssen definiert werden?) Bei wem ist der Sachverhalt erfüllt?

12 Definition: "Jugendlicher"
SNOMED CT undefiniert NCI Thesaurus 12 – 21 Jahre Pschyrembel zwischen  Pubertät und Erwachsenenalter (…) Duden (Rechtssprache) 14 – 18 Jahre WHO 10 – 19 Jahre Warum ist diese Frage schwer zu beantworten? Es gibt keine klaren Definitionen. Je nach Quelle sind die Altersgrenzen für „Jugendliche“ unterschiedlich, oder man verzichtet ganz auf eine Definition

13 Definition: "Droge" SNOMED CT "Illegal drug" "Psychoactive substance"
NCI Thesaurus "Recreational Drugs": A drug used for personal enjoyment rather than for medicinal purposes Pschyrembel (…) psychotrope Substanzen, deren Besitz nach BTmG entweder verboten ist oder die in einer nicht bestimmungsgemäßen Form verwendet werden Duden Rauschgift Noch schwieriger ist es bei der Definition von Droge. In gängigen Definitionen kommen leicht zwei unterschiedliche Gesichtspunkte zum Tragen, nämlich die Wirkung einer Substanz auf die Psyche und die strafrechtliche Relevanz des Gebrauchs einer Substanz.

14 Definition: "Drogenmissbrauch"
SNOMED CT PsychoactiveSubstanceAbuse   SubstanceAbuse  CausativeAgent.PsychoactiveSubstance NCI Thesaurus "Drug abuse": The use of a drug for a reason other than which it was intended (…). ICD-10 Psychische und Verhaltensstörungen durch psychotrope Substanzen – Schädlicher Gebrauch Pschyrembel (verweist auf ICD 10) Duden Missbrauch (übermäßiger Gebrauch; Abusus) von Drogen Und ebenso unklar ist die Definition von „Missbrauch“. Hier geht es teils um schädlichen Gebrauch, teils um unsachgemäßen Gebrauch von Substanzen im weitesten Sinne. Was also fehlt, sind präzise, international kompatible Definitionen. Präzision ist zunehmend ein Thema in der Medizin, siehe z.B. das Schlagwort "Precision Medicine" Frage an das Publikum: in welchem Bereich (außerhalb der Medizin) sind solche standardisierten Definitionen seit langem etabliert? Präzise, international kompatible Definitionen?

15 Industriestandards Name Euro-Flachstecker Steckdose (Brasilien) Code
CEE 7/16 NBR 14136 Quelle IECEE (Europa) NBR (Brasilien) maximale Spannung 230 V AC 127 V / 220 V maximaler Strom 16 A 10 A Stifte / Löcher: Durchmesser 4 mm 4.8 mm (Schutzkontakt + 3mm) Stifte / Löcher: Abstand 17,5 mm Stifte: Länge 19 mm Vertiefung 10 mm Kontur Sechseck: (35,3 mm, 13.7 mm) Sechseck: 35,5 mm, 17mm Bei Industriestandards! Im Grunde sind Industriestandards eine Form von Ontologien, man nennt sie nur nicht so.

16 Industriestandards Name Euro-Flachstecker Steckdose (Brasilien) Code
CEE 7/16 NBR 14136 Quelle IECEE (Europa) NBR (Brasilien) maximale Spannung 230 V AC 127 V / 220 V maximaler Strom 16 A 10 A Stifte / Löcher: Durchmesser 4 mm 4.8 mm (Schutzkontakt + 3mm) Stifte / Löcher: Abstand 17,5 mm Stifte: Länge 19 mm Vertiefung 10 mm Kontur Sechseck: (35,3 mm, 13.7 mm) Sechseck: 35,5 mm, 17mm Hier ein Beispiel aus der Elektrotechnik. Alle funktionsrelevanten Eigenschaften sind präzise definiert, so nicht nur Maximalspannung und Strom, sondern auch Abstand, Länge und Form der Kontakte, oder auch Form und Dimension des Sockels und der Vertiefung. Aus solchen Definitionen können sie im Voraus ableiten, dass Sie ihr Ladegerät mit Eurostecker in Brasilien, aber z.B. nicht in den USA benutzen können.

17 Ontologien als "begriffliche" Standards
Name Person between 14 and (less than) 18 Years Code Quelle SNOMED CT Oberklasse Person Min. Alter 14,000 Jahre Max. Alter 17,999 Jahre Interface-Terminologie (DE): Jugendlicher Teenager Adoleszent Heranwachsender Interface-Terminologie (DE): Psychoaktive Substanz Rauschgift Rauschmittel Droge Name Psychoactive substance Code Quelle SNOMED CT Oberklasse Substance Definition Alkohol OR Nikotin OR Morphin OR Benzodiazepine OR Amphetamine OR LSD OR Cannabis OR …. Was heißt das nun für medizinische Ontologien? Im Grunde sind gute und präzise Standards nichts anderes als Ontologien Es heißt, dass für alle relevanten Gegenstände, also Objekte, Prozesse, Eigenschaften präzise Definitionen zu fordern sind. Solche Definitionen legen die Kriterien fest, um eine bestimmte Substanz als Droge oder eine bestimmtes Lebensalter als „Jugendalter“ zu klassifizieren.

18 Ontologien als "begriffliche" Standards
Name Ethanol abuse Nicotin abuse MDMA abuse Code Quelle SNOMED CT Oberklasse Psychoactive substance abuse  Substanz Ethanol Nicotin MDMA Grenzwert ? Einheit g / Tag g / kg KG / Tag Schwieriger ist sicherlich die Definition von „Missbrauch“. Hier müssen für die einzelnen Substanzen Grenzwerte festgelegt werden und der globale Begriff „Drogenmissbrauch“ dann aus diesen Einzeldefinitionen zusammengesetzt werden. Interface-Terminologie (DE): Drogenmissbrauch Drogenabusus Substanzabusus Name Psychoactive substance abuse Code Quelle SNOMED CT Oberklasse Substance abuse Definition Ethanol abuse OR Nicotin abuse OR MDMA abuse OR … OR…

19 Warum Ontologien in medizinischer Versorgung und Forschung?
Technische Standards: Präzise Beschreibung von technischen Artefakten und Zuordnung zu Kategorien Sicherheit, Vergleichbarkeit, technische Kompatibilität, Austauschbarkeit von Komponenten Medizinische Ontologien Präzise Beschreibung von biologischen Gegenständen (Objekte, Prozesse, Eigenschaften) und deren Zuordnung zu Kategorien Patientensicherheit, Vergleichbarkeit, Datenintegration (FAIR) Überwindung der Unschärfe qualitativer verbaler Beschreibungen Mapping zu (häufig mehrdeutigen) lokalen Interface-Termen Tendenz: SNOMED CT, LOINC (Ontologien), HL7 (Informationsmodelle) Ich schließe ab: Präzise Ontologien sind in einer zunehmend mit dem Attribut „Precision“ versehenen Medizin ebenso wichtig wie technische Standards in der Elektrotechnik. Sie erlauben die eindeutige Zuordnung von Einzelobjekten, Prozessen und deren Merkmale zu definierten Kategorien oder Klassen. Erst dadurch werden die Unschärfe verbaler Beschreibungen und daraus folgende Fehlinterpretationen vermieden.

20 Eigene Arbeiten zu biomedizinischen Ontologien / semantischen Ressourcen
1997 Überleitungstabelle ICD-9 / ICD-10 (DIMDI) Ontologie gastrointestinaler Phänomene als LOOM-KB (DFG - MedSynDiKATe) Multilingualer medizinischer Subword-Thesaurus (DE, EN, ES, PT) (DFG: KoMoDoRe, Kooperationsprojekte DLR-IB) Semantische Repräsentation von Arzneiinformation (EU - PILLS) Multilinguales Medizinlexikon (EU – SemanticMining NoE) Gene Regulation Ontology (EU - BOOTStrep) DebugIT Core Ontology (EU - DebugIT) BioTop Upper Level Ontology (EU DFG - GoodOD) Validierung OBO Foundry Ontologies (DFG - GoodOD) Erstellung und Validierung von "Ontology Good Practice" – Kriterien (DFG - GoodOD): Standardentwicklung SNOMED CT (IHTSDO) Harmonisierung SNOMED CT – ICD11 (WHO - IHTSDO) OWL-DL - Version der Upper-Level-Ontologie Basic Formal Ontology V.2 Harmonisierung Ontologien – klinische Informationsmodelle (EU - SemanticHealthNet) Validierung SNOMED CT für klinischen Informationsaustausch (EU- ASSESS CT) Wissensakquisition aus MEDLINE-Metadaten (FWF - BMFACTS) Deutsche Interface-Terminologie für SNOMED CT (EU SEMCARE) Informationsmodellierung und SNOMED-Annotationen von Kliniktexten via NLP (FFG, SAP) Ontologie-Rekonstruktion / Dekonstruktion (EU-COST-GREEKC) Semantische Ressourcen für Datenintegration Schlaganfall (EU – PRECISE4Q) Fragen ? 2018


Herunterladen ppt "Die Bedeutung von Ontologien für die Integration medizinischer Daten"

Ähnliche Präsentationen


Google-Anzeigen