Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

"Pat. mit rez. HWI u. VUR" - Herausforderungen medizinischer Sprache, Terminologie und Semantik Stefan Schulz Institute für Medizinische Informatik, Statistik.

Ähnliche Präsentationen


Präsentation zum Thema: ""Pat. mit rez. HWI u. VUR" - Herausforderungen medizinischer Sprache, Terminologie und Semantik Stefan Schulz Institute für Medizinische Informatik, Statistik."—  Präsentation transkript:

1 "Pat. mit rez. HWI u. VUR" - Herausforderungen medizinischer Sprache, Terminologie und Semantik
Stefan Schulz Institute für Medizinische Informatik, Statistik und Dokumentation Medizinische Universität Graz

2 Natürliche Sprache in der Medizin

3 Natürliche Sprache in der Medizin
Wichtigster Träger klinischer Information Natürliche Form der Kommunikation Problem der Produktion kodierter Information Aufwand, Tooling geringere Präzision des Ausdrucks redundante Dokumentation fehlende Motivation Kliniker fehlender Nutzen für Kliniker geringe Dokumentationsqualität

4 Phänomene klinischer Texte
Sprachökonomie Telegrammstil, Ellipsen, Kurzformen, Ambiguität Fachvokabular: Hybrid Deutsch / Englisch / Latein Produktivität: Kompositabildung, ad-hoc-Abkürzungen Textproduktion und -revision unter Zeitdruck: Textdiktat: Verständnis- und Transkriptionsfehler Texteingabe: Tippfehler pragmatische Einstellung zu Fehlern und Sprachvarianten Textproduktion durch Nicht-Muttersprachler

5 Vesicoureteral reflux Harnwegsinfekt ? Hinterwandinfarkt?
Sprachökonomie rezent? rezidivierend? Pat. mit rez. HWI und VUR Vesicoureteral reflux Harnwegsinfekt ? Hinterwandinfarkt?

6 Synonyme, Schreibvarianten
Colon-Ca Kolon-Ca Kolon-karzinom Colon-carcinom Colon-Karzinom Kolonkrebs Dickdarm-krebs Dickdarm-Ca Malignom des Kolon Dickdarm-karzinom Bösartige Neubildung am Dickdarm Bösartiger Dickdarm-tumor maligne Neoplasie des Dickdarms Karzinom des Dickdarms maligne NPL des Colon

7 Schreib-, Tipp-, Transkriptionsfehler
Simvastatin Sinvastatin Simvastastin Simvastain Simvastad Simbastatin Simavstatin Simavastatin Simastatin Symvastatin Simvastation Simvaststin Simvatatin Simvatin Simvatstain Simvstatin

8 Triviales Retrieval durch Stringmatching
"Makroskopie: "Resektat nach Whipple": Ein noch nicht eröffnetes Resektat, bestehend aus einem distalen Magen mit einer kleinen Kurvaturlänge von 9,5 cm und einer großen Kurvaturlänge von 13,5 cm, sowei einem duodenalen Anteil von 14 cm Länge. 2 cm aboral des Pylorus zeigt die Dünndarmwandung eine sanduhrartige Stenose. Im Magen- und Duodenallumen reichlich zähflüssiger Schleim, sanguinolent; die Schleimhaut ist insgesamt livide. Auf lamellierenden Schnitten zähfestes weißliches, teilweise nodulär konfiguriertes Gewebe, ohne das Gallengänge manifest werden. Der distale Anteil des Ductus pankreaticus ist leicht erweitert und von der Papilla vateri aus 4,5 cm weit sondierbar, wobei er hier in einer peripankreatischen Narbenzone abbricht. Eine Gallengangsmündung läßt sich makroskopisch nicht abgrenzen. Die berichtete Duodenumstenose liegt 2,5 cm oral der Papilla vateri und steht mit der beschriebenen Narbenzone in direktem Zusammenhang. Dokument wird gefunden mit den Suchwörtern: "Whipple", "Magen", "Pylorus" Keine Treffer für: "Pankreatikoduodenectomie", "Resektion", "Duodenum", "Zwölffingerdarm", "Pankreas", "Bauchspeicheldrüse", "Gallengang", "Pankreasgang", "Ductus pancreaticus", "Papille", "Magenresektion"

9 Ziel: Abbildung auf standardisierte Bedeutung
Code (SNOMED CT) Wert Kontext |Superficial spreading malignant melanoma of skin |History of |Excision of malignant skin tumor |Skin of posterior surface of lower leg |Left |Diameter |millimeter 2.41 |Lymph node level IV |Secondary malignant neoplasm of inguinal lymph nodes |Current |Absent St. p. TE eines exulc. sek.knot.SSM (C43.5) li US dors. 5/11 Level IV 2,4 mm Tumordurchm. Sentinnel LK ing. li. tumorfrei

10 Aspekte von Sprache, Terminologie und Semantik

11 Aspekte von Sprache, Terminologie und Semantik
Morphologie Abkürzungen Komposita Terminologie, Ontologie Standards Formalismen Kontext Repräsentation von Information vs. Repräsentation von Realität

12 Abkürzungen systol. Funktion und eine red. Rechtsventrikelfunktion
tablettenpflichtigem Diab.mell. II. Der Pat. Hr. Meier die thorax chirurg. Vorstellung. f. mikro- und makrovask. Komplikationen Einnahme von Concor. Regelm. Internistische Kons. AST, KÖF Linksseitig RGs St.p. PTCA und RCA Stent Stenose der der A. Subklavia 0 A. Digimerck verabreicht großer li Ventrikel m. leichter postero septal path way keine path Veränderungen lexikalisiert Punkt + Substring - ad hoc Punkt + Substring + Akronym Akronym Plural zwei Tokens Punkt + Substring + ad hoc Punkt - Substring + Kreuzthaler M, Schulz S. Detection of sentence boundaries and abbreviations in clinical narratives. BMC Med Inform Decis Mak. 2015;15 Suppl 2:S4

13 Abkürzungen einer Infektion mit Hepatitis A. ausgeprägte Stenose der A. auf Streptokokken vom Typ A. akuter Mangel an Vitamin A. Symptomatik haben wir 1 A. nach Verlegung auf Station 6 A. ein Adenokarzinom o. n. A. Ausschluss von Hämophilie A. Hierbei sind keine weiteren Subclavia, die eine Indikation Nicht ausgeschlossen ist, dass Wir empfehlen Substitution Digimerck verabreicht, um die Wir bedauern, ihnen keine diagnostiziert worden. Dabei Die Koagulopathie konnte bis

14 Abkürzung? Satzende? einer Infektion mit Hepatitis A. ausgeprägte Stenose der A. auf Streptokokken vom Typ A. akuter Mangel an Vitamin A. Symptomatik haben wir 1 A. nach Verlegung auf Station 6 A. ein Adenokarzinom o. n. A. Ausschluss von Hämophilie A. Hierbei sind keine weiteren Subclavia, die eine Indikation Nicht ausgeschlossen ist, dass Wir empfehlen Substitution Digimerck verabreicht, um die Wir bedauern, ihnen keine diagnostiziert worden. Dabei Die Koagulopathie konnte bis

15 Abkürzung? Satzende? einer Infektion mit Hepatitis A. ausgeprägte Stenose der A. auf Streptokokken vom Typ A. akuter Mangel an Vitamin A. Symptomatik haben wir 1 A. nach Verlegung auf Station 6 A. ein Adenokarzinom o. n. A. Ausschluss von Hämophilie A. Hierbei sind keine weiteren Subclavia, die eine Indikation Nicht ausgeschlossen ist, dass Wir empfehlen Substitution Digimerck verabreicht, um die Wir bedauern, ihnen keine diagnostiziert worden. Dabei Die Koagulopathie konnte bis

16 Abkürzung? Satzende? Klassifikationsproblem Featureextraktion
Punkt ist Teil des linken Tokens, kein Satzende Punkt ist Teil des linken Tokens, Satzende Punkt ist nicht Teil des linken Tokens  Satzende Featureextraktion Wortlänge Wortklasse Korpus Regeln Dictionary Verteilung

17 Abkürzungserkennung Klassifikation mittels SVN
F1-Werte nach Methode (kumulativ) Baseline Regeln Statistik Scaling Corpus Länge Wortklasse Training 0.62 0.60 0.71 0.86 0.88 0.95 0.97 Test 0.83 0.96 0.93 Kreuzthaler M, Schulz S. Detection of sentence boundaries and abbreviations in clinical narratives. BMC Med Inform Decis Mak. 2015;15 Suppl 2:S4

18 Abkürzungsauflösung n
C – Referenzcorpus B – Token - Bigrammliste aus C, nach absteigender Häufigkeit : B := [#, tk, tl] 1 a – "Punkt" Abkürzung (Input) For each bi in B if a == tki: b := tli; exit; a' := left(a, length(a) -1) For each bj in B if left(tkj, length(a')) == a' AND tki != a' and tlj == b output tkj; exit n "infiltr." "infiltr." "Gewebe" "infiltr" "infiltriertes" "Gewebe" "infiltriertes"

19 Dekomposition Ad-hoc-Komposita: Cholangiopankreatikographie Hausstaubmilbenphobie Phenylbutylpiperadinderivate Laryngotracheobronchoskopie hypothalamikohypophyseales Erscheinungsbild Phosphoethanolaminurie Chorionzottenbiopsietermin Hyperviskositätssyndrom

20 Dekomposition Ad-hoc-Komposita: Chol angio pankreat iko graph ie Hausstaub milb en phob ie Phenyl butyl piperadin derivate Laryng o trache o bronch o skop ie hypo thalamik o hypo phys eal es Erscheinung s bild Phosph o ethanol amin urie Chorion zotten biopsie termin Hyper viskosität s syndrom

21 Morphosemantik Galle Bauchspei-cheldrüse Ad-hoc-Komposita: Chol angio pankreat iko graph ie Hausstaub milb en phob ie Phenyl butyl piperadin derivate Laryng o trache o bronch o skop ie hypo thalamik o hypo phys eal es Erscheinung s bild Phosph o ethanol amin urie Chorion zotten biopsie termin Hyper viskosität s syndrom Gefäß Bild- gebung Schulz S, Hahn U. Morpheme-based, cross-lingual indexing for medical document retrieval. Int J Med Inform Sep;58-59:87-99 Daumke P, Schulz S, Müller ML, Dzeyk W, Prinzen L, Pacheco EJ, Cancian PS, Nohama P, Markó K. Subword-based semantic retrieval of clinical and bibliographic documents. Methods Inf Med. 2010;49(2):141-7

22 Morphosemantische Analyse
0,65 D – D – Wortbasierter Index 0,6 D – D – Subwort- Synonymklassen 0,55 0,5 0,45 0,4 0,35 Morphosemantischer Parser Wortgrammatik als Endlicher Automat Output 1: Morpheme / Subwords (ohne Semantik) Output 2: Subwort-Äquivalenzklassen (mit Semantik), z.B. #heart = {"herz", "cor", "card"}DE 0,3 0,25 Precision 0,2 5,500 German documents 0,15 25 German topics 0,1 0,05  Terminologie / Ontologie 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Schulz S, Hahn U. Morpheme-based, cross-lingual indexing for medical document retrieval. Int J Med Inform Sep;58-59:87-99 Daumke P, Schulz S, Müller ML, Dzeyk W, Prinzen L, Pacheco EJ, Cancian PS, Nohama P, Markó K. Subword-based semantic retrieval of clinical and bibliographic documents. Methods Inf Med. 2010;49(2):141-7 Recall

23 Terminologie und Ontologie

24 Terminologie und Ontologie
Erweiterung erworbenes Escherichia coli externes Extrakt fähiges Faktor Färbung fetales Fistel Fixierung Flugzeug Flüssigkeit Form fremdes Fremdkörper Führung Galle Gang Gas Gebärmutter- Gebärmutterhals Gehirn gemeinsames gesamtes geschlossenes Geschwür Gesehenes Gesicht Gesundheit großes Gruppenantikörper gutartiges Hämoglobin Handgelenk Harn- Hepatitis Hernie Herz hohes Hohlraum Hormon Hüfte Hund I IgE IgE - Antikörper II Immunglobulin Impfstoff Implantat in in der Lage zu inferiores Infusion internes intervertebrales intrakranielles Kammer Kanal kardiales Katheter keines Kern Kind Klappe kleines Knie Knöchel Knoten Knoten Kolon kombiniertes Komplikation Kontrast Kontrolle Konzept Koronar- Koronararterie Lappen Laser Lebensmittel Leber Lenden- Linse Lippe lokales Lunge Luxation Lymphknoten Lymphknoten Lymphom Lymphozyt M Magen Magen- Magen- Darm- magnetisches Management männliches Maßstab mediales medizinisches Membran mittleres ml Injektionslösung multiples Mund Nadel Naht Nase Nasen- neonatales niedriges Niere Nieren- oberes oberes oberflächliches Oberschenkel- offenes offenes Ohr Operation Ort passives Patient peripheres perkutanes Pferd Phalanx Plasma Platzwunde positives primäres primäres Probe Probe Protein Prothese proximales Prozess Pulver r Rand

25 Terminologie-Ökosystem (ASSESS CT)
Erweiterung erworbenes Escherichia coli externes Extrakt fähiges Faktor Färbung fetales Fistel Fixierung Flugzeug Flüssigkeit Form fremdes Fremdkörper Führung Galle Gang Gas Gebärmutter- Gebärmutterhals Gehirn gemeinsames gesamtes geschlossenes Geschwür Gesehenes Gesicht Gesundheit großes Gruppenantikörper gutartiges Hämoglobin Handgelenk Harn- Hepatitis Hernie Herz hohes Hohlraum Hormon Hüfte Hund I IgE IgE - Antikörper II Immunglobulin Impfstoff Implantat in in der Lage zu inferiores Infusion internes intervertebrales intrakranielles Kammer Kanal kardiales Katheter keines Kern Kind Klappe kleines Knie Knöchel Knoten Knoten Kolon kombiniertes Komplikation Kontrast Kontrolle Konzept Koronar- Koronararterie Lappen Laser Lebensmittel Leber Lenden- Linse Lippe lokales Lunge Luxation Lymphknoten Lymphknoten Lymphom Lymphozyt M Magen Magen- Magen- Darm- magnetisches Management männliches Maßstab mediales medizinisches Membran mittleres ml Injektionslösung multiples Mund Nadel Naht Nase Nasen- neonatales niedriges Niere Nieren- oberes oberes oberflächliches Oberschenkel- offenes offenes Ohr Operation Ort passives Patient peripheres perkutanes Pferd Phalanx Plasma Platzwunde positives primäres primäres Probe Probe Protein Prothese proximales Prozess Pulver r Rand Interface- Terminogien ~ Thesauren z.B. MeSH

26 Terminologie-Ökosystem (ASSESS CT)
Erweiterung erworbenes Escherichia coli externes Extrakt fähiges Faktor Färbung fetales Fistel Fixierung Flugzeug Flüssigkeit Form fremdes Fremdkörper Führung Galle Gang Gas Gebärmutter- Gebärmutterhals Gehirn gemeinsames gesamtes geschlossenes Geschwür Gesehenes Gesicht Gesundheit großes Gruppenantikörper gutartiges Hämoglobin Handgelenk Harn- Hepatitis Hernie Herz hohes Hohlraum Hormon Hüfte Hund I IgE IgE - Antikörper II Immunglobulin Impfstoff Implantat in in der Lage zu inferiores Infusion internes intervertebrales intrakranielles Kammer Kanal kardiales Katheter keines Kern Kind Klappe kleines Knie Knöchel Knoten Knoten Kolon kombiniertes Komplikation Kontrast Kontrolle Konzept Koronar- Koronararterie Lappen Laser Lebensmittel Leber Lenden- Linse Lippe lokales Lunge Luxation Lymphknoten Lymphknoten Lymphom Lymphozyt M Magen Magen- Magen- Darm- magnetisches Management männliches Maßstab mediales medizinisches Membran mittleres ml Injektionslösung multiples Mund Nadel Naht Nase Nasen- neonatales niedriges Niere Nieren- oberes oberes oberflächliches Oberschenkel- offenes offenes Ohr Operation Ort passives Patient peripheres perkutanes Pferd Phalanx Plasma Platzwunde positives primäres primäres Probe Probe Protein Prothese proximales Prozess Pulver r Rand Referenz- terminologien/ Ontologien z.B. SNOMED CT Reference Terminology / Ontologie RT1 RT2 RT3 Interface- Terminogien ~ Thesauren z.B. MeSH

27 Terminologie-Ökosystem (ASSESS CT)
Erweiterung erworbenes Escherichia coli externes Extrakt fähiges Faktor Färbung fetales Fistel Fixierung Flugzeug Flüssigkeit Form fremdes Fremdkörper Führung Galle Gang Gas Gebärmutter- Gebärmutterhals Gehirn gemeinsames gesamtes geschlossenes Geschwür Gesehenes Gesicht Gesundheit großes Gruppenantikörper gutartiges Hämoglobin Handgelenk Harn- Hepatitis Hernie Herz hohes Hohlraum Hormon Hüfte Hund I IgE IgE - Antikörper II Immunglobulin Impfstoff Implantat in in der Lage zu inferiores Infusion internes intervertebrales intrakranielles Kammer Kanal kardiales Katheter keines Kern Kind Klappe kleines Knie Knöchel Knoten Knoten Kolon kombiniertes Komplikation Kontrast Kontrolle Konzept Koronar- Koronararterie Lappen Laser Lebensmittel Leber Lenden- Linse Lippe lokales Lunge Luxation Lymphknoten Lymphknoten Lymphom Lymphozyt M Magen Magen- Magen- Darm- magnetisches Management männliches Maßstab mediales medizinisches Membran mittleres ml Injektionslösung multiples Mund Nadel Naht Nase Nasen- neonatales niedriges Niere Nieren- oberes oberes oberflächliches Oberschenkel- offenes offenes Ohr Operation Ort passives Patient peripheres perkutanes Pferd Phalanx Plasma Platzwunde positives primäres primäres Probe Probe Protein Prothese proximales Prozess Pulver r Rand AT3 Referenz- terminologien/ Ontologien z.B. SNOMED CT RT4 Reference Terminology / Ontologie AT2 Aggregations- terminologien/ Klassifikations- systeme z.B. ICD-10 RT1 AT1 RT2 AT4 RT3 Interface- Terminologien ~ Thesauren z.B. MeSH

28 "Ca" "Kalzium" "Calcium" "Ca" "Krebs" "Karzinom" Interfaceterminologie
beschreibt Sprache einer Domäne beschreibt die Gegenstände einer Domäne Erweiterung erworbenes Escherichia coli externes Extrakt fähiges Faktor Färbung fetales Fistel Fixierung Flugzeug Flüssigkeit Form fremdes Fremdkörper Führung Galle Gang Gas Gebärmutter- Gebärmutterhals Gehirn gemeinsames gesamtes geschlossenes Geschwür Gesehenes Gesicht Gesundheit großes Gruppenantikörper gutartiges Hämoglobin Handgelenk Harn- Hepatitis Hernie Herz hohes Hohlraum Hormon Hüfte Hund I IgE IgE - Antikörper II Immunglobulin Impfstoff Implantat in in der Lage zu inferiores Infusion internes intervertebrales intrakranielles Kammer Kanal kardiales Katheter keines Kern Kind Klappe kleines Knie Knöchel Knoten Knoten Kolon kombiniertes Komplikation Kontrast Kontrolle Konzept Koronar- Koronararterie Lappen Laser Lebensmittel Leber Lenden- Linse Lippe lokales Lunge Luxation Lymphknoten Lymphknoten Lymphom Lymphozyt M Magen Magen- Magen- Darm- magnetisches Management männliches Maßstab mediales medizinisches Membran mittleres ml Injektionslösung multiples Mund Nadel Naht Nase Nasen- neonatales niedriges Niere Nieren- oberes oberes oberflächliches Oberschenkel- offenes offenes Ohr Operation Ort passives Patient peripheres perkutanes Pferd Phalanx Plasma Platzwunde positives primäres primäres Probe Probe Protein Prothese proximales Prozess Pulver r Rand Interfaceterminologie Ontologie "Ca" "Kalzium" "Calcium" [chemistry] Calcium (substance) "Ca" "Krebs" "Karzinom" Carcinoma (morphologic abnormality) [oncology]

29 SNOMED CT SNOMED CT: weltgrößte Medizinontologie ca. 300 000 Konzepte
ca. 1,3 Millionen Tripel Kompositioneller Ansatz, basierend auf Beschreibungslogik EL++ Schulz S, Cornet R, Spackman K. Consolidating SNOMED CT's ontological commitment. Appl. Ontology, 2011 (6) 1, 1-11. Schulz S, Jansen L. Formal ontologies in biomedical knowledge representation. Yearb Med Inform. 2013;8:

30 Semiautomatische Erstellung einer Interface-terminologie für SNOMED CT
Schulz S. Using language technology for SNOMED CT localization? SNOMED CT Expo, Montevideo 2015

31 Ontologie und Informationskontext

32 Ontologie und Informationskontext
… es besteht Verdacht auf Herzinsuffizienz verursacht durch die ischämische Herzerkrankung Diagnosis Diagnose Organversagen Heart Failure Organ Herz Status Status Verdacht Suspected x Ursache ischämische Herzerkrankung Ja Nein k.A. Cause gemein-same formale Repräsen-tation ? Ischaemic heart disease V.a. Herzinsuff. ischäm. Genese Sospetto scompenso cardiaco a causa di ischemia DIAGNOSIS Suspected heart failure caused by ischaemic heart disease

33 Beispiel: formale Modellierung
Drei unterschiedliche Repräsentation derselben Information Drei unterschiedliche Informationsmodelle SNOMED CT + BTL2 als gemeinsame Ontologie Organ Failure Diagnosis Organ Heart Status Suspected Caused by ischaemic heart disease Yes No Unknown Diagnosis Suspected heart failure caused by ischaemic heart disease x Heart Failure Cause Ischaemic heart disease Schulz S et al. An Ontological Analysis of Reference in Health Record Statements S Martínez-Costa C, Cornet R, Karlsson D, Schulz S, Kalra D. Semantic enrichment of clinical models towards semantic interoperability. The heart failure summary use case. J Am Med Inform Assoc May;22(3):

34 Ontologische "Typisierung" von Informationsentitäten
The yellow comments represent what is each element of the form about. Together to the yellow comments, the corresponding representation in OWL DL according to the ontology previously presented is provided. The full definition of each form is only given by a combination of all the annotations,

35 Ontologische "Typisierung" von Informationsentitäten
In this case we only will have to Description logics annotations: - is a Diagnoisis - is...

36 Ontologische "Typisierung" von Informationsentitäten
Finally, these would be the comments and annotations for the third form...

37 Ontologische "Typisierung" von Informationsentitäten
If we create now the three diagnosis instances, annotated by the OWL DL representations of each form (combinations of DL expressions) Diagnosis instances, e.g. the real clinical data as embedded into an information model are annotated by OWL-DL (T-Box) expressions.

38 Alle drei Informationsinstanzen gefunden
DL-Klassifikation (FACT++ Reasoner) Anfrage The check for semantic equivalence can then be performed by e DL reasoner completely at the T-Box level. Queries could then be formulated as DL queries as the one shown in which we see how the three instances of diagnosis are found independently of the granularity in which the query is performed We are aware that in a system that supports comprehensive querying (including query by a series of metadata such as author, time, etc.) the DL query can only be part of a whole picture in which also other querying approaches are required. Alle drei Informationsinstanzen gefunden

39 Implementierung semantischer Technologien in Cbmed – Biomarker Research, Graz

40 Implementierung semantischer Technologien in Cbmed – Biomarker Research, Graz

41 Ressourcen für maschinelle Analyse geschriebener Sprache
Terminologien / Lexika Fachtermini und deren Beziehungen, z.B. Synonyme: "SSMM" = "Superficially spreading malignant melanoma" Ontologien Axiomatische Beschreibungen, z.B. MitralValve subClassof partOf some Heart Grammatik / Regelwerke z.B. Wortbildungsregeln: "-itis" = Entzündung, "-ektomie": chirurgische Entfernung Textkorpora (z.B. Kliniktexte, Veröffentlichungen, Web) Annotierte Korpora: Wörter <-> Wortklassen, Textpassagen <-> Kontext (z.B. Diagnose, Familienanamnese, Labor, Medikation) Nicht annotierte Korpora: z.B. Worthäufigkeiten, Wortkollokationen Training probabilistischer Modelle Termiologiestandards: - SNOMED CT - LOINC Interface-Terminologien (anwendernah) Ressourcen für deutsche Sprache: unzureichend

42 Ausblick Gering strukturierte Texte in der elektronischen Krankenakte:
oft einzige Informationsquelle oft verlässlicher und nachhaltiger als strukturierte Inhalte bisher wenige erschlossene "Goldmine" Liefert wertvolle Daten für Personalisierte Medizin Entscheidungsunterstützung Klinische Forschung ("phenotyping") Vorhersage Breites Spektrum an semantischen / linguistischen Ressourcen erforderlich Diese Ressourcen müssen auf die deutsche Medizinsprache zugeschnitten werden: beträchtlicher Aufwand Anlehnung an internationale Standards sinnvoll. Wichtigstes Beispiel: SNOMED CT als umfassende klinische Ontologie

43 Kontakt Stefan Schulz (Univ. Prof. Dr. med.) Institut für Medizinische Informatik, Statistik und Dokumentation

44 Character of this lecture
Introductory lecture for seminar on clinical data integration Educational goals: To understand the rationale for clinical data integration across disciplines, users and institutions To distinguish between structural and semantic criteria of clinical data To understand the role of biomedical informatics and international standardization in clinical data integration To be sensitized regarding ethical aspects of clinical data integration

45 Die Lehrprobe soll grundlegende Arten von medizinisch relevanten Daten (einschließlich klinischer Versorgungsdaten, medizinischer Bilddaten und Omics-Daten) erläutern. Darauf aufbauend soll erläutert werden, wie diese Daten unter Beachtung von regulatorischen und Sicherheitsaspekten semantisch integriert und analysiert werden können. Die Lehrprobe sollte auf Englisch gehalten werden, da auch die Lehre im Masterstudiengang „Medical Informatics“ in Englisch gehalten wird

46 Six examples of clinical data
Clinical narrative Drug prescription Lab report Coded disorders and procedures Medical image Extract of gene sequence

47 IHTSDO: International Health Standards Development Organisation

48 SNOMED CT as terminology
Code + Fully Specified Name Synonyms

49 SNOMED CT as ontology Multiple subclass hierarchies (is-a)
Ontology axioms: C1 – Rel – C2 triples interpreted as: (FOL) x: instanceOf (x, C1)  y: instanceOf (C2)  Rel (x, y) (DL) C1 subclassOf Rel some C2 Relations (OWL object properties ): e.g. Associated morphology Associated procedure Finding site

50 Open Biomedical Ontology (OBO) Foundry
Suite of orthogonal interoperable reference ontologies in the biomedical domain

51 Open Biomedical Ontology (OBO) Foundry
RELATION TO TIME GRANULARITY CONTINUANT OCCURRENT INDEPENDENT DEPENDENT ORGAN AND ORGANISM Organism (NCBI Taxonomy) Anatomical Entity (FMA, CARO) Organ Function (FMP, CPRO) Phenotypic Quality (PaTO) Biological Process (GO) CELL AND CELLULAR COMPONENT Cell (CL) Cellular Component (FMA, GO) Cellular Function MOLECULE Molecule (ChEBI, SO, RnaO, PrO) Molecular Function Molecular Process

52 Upper Level Ontologies
Strict categorization through limited set of top classes and relations Example: BioTopLite Classes Relations Disposition Function Immaterial object Information object Material object Process Quality Role Temporal region Value region at some time includes has part has boundary has granular part has component part is bearer of causes has realization precedes has condition projects onto has participant has agent has patient has outcome is life of is referred to at time represents Stefan Schulz & Martin Boeker. "BioTopLite: An Upper Level Ontology for the Life Sciences Evolution, Design and Application." GI-Jahrestagung

53 3. Contribute to develop existing standards / specifications
Join communities that use common terminology / ontology specifications Contribute to development / maintenance Ontologies objective descriptions of a domain and not as application-specific knowledge bases (scientific realism*) Only express what is universally true Examples SNOMED CT OBO Foundry Upper-level ontologies (BFO, DOLCE, BioTop) Barry Smith (2004) Beyond Concepts: Ontology as Reality Representation. A. Varzi and l. Vieu, Proc. of FOIS 2004.

54 Adaptation of existing standards / specifications
Create extensions of existing semantic resources Additional subclasses, interface terms Address specific use cases / contexts Add additional upper-level orderings, e.g. "Indication", "Phenotype", "Clinical Problem", orthogonal to existing top-level Refine ambiguous classes like Animal, Tree, Heart animal (biological) vs. animal (legal) tree (morphology) vs. tree (taxonomic) vs. tree (2nd growth) heart (anatomical) vs. heart (surgical)

55 Conclusion Semantic resources for Life Sciences: Large number, large heterogeneity (context, quality, formalisms) How to make best use of them? Linked Data / "little semantics" large-scale re-use only where low precision is tolerable Else: Building on a limited number of high-quality terminology standards / specification efforts, join communities, custom additions / refinements Refrain from building "yet another" ontology Value semantic interoperability

56 Thank you Stefan Schulz (Univ.-Prof. Dr. med.)
Institut für Medizinische Informatik, Statistik und Dokumentation Medizinische Universität Graz, Auenbruggerplatz 2/V 8036 Graz (Austria) Skype: stschulz

57 Universalien Individuen Symbole Aspekte des Wissens ❺ ❻ ❹ ❷ ❸ ❶ Hunde
können Tollwut übertragen Hunde sind Wirbeltiere Individuen "Hund" und "perro" sind Synonyme Marley ist ein Hund Symbole Instantiierung Denotation "Hund" ist ein Substantiv Marley lebt in Florida Denotation

58 Ontologisches Wissen: Was ausnahmslos als wahr
betrachtet wird Kontingentes Wissen: Was typisch, wahrscheinlich oder möglich ist Sprachliches Wissen: Aussagen über Aufbau und Bedeutung sprachlicher Zeichen Faktenwissen: Aussagen über konkrete Dinge und ihre Beziehungen

59

60

61

62 ❷ Relation Individuum - Universale
Adriana Peterova Sigmund Jähn Anton Schrader Henriette Hirschfeld-Tiburtius Alois Alzheimer Friedrich Schmiedl

63 ❷ Relation Individuum - Universale
Sigmund Jähn { Klassenbildende Eigenschaften Lebender Mensch Technische Ausbildung Mindestens ein Aufenthalt im Weltraum Klasse: Astronaut

64 Ontologisches Wissen: Was ausnahmslos als wahr
betrachtet wird Kontingentes Wissen: Was typisch, wahrscheinlich oder möglich ist Sprachliches Wissen: Aussagen über Aufbau und Bedeutung sprachlicher Zeichen Faktenwissen: Aussagen über konkrete Dinge und ihre Beziehungen

65

66 ❸ Sprachliches Wissen:

67 ❹ Thesaurus

68 Ontologisches Wissen: Was ausnahmslos als wahr
betrachtet wird Kontingentes Wissen: Was typisch, wahrscheinlich oder möglich ist Sprachliches Wissen: Aussagen über Aufbau und Bedeutung sprachlicher Zeichen Faktenwissen: Aussagen über konkrete Dinge und ihre Beziehungen

69

70 Ontologisches Wissen: Was ausnahmslos als wahr
betrachtet wird Kontingentes Wissen: Was typisch, wahrscheinlich oder möglich ist Sprachliches Wissen: Aussagen über Aufbau und Bedeutung sprachlicher Zeichen Faktenwissen: Aussagen über konkrete Dinge und ihre Beziehungen

71 ❺ Taxonomien Homo Sapiens subclassOf Primate
Primate subclassOf Vertebrate Class: Vertebrate Class: Primate Ziggy   Anton  Class: Homo S. Adriana  Washoe  Friedrich  Koko  Bobo 

72 Übung: Taxonomie - Clinical Medicine - - Oncology Cancer Lung Breast Prostate Colon - Geography - - Countries - - - BRIC Countries Brazil Russia India China

73 Übung: Korrektur - Clinical Medicine - - Oncology Cancer Lung Breast Prostate Colon - Clinical Disease - - Oncologic Disease - - - Cancer Lung Cancer Breast Cancer Prostate Cancer Colon Cancer

74 Übung: Übung: Korrektur
- Geography - - Countries - - - BRIC Countries Brazil Russia India China - Geographical Entity - - Country - - - BRIC Country (Members: Brazil, Russia, India, China)

75 ❺ Partitionen Homo Sapiens subclassOf not (Chimpanzee) Class: Primate
Class: Homo S. Class: Chimpanzee.

76 ❺ Aristotelische Definitionen
Viral Hepatitis equivalentTo Viral Infection and locatedIn some Liver Class: Viral Infection Class: Viral Hepatitis Class: Liver locatedIn Notwendige und hinreichende Bedingungen

77

78 ❻ Kontingentes Wissen Vioxx® lindert Schmerzen
Vioxx® verursacht Herzinfarkt Vioxx® ist Mittel der Wahl bei rheumatischer Arthritis (2002) Vioxx® ist als Arzneimittel verboten (2005) Vögel können fliegen Pinguine sind Vögel Pinguine können nicht fliegen Rauchen verursacht Lungenkrebs Helmut Schmidt raucht seit 85 Jahren Helmut Schmidt hat keinen Lungenkrebs Österreich ist kein Erdbebengebiet 1972 schweres Erdbeben in Seebenstein Seebenstein liegt in NÖ NÖ liegt in Österreich

79 Welches Wissen ist nachhaltig ?
Ontologisches Wissen: Was ausnahmslos als wahr betrachtet wird Kontingentes Wissen: Was typisch, wahrscheinlich oder möglich ist Sprachliches Wissen: Aussagen über Aufbau und Bedeutung sprachlicher Zeichen Faktenwissen: Aussagen über konkrete Dinge und ihre Beziehungen

80

81 Vorteile von SNOMED CT Standardisierte Beschreibung medizinischer Sachverhalte Präziseres Wiederfinden von Krankheitsfällen "Diabetiker mit Parkinson, die keine Dopaminagonisten einnehmen und als Fahrzeuglenker bei einem Unfall verletzt wurden Automatisierte Entscheidungsunterstützung Automatische Wissensakquisition aus PatientInnendaten

82 Andere biomedizinischen Ontologien
Ontologien in der Wissenschaft Andere biomedizinischen Ontologien ChEBI: Chemische Entitäten GO (Gene Ontology) Cell Component Molecular Function Biological Process FMA: Foundational Model of Anatomy

83 Beispiel Gene Ontology

84 Gesellschaftliche Aspekte
Nachhaltige Wissensinhalte Inhalte, die sich nicht verändern, und daher als stabiles Fundament für Wissenskonstruktionen dienen Wissensquellen, die allgemein zugänglich sind Wissensinhalte, die durch Partikularinteressen abgeschirmt sind, stehen der nachhaltigen Nutzung im Weg

85 Beispiel terminologische / ontologische Standards
SNOMED CT: Internationaler Standard, verwaltet von gemeinnütziger NGO (IHTSDO) Routinenutzung lizenzpflichtig Affiliate Licence Mitgliedschaft (auf nationaler Ebene) Österreich ca €/Jahr Österreich ist bisher kein Mitglied, Einführung fraglich

86 Beispiel Industriestandards

87 Diskussion Vorteile genormter Ontologien und Terminologien:
Stabile Benennungen Logische Begriffsdefinitionen, präziser als sprachliche Definitionen Genaue Abgrenzung "fließender" Begriffe "Schokoladenpizza": Kuchen oder Pizza? 13-jähriger: Kind oder Jugendlicher Interoperabilität über Disziplinen und Sprachen hinweg Widersprüche können maschinell aufgedeckt werden Plädoyer: Genormte Ontologien und Terminologien als Gemeingut zu behandeln

88 Six examples of clinical data
Hydroxyzin 25 mg 1-0-1 Cinacalcet Tabletten 35 mg 1 x 1 Fluoxetin 10 mg 1-1-1 Magnesium FT 150 mg 1-0-1 Nitroglycerin retard 2,5 mg Kps Nitroglycerin-Pumpspray bei Bedarf Amantadine 1-1-0 Allopurinol 300 mg jeden 2. Tag eine ½ Tablette (zuletzt am ) Mefenaminsäure 500mg bis 3xtgl. bei Schmerzen unter gleichzeitiger Einnahme eines Magenschutzes z.B. Pantoprazol 40mg.

89 ICD codes structured and coded shared models of meaning lab data local data models implicit meaning semi-structured tags unstructured

90 Implicit meaning Local metadata Global metadata Structured data
semi-structured data structuring tags or markers more flexible less predefinition unstructured data content only no predefinition

91

92 Clinical data by Structure
data models predefined attributes and values data model structured data semi- unstructured data structuring tags or markers more flexible less predefinition content only no predefinition

93 Clinical data by Semantics
10 mg 1-1-1 150 mg 1-0-1 25 mg 1-0-1 81 kg 1,69m 125/80, 76/min GGGTGATGGCCGCTGCCGATGGCGTCAAATCCCACCA RegEx: "\d{1,4}\ ?mg\ +[01]-[01]" ICD : D22.5: Melanocytic nevi of trunk male = 1 female = 2 other = 3 unknown = 4 Hidden Implicit Local Global locally defined metadata / ontologies globaly defined metadata / ontologies standards signals no symbolic meaning symbolic meaning common sense

94 Clinical data by Semantics
structured data semi- unstructured data 10 mg 1-1-1 150 mg 1-0-1 25 mg 1-0-1 RegEx: "\d{1,4}\ ?mg\ +[01]-[01]" Hidden Implicit Local Global locally defined metadata / ontologies globaly defined metadata / ontologies standards signals no symbolic meaning symbolic meaning common sense

95 Clinical data by Semantics
structured data semi- unstructured data

96


Herunterladen ppt ""Pat. mit rez. HWI u. VUR" - Herausforderungen medizinischer Sprache, Terminologie und Semantik Stefan Schulz Institute für Medizinische Informatik, Statistik."

Ähnliche Präsentationen


Google-Anzeigen