Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Forschungsschwerpunkt Biomedizinische Semantik

Ähnliche Präsentationen


Präsentation zum Thema: "Forschungsschwerpunkt Biomedizinische Semantik"—  Präsentation transkript:

1 Forschungsschwerpunkt Biomedizinische Semantik
Stefan Schulz MUG-IMI,

2 Grundannahmen Informationen in medizinischer Praxis und klinischer Wissenschaft werden kommuniziert: vor allem anderen: in freitextlicher Form strukturiert, aber mit proprietären Attributen / Werten (z.B. Archimed) strukturiert mit standardisierten Werten strukturiert mit numerischen Werten als Biosignale Symbole (Zeichen) haben Bedeutungen Symbole repräsentieren Denkeinheiten (Begriffe) Zumeist Korrelate zu Objekten einer realen Welt Interpretation des Benutzerkontextes fundamental

3 Ziel: Semantische Interoperabilität
Kommunikation ohne Bedeutungsverlust / -verzerrung: Vielfältige Probleme: A1 möchte alle Patienten mit Magenulkus (K25) zählen, aber A2 hat auch die Patienten mit Verdacht auf Magenulkus mit ICD-10:K25 kodiert. Magenulkus ist eine nicht kodierte Nebendiagnose. Freitextsuche nach „Magenulkus“ findet nicht Texte mit „Magenulcus“ Suche auch erfolgreich bei Arztbriefen mit „Magenulkus“in der Familienanamnese steht „Der Patient bekam Omeprazol zur Prophylaxe eines Magenulkus Gastroskopieberichte mit „keine Ulzera“, „Ulzera können nicht ausgeschlossesn werden“ Negation erkannt? Magenulkus ausgeschlossen? Was ist mit „Stressulcus im Corpusbereich“ ? Verarbeitung auf lexikalischer, semantischer und ontologischer Ebene

4 Semantik findet auf mehreren Ebenen statt
Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

5 Semantik findet auf mehreren Ebenen statt
Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Terminologie Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Ontologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Epistemologie

6 Semantik findet auf mehreren Ebenen statt
Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Terminologie Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Ontologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Epistemologie

7 Wortfragment-basierte Dokumenten-indexierung
Terminologie Ontologie Wortfragment-basierte Dokumenten-indexierung Theorie der sprachlichen Zeichen Theorie der Realität - Synonymie, Homonymie - Kategorien - Oberbegriffe, Unterbegriffe - Axiome z.B.: {„ ulcus “, „ ulkus “, „ ulzer *“, z.B. materielles Objekt vs. Funktion ulcer *“, „ geschwür “, ….} vs. Prozess vs. Qualität „krebs“: Krankheit oder Tier Korpusmukosa = Mukosa + „blase“ : Harnblase oder Brandblase lokalisiert in =1 Magenkorpus Epistemologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Identifikation kleinster bedeutungstragender Elemente der Medizinsprache: Wortfragmente („subwords“) Gruppierung bedeutungstragender Wortfragmente Erstellung eines Subword-Thesaurus Nachweis des Vorteils bei sprachinternem und sprachübergreifenden Dokumentenretrieval

8 Indexierung durch Wortfragmente
abdomin adenom akut analys antibiot ausmass basis biolog blut chirurg chroni darm daten diagnost eingriff empfindlich entzuend epidemiolog express famili fap fein heredit hinsichtlich hnpcc immun indik iort itis karzin klin kolitis kolon kombin krank krohn lymph modal molekul multi non operation ordn osis pankreas pankreat periton polyp projekt prophylakt punkt resekt schwerpunkt stell suppress thema therap ueber ulzer versus zeit ziel zyt zytokin

9 Indexierung durch Subwort – Synonymklassen-IDs
qxxqky yxyqwx yyxqkx zzkqyz yyzqkq kkqkky qkqzzk yzxqkq qxqxkz qkqxkz kqxqqk kzzkqz yzqyyz yzkkzy xqkzqq yqqqkq xxzxqk zxkqqq qyyyzx kzxqkk kqkzzq kqqzkz yzqkqz zzqqzz yyyyyq kkqyzq qqkqzz kqkyzy yqqkkk kxyzqk zxqkyz kkzqxy qqkqkz zzyqkk yzxqkz yzzqyz zkqkyz zkqzzk yzqkqq qxxkzy qqxkzx qqkxxq zkqzqz yyyzyk ykzyqk xzqqqz qkqkqz zxqkyy xkqqqy yyyzxk zxqkkq qkzzqq kzkzqk yqkqzz zqqzzy yqqkzq kqyzqq qqzzkk kyzykq qkkkyq xyzqkq qkqkqy {entzuend; itis} {pankreas; pankreat; bauchspeicheldrues} {periton; bauchfell}

10 Evaluation Szenario 1 Szenario 2 0,65 0,65
Deutsch – Deutsch – Wortindex Englisch – Englisch – Wortbasierter Index 0,6 0,6 Deutsch – Deutsch – Subwort- Synonymklassen Deutsch – Englisch – Subwort- Synonymklassen 0,55 0,55 0,5 Deutsch – Englisch – Automatische Anfrageübersetzung 0,5 0,45 0,45 0,4 0,4 0,35 0,35 0,3 0,3 0,25 0,25 Precision Precision 0,2 0,2 0,15 0,15 0,1 0,1 0,05 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Recall Recall

11 Semantik findet auf mehreren Ebenen statt
Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Terminologie Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Ontologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Epistemologie

12 Erstellen von Domänenontologien
Terminologie Ontologie Erstellen von Domänenontologien Theorie der sprachlichen Zeichen Theorie der Realität - Synonymie, Homonymie - Kategorien - Oberbegriffe, Unterbegriffe - Axiome z.B.: {„ ulcus “, „ ulkus “, „ ulzer *“, z.B. materielles Objekt vs. Funktion ulcer *“, „ geschwür “, ….} vs. Prozess vs. Qualität „krebs“: Krankheit oder Tier Korpusmukosa = Mukosa + „blase“ : Harnblase oder Brandblase lokalisiert in =1 Magenkorpus Epistemologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ BioTop: Festlegung fixer Kategorien und Relationen für die Repräsentation grundlegender biomedizinischer Terme Axiomatische Fixierung von „Grundwahrheiten“, die in der medizinischen Wissenschaft und Praxis unumstritten sind und als „Trivialwissen“ wissensbasierten Anwendungen zur Verfügung gestellt werden Verwendung des Semantic-Web-Standards OWL

13 BioTop: Beispiel nach Klassifikation:

14 Einsatz von BioTop Als Top-Level-Ontologie in verschiedenen Projekten:
DebugIT (EU): institutionenübergreifende Identifikation von Patientenrisiken: semantische Queries (z.B. bei welchen Patienten wurde die Medikation auf Grund eines Antibiogramms geändert) NTDO: Strukturierung von Wissen über vernachlässigte tropische Erkrankungen z.B. Welcher Erreger kann in welcher geographischen Region durch welches Insekt übertragen werden Ontologie medizinischer Lernziele (Informationsobjekte!) Als Exempel für „Good Practice Ontology Design“ BioTop beschränkt stark die „Freiheit“ des Ontologieentwicklers Derzeit zusätzliche Ontology Design Patterns in Arbeit Empirische Studie zu Ontologiedesign mit Versuchspersonen geplant

15 Sicherung der Qualität von Domänenontologien (I)
Terminologie Ontologie Sicherung der Qualität von Domänenontologien (I) Theorie der sprachlichen Zeichen Theorie der Realität - Synonymie, Homonymie - Kategorien - Oberbegriffe, Unterbegriffe - Axiome z.B.: {„ ulcus “, „ ulkus “, „ ulzer *“, z.B. materielles Objekt vs. Funktion ulcer *“, „ geschwür “, ….} vs. Prozess vs. Qualität „krebs“: Krankheit oder Tier Korpusmukosa = Mukosa + „blase“ : Harnblase oder Brandblase lokalisiert in =1 Magenkorpus Epistemologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ SNOMED CT Riesige, zunehmend ontologiebasierte internationale Terminologie für die Beschreibung der Inhalte elektronischer Krankenakten Mitglied im Content Committee der IHTSDO und im IHTSDO-WHO-Beirat Aufgaben: Erstellung von Modellierungsrichtlinien, Formulierung von Übersetzungsrichtlinien, Sicherung ontologischer Korrektheit Harmonisierung SNOMED – WHO-Klassifikationen, z.B. bei der Erstellung von ICD-11

16 Sicherung der Qualität von Domänenontologien (II)
Terminologie Ontologie Sicherung der Qualität von Domänenontologien (II) Theorie der sprachlichen Zeichen Theorie der Realität - Synonymie, Homonymie - Kategorien - Oberbegriffe, Unterbegriffe - Axiome z.B.: {„ ulcus “, „ ulkus “, „ ulzer *“, z.B. materielles Objekt vs. Funktion ulcer *“, „ geschwür “, ….} vs. Prozess vs. Qualität „krebs“: Krankheit oder Tier Korpusmukosa = Mukosa + „blase“ : Harnblase oder Brandblase lokalisiert in =1 Magenkorpus Epistemologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ OBO (Open Biomedical Ontologies) Foundry Mitwirkung bei der Erstellung von Modellierungsprinzipien Qualitätschecks anhand von Stichproben: Chordin isoform 1 unmodified form subclassOf Chordin isoform 1 and lacks_modification some Post-translational protein modification Ureter_Small_Cell_Carcinoma subclassOf Disease_May_Have_Finding some Pain

17 Semantik findet auf mehreren Ebenen statt
Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Terminologie Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Ontologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Epistemologie

18 Ontologien und Terminologien im klinischen Kontext
Beispiel: automatische Kodierung von Inhalten der elektronischen Patientenakte mittels SNOMED CT Quelle: Entlassberichte aus Krankenhaus in Brasilien (portugiesisch) Ziel SNOMED CT (spanisch, englisch) Methode: NLP-Pipeline mit verschiedenen Verarbeitungsschritten, u.a. morphosemantische Indexierung

19 MID- Representation SNOMED CT
acronym expansion NE recognition spell checking POS tagging SCT - EN sentence detecting SCT - SP NP extraction subset creation Esto es el sistema de procesamiento de Natural Language que implementamos, (…) efectúa una abstracción context detection MID- Representation SNOMED CT morpho- semantic abstraction morpho- semantic abstraction MID- Representation Term candidates 19 19

20 Gold standard (kappa = 0.89)
20 20

21 Ergebnisse Total % 21 21

22 Fehleranalyse Category % Description Extraction of NPs 20
MorphoSaurus mapping 24 no mapping (1/3) false mapping (2/3) false context 36 60 % negation 40% other contexts spelling problems 4 acronym problems 1 other errors 15

23 Kontext 1 Ontologie, z.B. SNOMED CT aortic aneurysm acute abdomen multiple organ failure hemo dialysis vascular prosthesis CT abdomen systemic infection aneurysm- ectomy vasoactive drug death Patient admitted with acute abdomen. Abdominal CT: leaking abdominal aortic aneurism. Emergency aneurysmectomy with prosthesis. Postoperative evolution with systemic inflammatory response syndrome, multiple organ failure and hemodynamic instability. Despite application of vasoactive drugs, volume replacement and hemodialysis, the patient's condition worsened evolving to death. death

24 Kontext 2 Ontologie, z.B. SNOMED CT incisional hernia operation room liver transplant herniorrhaphy operation operation exists doesn’t exist reference to a plan reference to a suspended plan exists reference to a plan NOT referring to the same patient reference to a new plan not yet executed Patient with incisional hernia admitted for herniorrhaphy, but operation was suspended because operation room was urgently needed for liver transplant. Discharged with orientation and rescheduled operation.

25 Automatisches vs. Manuelles Kodieren
high motivation enough time Quality fair motivation low motivation Volume

26 Automatisches vs. Manuelles Kodieren
high motivation enough time ? Quality fair motivation low motivation Volume

27 Beantragte / geplante Projekte
Eingereicht: EU – NoE SemanticHealthNet: Harmonisierung semantischer EHR – Standards CEHRTAIN (IP): Prototyp sprachübergreifender EHR-Interoperabilität RealEH: Semantische Aufarbeitung der elektronischen Krankenakte zur Sekundärnutzung In Vorbereitung (gemeinsam mit JR + Averbis): Ö-Bridge und EU-SME – Antrag zu EHR – Retrieval + Summarization In Vorbereitung (gemeinsam mit Averbis + IHTSDO): Terminology Services / Cloud Computing

28 Auf purl.org/steschu Links zu Präsentationen und Publikationen


Herunterladen ppt "Forschungsschwerpunkt Biomedizinische Semantik"

Ähnliche Präsentationen


Google-Anzeigen