Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011.

Ähnliche Präsentationen


Präsentation zum Thema: "Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011."—  Präsentation transkript:

1 Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI,

2 Grundannahmen Informationen in medizinischer Praxis und klinischer Wissenschaft werden kommuniziert: – vor allem anderen: in freitextlicher Form – strukturiert, aber mit proprietären Attributen / Werten (z.B. Archimed) – strukturiert mit standardisierten Werten – strukturiert mit numerischen Werten – als Biosignale Symbole (Zeichen) haben Bedeutungen – Symbole repräsentieren Denkeinheiten (Begriffe) – Zumeist Korrelate zu Objekten einer realen Welt – Interpretation des Benutzerkontextes fundamental

3 Ziel: Semantische Interoperabilität Kommunikation ohne Bedeutungsverlust / -verzerrung: Vielfältige Probleme: A1 möchte alle Patienten mit Magenulkus (K25) zählen, aber A2 hat auch die Patienten mit Verdacht auf Magenulkus mit ICD-10:K25 kodiert. Magenulkus ist eine nicht kodierte Nebendiagnose. Freitextsuche nach „Magenulkus“ findet nicht Texte mit „Magenulcus“ Suche auch erfolgreich bei Arztbriefen mit – „Magenulkus“in der Familienanamnese steht – „Der Patient bekam Omeprazol zur Prophylaxe eines Magenulkus Gastroskopieberichte mit „keine Ulzera“, „Ulzera können nicht ausgeschlossesn werden“ – Negation erkannt? – Magenulkus ausgeschlossen? Was ist mit „Stressulcus im Corpusbereich“ ? – Verarbeitung auf lexikalischer, semantischer und ontologischer Ebene

4 Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Semantik findet auf mehreren Ebenen statt

5 Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ TerminologieOntologie Epistemologie Semantik findet auf mehreren Ebenen statt

6 Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ TerminologieOntologie Epistemologie Semantik findet auf mehreren Ebenen statt

7 Wortfragment- basierte Dokumenten- indexierung Identifikation kleinster bedeutungstragender Elemente der Medizinsprache: Wortfragmente („subwords“) Gruppierung bedeutungstragender Wortfragmente Erstellung eines Subword-Thesaurus Nachweis des Vorteils bei sprachinternem und sprachübergreifenden Dokumentenretrieval Theorie der sprachlichen Zeichen -Synonymie, Homonymie -Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität -Kategorien -Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B„Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ TerminologieOntologie Epistemologie

8 Indexierung durch Wortfragmente abdomin adenom akut analys antibiot ausmass basis biolog blut chirurg chroni darm daten diagnost eingriff empfindlich entzuend epidemiolog express famili fap fein heredit hinsichtlich hnpcc immun indik iort itis karzin klin kolitis kolon kombin krank krohn lymph modal molekul multi non operation ordn osis pankreas pankreat periton polyp projekt prophylakt punkt resekt schwerpunkt stell suppress thema therap ueber ulzer versus zeit ziel zyt zytokin

9 Indexierung durch Subwort – Synonymklassen-IDs qxxqky yxyqwx yyxqkx zzkqyz yyzqkq kkqkky qkqzzk yzxqkq qxqxkz qkqxkz kqxqqk kzzkqz yzqyyz yzkkzy xqkzqq yqqqkq xxzxqk zxkqqq qyyyzx kzxqkk kqkzzq kqqzkz yzqkqz zzqqzz yyyyyq kkqyzq qqkqzz kqkyzy yqqkkk kxyzqk zxqkyz kkzqxy qqkqkz zzyqkk yzxqkz yzzqyz yyzqkq zkqkyz zkqzzk yzqkqq qxxkzy qqxkzx qqkxxq zkqzqz yyyzyk ykzyqk xzqqqz qkqkqz zxqkyy xkqqqy yyyzxk zxqkkq qkzzqq kzkzqk yqkqzz zqqzzy yqqkzq kqyzqq qqzzkk kyzykq qkkkyq xyzqkq qkqkqy {entzuend; itis} {pankreas; pankreat; bauchspeicheldrues} {periton; bauchfell}

10 Evaluation 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 00,10,20,30,40,50,60,70,80,91 Recall Precision Deutsch – Deutsch – Wortindex Deutsch – Deutsch – Subwort- Synonymklassen 0,5 0,55 0,6 0,65 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 00,10,20,30,40,50,60,70,80,91 Recall Precision Englisch – Englisch – Wortbasierter Index Deutsch – Englisch – Subwort- Synonymklassen Deutsch – Englisch – Automatische Anfrageübersetzung 0,5 0,55 0,6 0,65 Szenario 1 Szenario 2

11 Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ TerminologieOntologie Epistemologie Semantik findet auf mehreren Ebenen statt

12 Erstellen von Domänenontologien BioTop: – Festlegung fixer Kategorien und Relationen für die Repräsentation grundlegender biomedizinischer Terme – Axiomatische Fixierung von „Grundwahrheiten“, die in der medizinischen Wissenschaft und Praxis unumstritten sind und als „Trivialwissen“ wissensbasierten Anwendungen zur Verfügung gestellt werden – Verwendung des Semantic-Web-Standards OWL Theorie der sprachlichen Zeichen -Synonymie, Homonymie -Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität -Kategorien -Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B„Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ TerminologieOntologie Epistemologie

13 BioTop: Beispiel nach Klassifikation:

14 Einsatz von BioTop Als Top-Level-Ontologie in verschiedenen Projekten: – DebugIT (EU): institutionenübergreifende Identifikation von Patientenrisiken: semantische Queries (z.B. bei welchen Patienten wurde die Medikation auf Grund eines Antibiogramms geändert) – NTDO: Strukturierung von Wissen über vernachlässigte tropische Erkrankungen z.B. Welcher Erreger kann in welcher geographischen Region durch welches Insekt übertragen werden – Ontologie medizinischer Lernziele (Informationsobjekte!) Als Exempel für „Good Practice Ontology Design“ – BioTop beschränkt stark die „Freiheit“ des Ontologieentwicklers – Derzeit zusätzliche Ontology Design Patterns in Arbeit – Empirische Studie zu Ontologiedesign mit Versuchspersonen geplant

15 Sicherung der Qualität von Domänenontologien (I) SNOMED CT – Riesige, zunehmend ontologiebasierte internationale Terminologie für die Beschreibung der Inhalte elektronischer Krankenakten – Mitglied im Content Committee der IHTSDO und im IHTSDO- WHO-Beirat Aufgaben: Erstellung von Modellierungsrichtlinien, Formulierung von Übersetzungsrichtlinien, Sicherung ontologischer Korrektheit Harmonisierung SNOMED – WHO-Klassifikationen, z.B. bei der Erstellung von ICD-11 Theorie der sprachlichen Zeichen -Synonymie, Homonymie -Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität -Kategorien -Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B„Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ TerminologieOntologie Epistemologie

16 Sicherung der Qualität von Domänenontologien (II) OBO (Open Biomedical Ontologies) Foundry – Mitwirkung bei der Erstellung von Modellierungsprinzipien – Qualitätschecks anhand von Stichproben: Chordin isoform 1 unmodified form subclassOf Chordin isoform 1 and lacks_modification some Post-translational protein modification Ureter_Small_Cell_Carcinoma subclassOf Disease_May_Have_Finding some Pain Theorie der sprachlichen Zeichen -Synonymie, Homonymie -Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität -Kategorien -Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B„Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ TerminologieOntologie Epistemologie

17 Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ TerminologieOntologie Epistemologie Semantik findet auf mehreren Ebenen statt

18 Ontologien und Terminologien im klinischen Kontext Beispiel: automatische Kodierung von Inhalten der elektronischen Patientenakte mittels SNOMED CT Quelle: Entlassberichte aus Krankenhaus in Brasilien (portugiesisch) Ziel SNOMED CT (spanisch, englisch) Methode: NLP-Pipeline mit verschiedenen Verarbeitungsschritten, u.a. morphosemantische Indexierung

19 sentence detecting spell checking acronym expansion NE recognition POS tagging NP extraction context detection morpho- semantic abstraction SCT - EN SCT - SP subset creation morpho- semantic abstraction MID- Representation SNOMED CT MID- Representation Term candidates

20 Gold standard (kappa = 0.89)

21 Ergebnisse Total 78 %

22 Fehleranalyse Category%Description Extraction of NPs20 MorphoSaurus mapping 24 no mapping (1/3) false mapping (2/3) false context36 60 % negation 40% other contexts spelling problems4 acronym problems1 other errors15

23 Kontext 1 death acute abdomen CT abdomen aortic aneurysm aneurysm- ectomy vascular prosthesis systemic infection multiple organ failure vasoactiv e drug hemo dialysis Patient admitted with acute abdomen. Abdominal CT: leaking abdominal aortic aneurism. Emergency aneurysmectomy with prosthesis. Postoperative evolution with systemic inflammatory response syndrome, multiple organ failure and hemodynamic instability. Despite application of vasoactive drugs, volume replacement and hemodialysis, the patient's condition worsened evolving to death. death Ontologie, z.B. SNOMED CT

24 Kontext 2 incisional hernia herniorrhaphy operation room liver transplant operation exists doesn’t exist reference to a plan operation reference to a suspended plan exists reference to a plan NOT referring to the same patient reference to a new plan not yet executed Patient with incisional hernia admitted for herniorrhaphy, but operation was suspended because operation room was urgently needed for liver transplant. Discharged with orientation and rescheduled operation. Ontologie, z.B. SNOMED CT

25 Automatisches vs. Manuelles Kodieren Quality Volume fair motivation low motivation high motivation enough time

26 Automatisches vs. Manuelles Kodieren Quality Volume fair motivation low motivation high motivation enough time ?

27 Beantragte / geplante Projekte Eingereicht: – EU – NoE SemanticHealthNet: Harmonisierung semantischer EHR – Standards – CEHRTAIN (IP): Prototyp sprachübergreifender EHR- Interoperabilität – RealEH: Semantische Aufarbeitung der elektronischen Krankenakte zur Sekundärnutzung In Vorbereitung (gemeinsam mit JR + Averbis): Ö-Bridge und EU-SME – Antrag zu EHR – Retrieval + Summarization In Vorbereitung (gemeinsam mit Averbis + IHTSDO): Terminology Services / Cloud Computing

28 Auf purl.org/steschu Links zu Präsentationen und Publikationen


Herunterladen ppt "Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011."

Ähnliche Präsentationen


Google-Anzeigen