Forschungsschwerpunkt Biomedizinische Semantik

Slides:



Advertisements
Ähnliche Präsentationen
Eine Grundlage zum Unternehmenserfolg? Master-Thesis
Advertisements

Ontology Tools II Jan Polowinski
Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Pop Jazz C B A Jazz C A Lehrstuhl für Künstliche Intelligenz
Diagnose, Prävention und Therapie des postoperativen Psychosyndroms und des Delirs im Alter , 3. Medizinisch-Psychiatrisches Colloquium, Hildesheim.
Maschinelle Lernverfahren für IE und TM 1 Topic Detection.
Faxtechnologie in VoIP-Netzen.
ELearning – The Next Five Years AIFB Rudi Studer Learning Lab Lower Saxony Institute AIFB, University of Karlsruhe
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
TU- Dresden Dipl. Psych. Jenny Krist Prof. Dr. Hermann Körndle
DEPARTMENT FÜR INFORMATIK
„Netzwerk Medizin und Geschlecht“ an der Medizinischen Hochschule Hannover Projektleitung: Dr. phil. Bärbel Miemietz Projektkoordination: Larissa Burruano,
Individualisierte Medizin am Inselspital Genetik und Perioperative Medizin.
Wissensmanagement mit semantischen Netzen – Analyse und Vergleich verschiedener Softwarelösungen Autor: Holger Wilhelm Referentin: Prof. Dr. Uta Störl.
Risiken und Chancen Risiko Beurteilung: Dazu gehört die Identifikationen von Risiken, ihre Analyse und das Ordnen nach Prioritäten. Risiko Kontrolle: Dazu.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.
WIESEL – Integration von Wissensmanagement und E-Learning auf der Basis von Semantic Web Technologien Matthias Rust, XML-Tage 2004, Berlin WIESEL Integration.
Wissensbasierte Daten- interpretation für einen automatisierten und adaptiven Inhaltsintegrationsprozeß Lyndon J B Nixon
Magnus Niemann Strukturierung von Topic Maps.
Jan Fienhold1 Institut für Informatik Betriebliche Informationssysteme OWL Web Ontology Language.
MMQL – Multimedia Query Language Eine Anfragesprache für Multimedia-Ähnlichkeitsanfragen Christian Mantei.
How much paternal resemblance is enough? Sex differencies in hypothetical investment decisions but not in the detection of resemblance Platek, Critton,
Stefan Schulz, Susanne Hanser, Rüdiger Klar
GMDS-Jahrestagung 2005, Freiburg Mittwoch, 14. September 2005
GALEN Claudia Bärthel Inhalt Was ist GALEN? –Entwicklung –Komponenten Top Level Ontologie –Category Ontologie –Attribute Ontologie.
Diskussion Fundamentalkategorien nach Aristoteles Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2005/06 Diskusion Fundamentalkategorien.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Entitäten Extraktion Einführung
Entwicklung standardorientierter Aufgaben – am Beispiel naturwissenschaftliche Erkenntnisgewinnung Jürgen Mayer.
Fuzzy-Systeme AS2-6.
Ontologien und DAML+OIL
Automatic composition of UI mashups Vortrag zum Seminar Webengineering 2011 Michael Reißner.
Projekte lösungs"agil" planen und managen
Projekte "agil" planen und managen
Java für Fortgeschrittene
WebML for Semantic Web Michael Hertel.
Hauptseminar Web Engineering – Semantic Web Dominik Pretzsch.
Erfindervon Fuzzy Logic
Abteilung Medizinische Informatik, Universitätsklinikum Freiburg
CEF 2001, New Haven Genetic Neural Fuzzy Explorer GENEFER Konzeption, Technologien und Einsatzmöglichkeiten Eric Ringhut Muenster Institute for Computational.
Arbeitsgruppe Medizinische Informatik Stefan Schulz.
Einführung in die klinische Medizin
XML (Extensible Markup Language)
Feedback from WWW )18-22 mai )sheraton hotel and towers congress center, new york city, USA 3)keine teilnehmerliste, meine schätzung: ca.
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
Plötzlicher Herztod – Definition (I)
Wirtschaftsforum, 12. Oktober 2004 Die Technologieinitiative XML Condat AG Die Condat AG ist ein Software- und Systemhaus, das die Geschäftsprozesse seiner.
Untersuchungen zur Erstellung eines
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
Software Engineering Grundlagen
Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München,
© Copyright SEMCARE Consortium Kurzpräsentation für Vollversammlung MUG-IMI, Stefan Schulz, Markus Kreuzthaler Semantic Data Platform.
Eike Schallehn, Martin Endig
Morphosaurus Statusreport Mai Grundidee Semantische Indexierung von medizinischern Dokumenten Verbesserung des Dokumentenretrievals Unterstützung.
AP3 Informationsmodell
Semantic Interoperability for Health Network of Excellence 7. März 2012 Stefan Schulz, Catalina Martínez-Costa Institut für Medizinische Informatik, Statistik.
Die Geschichte der Entwicklung der Informations-Technologie
IBMI - Medis Meeting ByMedConnect AP2 Anwendungsszenarien und Datenelemente - Datensatz Neuherberg,
Informationsmodell: ISO 13606
KickOff - Meeting EPA-Navi Navigation in der elektronischen Patientienakte Teilnehmer: KaGES : Markus Pedevilla, Averbis GmbH: Philipp Daumke, MUG-IMI:
AP3 – Informationsmodell ByMedConnect Archetypen Hans Demski Helmholtz Zentrum München Arbeitsgruppe MEDIS Institut für Medizinsche und Biologische Bildgebung.
Semantic Web.
Lexit.at Michael Hausenblas Semantische Darstellung und Abfrage von Rechtsnormen – IRIS 2004 Semantische Darstellung und Abfrage von Rechtsnormen am Beispiel.
Digitale Annotationen. Grundlage: John Bradley “Towards a Richer Sense of Digital Annotation: Moving Beyond a Media Orientation of the Annotation of Digital.
Die Übersetzung von “Diskursdialekten” für die Suche: Das Mapping zwischen Fachsprachen und Indexierungssprachen Vivien Petras Vortrag im Berliner Bibliothekswissenschaftlichen.
Standortbestimmung und Perspektiven der Medizinischen Informatik als Wissenschaftliche Disziplin Stefan Schulz Arbeitsgruppe Medizinische Informatik.
Abteilung Medizinische Informatik, Universitätsklinikum Freiburg
WISSENSREPRÄSENTATION IN ACTIVEMATH Theoretische Grundlagen – Teil 1.
 Präsentation transkript:

Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Grundannahmen Informationen in medizinischer Praxis und klinischer Wissenschaft werden kommuniziert: vor allem anderen: in freitextlicher Form strukturiert, aber mit proprietären Attributen / Werten (z.B. Archimed) strukturiert mit standardisierten Werten strukturiert mit numerischen Werten als Biosignale Symbole (Zeichen) haben Bedeutungen Symbole repräsentieren Denkeinheiten (Begriffe) Zumeist Korrelate zu Objekten einer realen Welt Interpretation des Benutzerkontextes fundamental

Ziel: Semantische Interoperabilität Kommunikation ohne Bedeutungsverlust / -verzerrung: Vielfältige Probleme: A1 möchte alle Patienten mit Magenulkus (K25) zählen, aber A2 hat auch die Patienten mit Verdacht auf Magenulkus mit ICD-10:K25 kodiert. Magenulkus ist eine nicht kodierte Nebendiagnose. Freitextsuche nach „Magenulkus“ findet nicht Texte mit „Magenulcus“ Suche auch erfolgreich bei Arztbriefen mit „Magenulkus“in der Familienanamnese steht „Der Patient bekam Omeprazol zur Prophylaxe eines Magenulkus Gastroskopieberichte mit „keine Ulzera“, „Ulzera können nicht ausgeschlossesn werden“ Negation erkannt? Magenulkus ausgeschlossen? Was ist mit „Stressulcus im Corpusbereich“ ? Verarbeitung auf lexikalischer, semantischer und ontologischer Ebene

Semantik findet auf mehreren Ebenen statt Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Semantik findet auf mehreren Ebenen statt Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Terminologie Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Ontologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Epistemologie

Semantik findet auf mehreren Ebenen statt Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Terminologie Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Ontologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Epistemologie

Wortfragment-basierte Dokumenten-indexierung Terminologie Ontologie Wortfragment-basierte Dokumenten-indexierung • Theorie der sprachlichen Zeichen • Theorie der Realität - Synonymie, Homonymie - Kategorien - Oberbegriffe, Unterbegriffe - Axiome • z.B.: {„ ulcus “, „ ulkus “, „ ulzer *“, • z.B. materielles Objekt vs. Funktion „ ulcer *“, „ geschwür “, ….} vs. Prozess vs. Qualität „krebs“: Krankheit oder Tier Korpusmukosa = Mukosa + „blase“ : Harnblase oder Brandblase lokalisiert in =1 Magenkorpus Epistemologie • Theorie des Wissens • Nichtwissen, unsicheres Wissen • Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Identifikation kleinster bedeutungstragender Elemente der Medizinsprache: Wortfragmente („subwords“) Gruppierung bedeutungstragender Wortfragmente Erstellung eines Subword-Thesaurus Nachweis des Vorteils bei sprachinternem und sprachübergreifenden Dokumentenretrieval

Indexierung durch Wortfragmente abdomin adenom akut analys antibiot ausmass basis biolog blut chirurg chroni darm daten diagnost eingriff empfindlich entzuend epidemiolog express famili fap fein heredit hinsichtlich hnpcc immun indik iort itis karzin klin kolitis kolon kombin krank krohn lymph modal molekul multi non operation ordn osis pankreas pankreat periton polyp projekt prophylakt punkt resekt schwerpunkt stell suppress thema therap ueber ulzer versus zeit ziel zyt zytokin

Indexierung durch Subwort – Synonymklassen-IDs qxxqky yxyqwx yyxqkx zzkqyz yyzqkq kkqkky qkqzzk yzxqkq qxqxkz qkqxkz kqxqqk kzzkqz yzqyyz yzkkzy xqkzqq yqqqkq xxzxqk zxkqqq qyyyzx kzxqkk kqkzzq kqqzkz yzqkqz zzqqzz yyyyyq kkqyzq qqkqzz kqkyzy yqqkkk kxyzqk zxqkyz kkzqxy qqkqkz zzyqkk yzxqkz yzzqyz zkqkyz zkqzzk yzqkqq qxxkzy qqxkzx qqkxxq zkqzqz yyyzyk ykzyqk xzqqqz qkqkqz zxqkyy xkqqqy yyyzxk zxqkkq qkzzqq kzkzqk yqkqzz zqqzzy yqqkzq kqyzqq qqzzkk kyzykq qkkkyq xyzqkq qkqkqy {entzuend; itis} {pankreas; pankreat; bauchspeicheldrues} {periton; bauchfell}

Evaluation Szenario 1 Szenario 2 0,65 0,65 Deutsch – Deutsch – Wortindex Englisch – Englisch – Wortbasierter Index 0,6 0,6 Deutsch – Deutsch – Subwort- Synonymklassen Deutsch – Englisch – Subwort- Synonymklassen 0,55 0,55 0,5 Deutsch – Englisch – Automatische Anfrageübersetzung 0,5 0,45 0,45 0,4 0,4 0,35 0,35 0,3 0,3 0,25 0,25 Precision Precision 0,2 0,2 0,15 0,15 0,1 0,1 0,05 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Recall Recall

Semantik findet auf mehreren Ebenen statt Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Terminologie Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Ontologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Epistemologie

Erstellen von Domänenontologien Terminologie Ontologie Erstellen von Domänenontologien • Theorie der sprachlichen Zeichen • Theorie der Realität - Synonymie, Homonymie - Kategorien - Oberbegriffe, Unterbegriffe - Axiome • z.B.: {„ ulcus “, „ ulkus “, „ ulzer *“, • z.B. materielles Objekt vs. Funktion „ ulcer *“, „ geschwür “, ….} vs. Prozess vs. Qualität „krebs“: Krankheit oder Tier Korpusmukosa = Mukosa + „blase“ : Harnblase oder Brandblase lokalisiert in =1 Magenkorpus Epistemologie • Theorie des Wissens • Nichtwissen, unsicheres Wissen • Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ BioTop: Festlegung fixer Kategorien und Relationen für die Repräsentation grundlegender biomedizinischer Terme Axiomatische Fixierung von „Grundwahrheiten“, die in der medizinischen Wissenschaft und Praxis unumstritten sind und als „Trivialwissen“ wissensbasierten Anwendungen zur Verfügung gestellt werden Verwendung des Semantic-Web-Standards OWL

BioTop: Beispiel nach Klassifikation:

Einsatz von BioTop Als Top-Level-Ontologie in verschiedenen Projekten: DebugIT (EU): institutionenübergreifende Identifikation von Patientenrisiken: semantische Queries (z.B. bei welchen Patienten wurde die Medikation auf Grund eines Antibiogramms geändert) NTDO: Strukturierung von Wissen über vernachlässigte tropische Erkrankungen z.B. Welcher Erreger kann in welcher geographischen Region durch welches Insekt übertragen werden Ontologie medizinischer Lernziele (Informationsobjekte!) Als Exempel für „Good Practice Ontology Design“ BioTop beschränkt stark die „Freiheit“ des Ontologieentwicklers Derzeit zusätzliche Ontology Design Patterns in Arbeit Empirische Studie zu Ontologiedesign mit Versuchspersonen geplant

Sicherung der Qualität von Domänenontologien (I) Terminologie Ontologie Sicherung der Qualität von Domänenontologien (I) • Theorie der sprachlichen Zeichen • Theorie der Realität - Synonymie, Homonymie - Kategorien - Oberbegriffe, Unterbegriffe - Axiome • z.B.: {„ ulcus “, „ ulkus “, „ ulzer *“, • z.B. materielles Objekt vs. Funktion „ ulcer *“, „ geschwür “, ….} vs. Prozess vs. Qualität „krebs“: Krankheit oder Tier Korpusmukosa = Mukosa + „blase“ : Harnblase oder Brandblase lokalisiert in =1 Magenkorpus Epistemologie • Theorie des Wissens • Nichtwissen, unsicheres Wissen • Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ SNOMED CT Riesige, zunehmend ontologiebasierte internationale Terminologie für die Beschreibung der Inhalte elektronischer Krankenakten Mitglied im Content Committee der IHTSDO und im IHTSDO-WHO-Beirat Aufgaben: Erstellung von Modellierungsrichtlinien, Formulierung von Übersetzungsrichtlinien, Sicherung ontologischer Korrektheit Harmonisierung SNOMED – WHO-Klassifikationen, z.B. bei der Erstellung von ICD-11

Sicherung der Qualität von Domänenontologien (II) Terminologie Ontologie Sicherung der Qualität von Domänenontologien (II) • Theorie der sprachlichen Zeichen • Theorie der Realität - Synonymie, Homonymie - Kategorien - Oberbegriffe, Unterbegriffe - Axiome • z.B.: {„ ulcus “, „ ulkus “, „ ulzer *“, • z.B. materielles Objekt vs. Funktion „ ulcer *“, „ geschwür “, ….} vs. Prozess vs. Qualität „krebs“: Krankheit oder Tier Korpusmukosa = Mukosa + „blase“ : Harnblase oder Brandblase lokalisiert in =1 Magenkorpus Epistemologie • Theorie des Wissens • Nichtwissen, unsicheres Wissen • Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ OBO (Open Biomedical Ontologies) Foundry Mitwirkung bei der Erstellung von Modellierungsprinzipien Qualitätschecks anhand von Stichproben: Chordin isoform 1 unmodified form subclassOf Chordin isoform 1 and lacks_modification some Post-translational protein modification Ureter_Small_Cell_Carcinoma subclassOf Disease_May_Have_Finding some Pain

Semantik findet auf mehreren Ebenen statt Theorie der sprachlichen Zeichen - Synonymie, Homonymie - Oberbegriffe, Unterbegriffe z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier „blase“ : Harnblase oder Brandblase Terminologie Theorie der Realität - Kategorien - Axiome z.B. materielles Objekt vs. Funktion vs. Prozess vs. Qualität Korpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus Ontologie Theorie des Wissens Nichtwissen, unsicheres Wissen Kontexte z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“ Epistemologie

Ontologien und Terminologien im klinischen Kontext Beispiel: automatische Kodierung von Inhalten der elektronischen Patientenakte mittels SNOMED CT Quelle: Entlassberichte aus Krankenhaus in Brasilien (portugiesisch) Ziel SNOMED CT (spanisch, englisch) Methode: NLP-Pipeline mit verschiedenen Verarbeitungsschritten, u.a. morphosemantische Indexierung

MID- Representation SNOMED CT acronym expansion NE recognition spell checking POS tagging SCT - EN sentence detecting SCT - SP NP extraction subset creation Esto es el sistema de procesamiento de Natural Language que implementamos, (…) efectúa una abstracción context detection MID- Representation SNOMED CT morpho- semantic abstraction morpho- semantic abstraction MID- Representation Term candidates 19 19

Gold standard (kappa = 0.89) 20 20

Ergebnisse Total 78 % 21 21

Fehleranalyse Category % Description Extraction of NPs 20 MorphoSaurus mapping 24 no mapping (1/3) false mapping (2/3) false context 36 60 % negation 40% other contexts spelling problems 4 acronym problems 1 other errors 15

Kontext 1 Ontologie, z.B. SNOMED CT aortic aneurysm acute abdomen multiple organ failure hemo dialysis vascular prosthesis CT abdomen systemic infection aneurysm- ectomy vasoactive drug death Patient admitted with acute abdomen. Abdominal CT: leaking abdominal aortic aneurism. Emergency aneurysmectomy with prosthesis. Postoperative evolution with systemic inflammatory response syndrome, multiple organ failure and hemodynamic instability. Despite application of vasoactive drugs, volume replacement and hemodialysis, the patient's condition worsened evolving to death. death

Kontext 2 Ontologie, z.B. SNOMED CT incisional hernia operation room liver transplant herniorrhaphy operation operation exists doesn’t exist reference to a plan reference to a suspended plan exists reference to a plan NOT referring to the same patient reference to a new plan not yet executed Patient with incisional hernia admitted for herniorrhaphy, but operation was suspended because operation room was urgently needed for liver transplant. Discharged with orientation and rescheduled operation.

Automatisches vs. Manuelles Kodieren high motivation enough time Quality fair motivation low motivation Volume

Automatisches vs. Manuelles Kodieren high motivation enough time ? Quality fair motivation low motivation Volume

Beantragte / geplante Projekte Eingereicht: EU – NoE SemanticHealthNet: Harmonisierung semantischer EHR – Standards CEHRTAIN (IP): Prototyp sprachübergreifender EHR-Interoperabilität RealEH: Semantische Aufarbeitung der elektronischen Krankenakte zur Sekundärnutzung In Vorbereitung (gemeinsam mit JR + Averbis): Ö-Bridge und EU-SME – Antrag zu EHR – Retrieval + Summarization In Vorbereitung (gemeinsam mit Averbis + IHTSDO): Terminology Services / Cloud Computing

Auf purl.org/steschu Links zu Präsentationen und Publikationen