Stefan Schulz Medizinische Universität Graz purl.org/steschu

Slides:



Advertisements
Ähnliche Präsentationen
ENTITLE Jana Sommeregger Folie 1 EU-Projekt ENTITLE Vorstellung Graz,
Advertisements

Chancen und Risken für KMU bei EU Förderungen
Inkrementelle Entwicklung von virtuellen Kooperationsstrukturen
GESIS Bernd Hermes, Heiko Hellweg, Dr. Maximilian Stempfhuber Informationszentrum Sozialwissenschaften, Bonn Unterstützung kooperativer Verfahren beim.
Steinbeis Forschungsinstitut für solare und zukunftsfähige thermische Energiesysteme Nobelstr. 15 D Stuttgart WP 4 Developing SEC.
eine Plattform für annotierte Korpora in XML
RUP-Elemente (Schlüsselkonzepte)
High Quality Subject Gateway Göttingen State and University Library, Germany (SUB) Dr. Heike Neuroth The Academic Subject.
Renardus The Academic Subject Gateway in Europe Nationalbibliotheken und nationale Dienste – Interoperabilität mit Subject Gateways Christel Hengel.
Text-Retrieval mit Oracle Vortrag von Andreas Mück & David Diestel.
Hauptseminar Verteilte Systeme im Gesundheitswesen - Gesundheitstelematik Sommersemester 2007 Telematik im Gesundheitswesen: Überblick und Entwicklungsperspektiven.
Die Referenzterminologie "SNOMED CT" und ihre Anwendungen
Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.
UML Begleitdokumentation des Projekts
ELearning-Innovationen für den modernen Fremdsprachenunterricht STZ Sprachlernmedien The BACKBONE project has been funded with support by the EU Lifelong.
The Project is partly funded by the European Commission eTEN Programme euromuse.net training for use of Harmonise euromuse.net Das Harmonise-Interface.
Automatic composition of UI mashups Vortrag zum Seminar Webengineering 2011 Michael Reißner.
Telematikplattform für Medizinische Forschungsnetze (TMF) e.V. Clinical Metadata Repository 4th German CDISC User Group Berlin, Thursday, 19 February 2009.
- 1 Förderprogramm eTEN Call Mai bis 10. September 2003.
Bernd-Kristian Kaczenski Humboldt-Universität zu Berlin
Arbeitsgruppe Medizinische Informatik Stefan Schulz.
1 von 7 ViS:AT BMUKK, IT – Systeme für Unterrichtszwecke 05/11 EZ, CR Social Networks – Soziale Netzwerke Virtuelle Science Cafes & Diskussionsforen für.
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
ProjektUniRegio Ausgewählte Ergebnisse Rolle der Hochschulen für die Regionalentwicklung der Vienna Region Mag a Christine Gamper.
LAURIN 12. Dez – Regionaler InformationstagGünter Mühlberger.
Hotel Wellness Restaurant Kino SiTec Group … the Front Office Company.
Megatrends und deren Anknüpfungspunkte in der Steiermark
© Copyright SEMCARE Consortium Kurzpräsentation für Vollversammlung MUG-IMI, Stefan Schulz, Markus Kreuzthaler Semantic Data Platform.
AP3 Informationsmodell
Semantic Interoperability for Health Network of Excellence 7. März 2012 Stefan Schulz, Catalina Martínez-Costa Institut für Medizinische Informatik, Statistik.
IBMI - Medis Meeting ByMedConnect AP2 Anwendungsszenarien und Datenelemente - Datensatz Neuherberg,
Informationsmodell: ISO 13606
Entwicklungsstand von SNOMED CT Internationale Anwendungen
AP3 – Informationsmodell ByMedConnect Archetypen Hans Demski Helmholtz Zentrum München Arbeitsgruppe MEDIS Institut für Medizinsche und Biologische Bildgebung.
MareNet Marine Research Institutions & Documents Worldwide Ein elektronischer Informationsdienst für die Meeresforschung Michael Hohlfeld, Institute for.
Standortbestimmung und Perspektiven der Medizinischen Informatik als Wissenschaftliche Disziplin Stefan Schulz Arbeitsgruppe Medizinische Informatik.
Physik multimedial Lehr- und Lernmodule für das Studium der Physik als Nebenfach Julika Mimkes: Links to e-learning content for.
KLIMA SUCHT SCHUTZ EINE KAMPAGNE GEFÖRDERT VOM BUNDESUMWELTMINISTERIUM Co2 online.
Gregor Graf Oracle Portal (Part of the Oracle Application Server 9i) Gregor Graf (2001,2002)
EUROPÄISCHE GEMEINSCHAFT Europäischer Sozialfonds EUROPÄISCHE GEMEINSCHAFT Europäischer Fonds für Regionale Entwicklung Workpackage 5 – guidelines Tasks.
EUROPÄISCHE GEMEINSCHAFT Europäischer Sozialfonds EUROPÄISCHE GEMEINSCHAFT Europäischer Fonds für Regionale Entwicklung Workpackage 5 – guidelines Tasks.
ELP-TT Training teachers to use the European Language Portfolio Short-term project ELP_TT2 Heike Speitz, Norway.
"Pat. mit rez. HWI und VUR" Die Herausforderung medizinischer Terminologie und Semantik Stefan Schulz, Institut für Medizinische Informatik, Statistik.
SOCIAL MEDIA MONITORING
Beschriftung: Labels und Annotationen
Text Mining deutscher medizinischer Texte
Scientific Reasoning in Medical Education
Jakarta Struts Quasi-Standard für JSP-basierte Entwicklung: Jakarta Struts Key Features von Struts: Implementierung des Action-Command-Pattern („Model.
Deutsch 1 Die Familie Frau Spampinato
Aspect-Oriented Programming: Fad or the Future
Datenaustausch-Standard für innovative IT-Lösungen im Gesundheitswesen
Chancen und Risken für KMU bei EU Förderungen
Hypertext 2015/2016.
Merging Jira – Das Unmögliche möglich machen Michael Lüer (ACP) Sönke Martens (ACP) catworkx GmbH
Im Kleidungsgeschäft (1)
Differenzierungsangebot BEE
Stefan Schulz Medizinische Universität Graz
Ontologien als Standards
Stefan Schulz Medizinische Universität Graz
Die Bedeutung von Ontologien für die Integration medizinischer Daten
Stefan Schulz Medizinische Universität Graz
Wozu SNOMED CT zur Datenintegration in MIRACUM?
Interface-Terminologien und Referenzterminologien Stefan Schulz Medizinische Universität Graz Josef Ingenerf Universität zu Lübeck.
ESciDoc München, 4. Juli 2007.
Measurable Objectives: By the end of the lesson, all learners will be able to - read property descriptions - use prepositions with the dative case.
Programmiermethodik Übung 7
Übersetzungsorientierte Terminologiearbeit am Europäischen Parlament
M. Dreyer Göttingen, 12. Sept. 2007
INDICATIVE ROADMAP CO-CREATION OUTREACH TRAINING MID 2020
Angelika Widhalm, Vorsitzende
 Präsentation transkript:

Ressourcen und Strategien für die sinnvolle Nutzung von SNOMED CT im deutschsprachigen Raum Stefan Schulz Medizinische Universität Graz purl.org/steschu Jahrestagung 14.3.2018

SNOMED CT – Universelle Medizinsprache?

SNOMED CT – "Steckbrief" Terminologie für die elektronische Krankenakte Internationaler Standard (SNOMED international), in über 50 Ländern eingesetzt Ca. 300.000 "Konzepte"(disorders, findings, procedures, observables, organisms, products, substances, qualities, …) Formale Definitionen Pro Konzept ein oder mehr Terme pro Sprache (bisher nicht Deutsch) Erweiterbar (Refsets, Postkoordination) Schnittstellen zu anderen Standards (LOINC, HL7, IDMP, WHO-Klassifikationen)

Hindernisse im deutschsprachigen Raum Nach wie vor keine SNOMED International – Mitgliedschaft von Österreich und Deutschland Keine aktuelle Übersetzung in die deutsche Sprache Offenbar weiterhin juridische Unklarheiten bzgl. Nutzung und Übersetzung Wenig klar definierten Use Cases SNOMED-CT-Know-How wenig verbreitet Geringe Teilnahme an Aktivitäten von SNOMED International

Chancen im deutschsprachigen Raum International: Zunehmend "Mainstream": SNOMED CT + LOINC + HL7 + UCUM + (+ RxNorm) EU - Support Action: ASSESS-CT: "SNOMED CT is the best candidate for a core reference terminology for cross-border, national and regional eHealth deployments in Europe." Schweiz Vollmitglied seit 2016 Erste Verwendung in Value Sets: Impfdossier, ausgewählte Laborbefunde Österreich: SNOMED CT Codes in Patient Summary Medizininformatik-Initiative Deutschland: Konsortien MIRACUM, SMITH, DIFuture, HIGHmed 150 Mio € / 4 Jahre Schwerpunkt Datenintegration, Zentrale Themen: Datensemantik, Text Mining, Standards SNOMED CT: in allen Anträgen erwähnt

SNOMED CT - Ressourcen Interface-Terminologien Value Sets für strukturierte Dateneingabe Synonymlisten für Text Mining / Informationsextraktion Deutschsprachige klinische Korpora Annotiert Nicht annotiert De-identifiziert Goldstandards für SNOMED CT - Annotationen SNOMED-CT "Übersetzungen" Manuelle Übertragung von Dokumenteninhalten in SNOMED-Syntax, @ Kantonsspital Genf

Terminologie-Ökosystem Informationsmodelle Interface-Terminologie ICD LOINC SNOMED CT HL7 (CDA, FIHR) openEHR EN13606 Referenz-Terminologie ATC OPS Bio- Ontol-ogien http://assess-ct.eu

Unterscheidung Referenzterminologie - Interfaceterminologie Referenzterminologien: Primär sprachunabhängige Repräsentationseinheiten (Konzepte): Eigenschaften der Objekte, die von diesen denotiert werden Maximal eindeutige Labels, unterstützt durch textliche und / oder formale (ontologische) Definitionen Interfaceterminologien: Sammlungen von sprachlichen Ausdrücken, die in schriftlicher und mündlicher Kommunikation verwendet werden. Fundierung durch Verknüpfung zu Referenzterminologien Interfaceterme sind häufig ambig. Ihre Bedeutung hängt ab von Sprachbenutzern, Sprachregister, sowie thematischen, dialektalen und zeitlichen Kontexten Separate Erstellung / Pflege von Referenzterminologien und Interfaceterminologien http://assess-ct.eu/fileadmin/assess_ct/final_brochure/assessct_final_brochure.pdf

Unterschied Vorzugsterme - Interface-Terme Termhäufigkeiten in MEDLINE (Titel / Abstracts) Vorzugsterm (SNOMED CT) Anzahl Synonym Primary malignant neoplasm of lung Lung cancer Bronchial carcinoma 120682 3452 Cerebrovascular accident 3819 Stroke 191559 Block dissection of cervical lymph nodes  1 Neck dissection 7512 Electrocardiographic procedure Electrocardiogram ECG 33670 55120 Backache 3489 Back pain 38132 Capillary blood specimens 32 Capillary blood samples 574 Brauchen wir eine Übersetzung der SNOMED CT – Vorzugsterme ?

Interfaceterminologie Pankreatikoenterostomie Pankreatikoileostomie Enteropankreatostomie Ileoenterostomie Drainage des Pankreas durch Anastomose Anastomosierung des Pankreas mit dem Dünndarm

MUG-GIT: Erstellung einer deutschen Interface-terminologie für SNOMED CT (I) MUG-GIT (Medical University of Graz – German Interface Terminology) zur maschinellen Annotation deutscher Kliniktexte semantische Extrakte für Projekt IICCAB* limitierte Ressourcen, inkrementelles Vorgehen Modularisierung (Zerlegung in N-Gramme, meist NPs und PPs), Editieren eines abgeleiteten Kernvokabular, motiviert durch hoch repetitive Teilphrasen, z.B. "Magnetic resonance imaging" in 627 SNOMED -Termen "second degree burn" in 166 SNOMED-Termen Priorisierung nach Häufigkeit: Manuelle Revision der NP-Liste Anreicherung durch Terme aus anderen deutschen Terminologien und klinischen Corpora *Schulz S. Innovative Nutzung von Informationen für klinische Versorgung und Biomarkerforschung. http://goo.gl/wHMedz

MUG-GIT: Erstellung einer deutschen Interface-terminologie für SNOMED CT (II) Rules Char Token translation Rules trans - rule acquisition lations Reference Clinical corpus (DE) corpus (DE) Chunker rule untranslated exec New tokens Token Translatable SCT trans - descriptions (EN) lations POS n - grams (EN) tags filter concepts with identical terms across translations n - gram Human curation translations • correct most frequent mis - n - grams (DE) translations • remove wrong Non - Translatable Phrase translations SCT descriptions generation • check POS tags All SCT descriptions (EN) rules • normalise adjectives • add synonyms Term reassembling heuristics Raw full terms Curated ngram (DE) Human Validation translations(DE) • dependent on use cases • e.g. input for official translation • e.g. starting point for crowdsourcing process for interface term generation Stefan Schulz. "Building an experimental German user interface terminology linked to SNOMED CT" SNOMED EXPO, Bratislava, 2017 • lexicon for NLP approaches

MUG-GIT: Erstellung einer deutschen Interface-terminologie für SNOMED CT (III) Kernvokabular: gepflegt durch MedizinstudentInnen unter Aufsicht Richtlinien, z.B. keine Schreibvarianten (c/k/z - Problem), Akronyme nur im Kontext (kein Eintrag für "CT", aber für "Schädel-CT"), … Derzeitiger Stand: > 2 Millionen Interface-Terme, generiert aus Kernvokabular mit deutschen > 95000 N-Grammen, verknüpft mit 85,400 englischen N-Grammen Inkaufnahme "schlechter" Übersetzungen und Permutationen bei langen SNOMED-CT-Termen (kein Problem bei Einsatz für NLP) Kann für Testzwecke zur Verfügung gestellt werden

ngram - Kernvokabular

Automatische generierte Interfaceterminologie

Strategien Erwerb SNOMED CT – Lizenz Evtl. Pilotphase (Vorbild Schweiz) vor Beitritt Research Licence (Beispiel Meduni Graz) Deutschsprachige SNOMED CT Task Force / User Group Kooperative Entwicklung von Tools und Ressourcen SNOMED – CT Interface-Terminologie

Ideenskizze Web-basierte Crowdsourcing-Plattform Registrierung als User  Commitment zu Kooperation Zentrales Datenelement: Mapping Interface Term – Externer Code "DM" - 81827009 |Diameter (qualifier value) Wichtige Attribute: Ersteller, Erstellungsart, Datum, klinisches Fachgebiet, Nutzergruppe, Institution Max Muster, manuell, 20180303, Dermatologie, Ärzte, KAGes Beispielannotation, z.B. "ein 3 cm im DM haltender Tumor" Validierung / Kommentierung durch andere User John Doe, 20180312,  "Beispiel unverständlich – zusätzliche Beispiele!" "Verwechslung mit DM-Diabetes Mellitus"

Fazit Dringender Bedarf: auf SNOMED CT gemappte Interfaceterminologie(n) und Value Sets komplette Übersetzung keine Priorität Kooperatives, verteiltes Ressourcenmanagement (Terminologien, Korpora): Synergien! Organisatorischer Rahmen: SNOMED-CT User Group für den deutschsprachigen Raum SNOMED International – Vollmitgliedschaft für Deutschland und Österreich

Kontakt: stefan.schulz@medunigraz.at Stefan Schulz Medizinische Universität Graz purl.org/steschu Kontakt: stefan.schulz@medunigraz.at