Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Stefan Schulz Medizinische Universität Graz purl.org/steschu

Ähnliche Präsentationen


Präsentation zum Thema: "Stefan Schulz Medizinische Universität Graz purl.org/steschu"—  Präsentation transkript:

1 Ressourcen und Strategien für die sinnvolle Nutzung von SNOMED CT im deutschsprachigen Raum
Stefan Schulz Medizinische Universität Graz purl.org/steschu Jahrestagung

2 SNOMED CT – Universelle Medizinsprache?

3 SNOMED CT – "Steckbrief" Terminologie für die elektronische Krankenakte Internationaler Standard (SNOMED international), in über 50 Ländern eingesetzt Ca "Konzepte"(disorders, findings, procedures, observables, organisms, products, substances, qualities, …) Formale Definitionen Pro Konzept ein oder mehr Terme pro Sprache (bisher nicht Deutsch) Erweiterbar (Refsets, Postkoordination) Schnittstellen zu anderen Standards (LOINC, HL7, IDMP, WHO-Klassifikationen)

4 Hindernisse im deutschsprachigen Raum
Nach wie vor keine SNOMED International – Mitgliedschaft von Österreich und Deutschland Keine aktuelle Übersetzung in die deutsche Sprache Offenbar weiterhin juridische Unklarheiten bzgl. Nutzung und Übersetzung Wenig klar definierten Use Cases SNOMED-CT-Know-How wenig verbreitet Geringe Teilnahme an Aktivitäten von SNOMED International

5 Chancen im deutschsprachigen Raum
International: Zunehmend "Mainstream": SNOMED CT + LOINC + HL7 + UCUM + (+ RxNorm) EU - Support Action: ASSESS-CT: "SNOMED CT is the best candidate for a core reference terminology for cross-border, national and regional eHealth deployments in Europe." Schweiz Vollmitglied seit 2016 Erste Verwendung in Value Sets: Impfdossier, ausgewählte Laborbefunde Österreich: SNOMED CT Codes in Patient Summary Medizininformatik-Initiative Deutschland: Konsortien MIRACUM, SMITH, DIFuture, HIGHmed 150 Mio € / 4 Jahre Schwerpunkt Datenintegration, Zentrale Themen: Datensemantik, Text Mining, Standards SNOMED CT: in allen Anträgen erwähnt

6 SNOMED CT - Ressourcen Interface-Terminologien
Value Sets für strukturierte Dateneingabe Synonymlisten für Text Mining / Informationsextraktion Deutschsprachige klinische Korpora Annotiert Nicht annotiert De-identifiziert Goldstandards für SNOMED CT - Annotationen SNOMED-CT "Übersetzungen" Manuelle Übertragung von Dokumenteninhalten in Kantonsspital Genf

7 Terminologie-Ökosystem
Informationsmodelle Interface-Terminologie ICD LOINC SNOMED CT HL7 (CDA, FIHR) openEHR EN13606 Referenz-Terminologie ATC OPS Bio- Ontol-ogien

8 Unterscheidung Referenzterminologie - Interfaceterminologie
Referenzterminologien: Primär sprachunabhängige Repräsentationseinheiten (Konzepte): Eigenschaften der Objekte, die von diesen denotiert werden Maximal eindeutige Labels, unterstützt durch textliche und / oder formale (ontologische) Definitionen Interfaceterminologien: Sammlungen von sprachlichen Ausdrücken, die in schriftlicher und mündlicher Kommunikation verwendet werden. Fundierung durch Verknüpfung zu Referenzterminologien Interfaceterme sind häufig ambig. Ihre Bedeutung hängt ab von Sprachbenutzern, Sprachregister, sowie thematischen, dialektalen und zeitlichen Kontexten Separate Erstellung / Pflege von Referenzterminologien und Interfaceterminologien

9 Unterschied Vorzugsterme - Interface-Terme
Termhäufigkeiten in MEDLINE (Titel / Abstracts) Vorzugsterm (SNOMED CT) Anzahl Synonym Primary malignant neoplasm of lung Lung cancer Bronchial carcinoma Cerebrovascular accident 3819 Stroke 191559 Block dissection of cervical lymph nodes  1 Neck dissection 7512 Electrocardiographic procedure Electrocardiogram ECG 33670 55120 Backache 3489 Back pain 38132 Capillary blood specimens 32 Capillary blood samples 574 Brauchen wir eine Übersetzung der SNOMED CT – Vorzugsterme ?

10 Interfaceterminologie
Pankreatikoenterostomie Pankreatikoileostomie Enteropankreatostomie Ileoenterostomie Drainage des Pankreas durch Anastomose Anastomosierung des Pankreas mit dem Dünndarm

11 MUG-GIT: Erstellung einer deutschen Interface-terminologie für SNOMED CT (I)
MUG-GIT (Medical University of Graz – German Interface Terminology) zur maschinellen Annotation deutscher Kliniktexte semantische Extrakte für Projekt IICCAB* limitierte Ressourcen, inkrementelles Vorgehen Modularisierung (Zerlegung in N-Gramme, meist NPs und PPs), Editieren eines abgeleiteten Kernvokabular, motiviert durch hoch repetitive Teilphrasen, z.B. "Magnetic resonance imaging" in 627 SNOMED -Termen "second degree burn" in 166 SNOMED-Termen Priorisierung nach Häufigkeit: Manuelle Revision der NP-Liste Anreicherung durch Terme aus anderen deutschen Terminologien und klinischen Corpora *Schulz S. Innovative Nutzung von Informationen für klinische Versorgung und Biomarkerforschung.

12 MUG-GIT: Erstellung einer deutschen Interface-terminologie für SNOMED CT (II)
Rules Char Token translation Rules trans - rule acquisition lations Reference Clinical corpus (DE) corpus (DE) Chunker rule untranslated exec New tokens Token Translatable SCT trans - descriptions (EN) lations POS n - grams (EN) tags filter concepts with identical terms across translations n - gram Human curation translations correct most frequent mis - n - grams (DE) translations remove wrong Non - Translatable Phrase translations SCT descriptions generation check POS tags All SCT descriptions (EN) rules normalise adjectives add synonyms Term reassembling heuristics Raw full terms Curated ngram (DE) Human Validation translations(DE) dependent on use cases e.g. input for official translation e.g. starting point for crowdsourcing process for interface term generation Stefan Schulz. "Building an experimental German user interface terminology linked to SNOMED CT" SNOMED EXPO, Bratislava, 2017 lexicon for NLP approaches

13 MUG-GIT: Erstellung einer deutschen Interface-terminologie für SNOMED CT (III)
Kernvokabular: gepflegt durch MedizinstudentInnen unter Aufsicht Richtlinien, z.B. keine Schreibvarianten (c/k/z - Problem), Akronyme nur im Kontext (kein Eintrag für "CT", aber für "Schädel-CT"), … Derzeitiger Stand: > 2 Millionen Interface-Terme, generiert aus Kernvokabular mit deutschen > N-Grammen, verknüpft mit 85,400 englischen N-Grammen Inkaufnahme "schlechter" Übersetzungen und Permutationen bei langen SNOMED-CT-Termen (kein Problem bei Einsatz für NLP) Kann für Testzwecke zur Verfügung gestellt werden

14 ngram - Kernvokabular

15 Automatische generierte Interfaceterminologie

16 Strategien Erwerb SNOMED CT – Lizenz
Evtl. Pilotphase (Vorbild Schweiz) vor Beitritt Research Licence (Beispiel Meduni Graz) Deutschsprachige SNOMED CT Task Force / User Group Kooperative Entwicklung von Tools und Ressourcen SNOMED – CT Interface-Terminologie

17 Ideenskizze Web-basierte Crowdsourcing-Plattform
Registrierung als User  Commitment zu Kooperation Zentrales Datenelement: Mapping Interface Term – Externer Code "DM" |Diameter (qualifier value) Wichtige Attribute: Ersteller, Erstellungsart, Datum, klinisches Fachgebiet, Nutzergruppe, Institution Max Muster, manuell, , Dermatologie, Ärzte, KAGes Beispielannotation, z.B. "ein 3 cm im DM haltender Tumor" Validierung / Kommentierung durch andere User John Doe, ,  "Beispiel unverständlich – zusätzliche Beispiele!" "Verwechslung mit DM-Diabetes Mellitus"

18 Fazit Dringender Bedarf: auf SNOMED CT gemappte Interfaceterminologie(n) und Value Sets komplette Übersetzung keine Priorität Kooperatives, verteiltes Ressourcenmanagement (Terminologien, Korpora): Synergien! Organisatorischer Rahmen: SNOMED-CT User Group für den deutschsprachigen Raum SNOMED International – Vollmitgliedschaft für Deutschland und Österreich

19 Kontakt: stefan.schulz@medunigraz.at
Stefan Schulz Medizinische Universität Graz purl.org/steschu Kontakt:


Herunterladen ppt "Stefan Schulz Medizinische Universität Graz purl.org/steschu"

Ähnliche Präsentationen


Google-Anzeigen