Medizinische Dokumentenrecherche mit MorphoSaurus

Slides:

Advertisements

Ähnliche Präsentationen

Einsatz neuer Technologien auf dem Slavistik-Portal Ivo Ulrich, Staatsbibliothek zu Berlin 32. ABDOS-Tagung, Martin (Slowakei), 19. Mai 2009.

Advertisements

Ehemaliges Deutsches Bibliotheksinstitut Berlin

Information Retrieval in XML-Dokumenten

Pop Jazz C B A Jazz C A Lehrstuhl für Künstliche Intelligenz

IT-Projektmanagement

„Schach dem Herzinfarkt“

Jugendsprache interaktiv

Olaf Siegert IuK-Tagung Göttingen, 28. September 2006

ELearning – The Next Five Years AIFB Rudi Studer Learning Lab Lower Saxony Institute AIFB, University of Karlsruhe

eine Plattform für annotierte Korpora in XML

Einsatz neuer Technologien bei der Virtuellen Fachbibliothek Slavistik Ivo Ulrich, Staatsbibliothek zu Berlin 98. Bibliothekartag, Erfurt, 3. Juni 2009.

Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!

Vorstellung der Diplomarbeit

Inhaltlich orientierter Zugriff auf unstrukturierte Daten

Semantic Integration Carola Eschenbach, Özgür Özçep Universität Hamburg, FB Informatik AB Wissens- und Sprachverarbeitung (WSV) Sommersemester 2006.

Bildverarbeitung für die Medizin - BVM

DEPARTMENT FÜR INFORMATIK

eXist Open Source Native XML Database

Harmonisierung von Ontologien Martin Zobel. Was versteht man in der Informatik unter einer Ontologie? Wikipedia: Unter Ontologie versteht man in der Informatik.

Archivierung und Erschließung von Audio/Video-Material mit miless und MyCoRe F. Lützenkirchen Universitätsbibliothek.

EU-Datenbanken Recht und Politik Ivo Vogel Heinz-Jürgen Bove Juni 2006.

Math-Net ein Netzwerk für die Mathematik

XINDICE The Apache XML Project Name: Jacqueline Langhorst

Controlled Vocabularies in XML Datenbanken vs. Markup – Prof. Dr. Thaller Mike Odenthal.

Bau effizienter und effektiver Metasuchmaschinen

WIESEL – Integration von Wissensmanagement und E-Learning auf der Basis von Semantic Web Technologien Matthias Rust, XML-Tage 2004, Berlin WIESEL Integration.

PinK Plattform für intelligente Kollaborationsportale Dr. Joachim Quantz, e.V. Berlin, 13. September 2005.

DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie neofonie Forschung und Entwicklung: Innovative Suchmethoden Präsentiert von Ronald.

Renardus The Academic Subject Gateway in Europe Nationalbibliotheken und nationale Dienste – Interoperabilität mit Subject Gateways Christel Hengel.

Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.

Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.

Semantisch gestützte Suche im Internet

GALEN Claudia Bärthel Inhalt Was ist GALEN? –Entwicklung –Komponenten Top Level Ontologie –Category Ontologie –Attribute Ontologie.

Optimierung von Volltextindices

Fortgeschrittene Methoden der Wissensorganisation

Thesis AAM Ralf Bennetz

Informationssysteme SS Informationssysteme Grundvorlesung Informatik Sommersemester 2004 Universität des Saarlandes, Saarbrücken Dr. Ralf Schenkel.

Qualität von Web-Suchmaschinen Search Engine Stragies Munich 2005 Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft.

Spree SoSe 2010 Optimierung von Volltextinvertierung durch den Einsatz von Indexierungswörterbüchern Artikelstrecke ab BUTTERBLUME im Deutschen Wörterbuch.

MedPilot Virtuelle Fachbibliothek Medizin

RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.

Arbeitsstand und Arbeitsbedarf Bibliotheken

Dr. Heidrun Alex, DDB Projekt DDC Deutsch Fortbildung für Fachreferentinnen und Fachreferenten der Altertums- wissenschaften UB Heidelberg,

Studieren aus der Perspektive der angewandten Sozialwissenschaften

Prof. Ursula Schulz Hamburg, Oktober 2007 Bibliothekskataloge für Kunden - Essentials & Nice-to-Haves.

9. Information Retrieval und Medizinische Literaturdatenbanken

Anglo-Amerikanische Korpuslinguistik Anglo-American Corpus Linguistics Erstellt von Gudrun Krenn Slawische Korpuslinguistik SE SS 2006 Dr. Branko Tošović

E-Learning in Theorie & Praxis

Hermann-Paul-Centrum für Linguistik

Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.

Wissen, Kreativität und Transformation von Gesellschaften INST–Konferenz Wien, Dezember 2007 Vortrag zum Schwerpunkt Divergierende Konzepte von.

Arbeitsgruppe Medizinische Informatik Stefan Schulz.

European Centre for Modern Languages Graz Projektausschreibung für das 3. Arbeitsprogramm des EFSZ

Wegweiser im Datenjungel

XML (Extensible Markup Language)

Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.

Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München,

Morphosaurus Statusreport Mai Grundidee Semantische Indexierung von medizinischern Dokumenten Verbesserung des Dokumentenretrievals Unterstützung.

Monomorphemisch: Haus, Baum etc Morphologisch komplex

Steiermark Bürofachkraft für den medizinischen Bereich Einführung in die medizinische Terminologie © Dr. Michael Adomeit.

AP3 – Informationsmodell ByMedConnect Archetypen Hans Demski Helmholtz Zentrum München Arbeitsgruppe MEDIS Institut für Medizinsche und Biologische Bildgebung.

„Wenn du den Fluss Halys überschreitest, wirst du

26. Oktober 2005Autor: Walter Leuenberger Computeria Urdorf Treff vom 26. Oktober 2005 Suchmaschinen im Internet Google & Co.

Datenbanken im Web 1.

Digitale Annotationen. Grundlage: John Bradley “Towards a Richer Sense of Digital Annotation: Moving Beyond a Media Orientation of the Annotation of Digital.

Fachspezifische Suchmaschine für Philosophie Home.

Die Übersetzung von “Diskursdialekten” für die Suche: Das Mapping zwischen Fachsprachen und Indexierungssprachen Vivien Petras Vortrag im Berliner Bibliothekswissenschaftlichen.

J.GehlenDept. of Medical Informatics 1 Department of Medical Informatics, Uniklinik RWTH Aachen, Germany Sichere Mobile Datenerfassung.

Corpus-based Error Detection in a Multilingual Medical Thesaurus

Übersetzungsorientierte Terminologiearbeit am Europäischen Parlament

Präsentation transkript:

Medizinische Dokumentenrecherche mit MorphoSaurus ─── Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Dieser Vortrag behandelt unterschiedliche Methoden zur sprachübergreifenden Dokumentenrecherche in der Welt der Medizin. Medizinische Texte unterscheiden sich von anderen Textsammlungen. Sie sind in der Regel extrem groß und dynamisch – man denke beispielsweise an Dokumente, die im täglichen Klinikbetrieb neu entstehen. Darüberhinaus sind medizinische Textkollektionen heterogen und mehrsprachig: Während klinische Texte wie Pathologieberichte oder Arztbriefe in der Regel in einer jeweiligen Muttersprache verfasst werden, sind wissenschaftliche Beiträge fast ausschliesslich in Englisch anzutreffen. Ebenso wie die Texte, íst auch die Nutzergemeinde medizinischer Informationen höchst unterschiedlich: KLICK Kornél Markó, Philipp Daumke Medizinische Informatik, Universitätsklinikum Freiburg

Übersicht Kurze Vorstellung der Medizinischen Informatik in Freiburg Ebenen der Suche (Laien, Experten, Sprachen) Vorstellung der Technologie Evaluation Anwendungen SOMED-Studie ICD-Suche Perspektiven / Einsatzmöglichkeiten im DIMDI Zeitbedarf ca. 60 Minuten

MI in Freiburg Medizinische Informatik Direktor Prof. Dr. Klar Wissenschaftliche Schwerpunkte Patientenbezogene Dienste: MIRA-Plus (KIS) Patientenunabhängige Auskunfts- und Wissensdienste: InfoServer Grundlagen zur Modellierung medizinischer Konzepte mittels terminologischer Logik Begriffliche Ordnungssysteme in der Medizin Konzepte zur Integration von Elektronischer Patientenakte und medizinischen Wissensdiensten MorphoSaurus / Text-Retrieval / Cross-Language Retrieval

MorphoSaurus - Entwicklung 1998: Entwicklung der ersten Version im Rahmen einer Promotion (Medizin) Seit 2000: Kooperation mit der Catholic University of Paraná, Brasilien (BMBF-Förderungen) Seit 2003: DFG-Projekt morphologisches Indexieren Seit 2004: EU Network of Excellence Semantic Mining (WP multi-lingual lexicon, ontologies, text mining)

MorphoSaurus

Einsprachige Textrecherche Suchmaschine

Triviale Suche: Laien „hoher Blutdruck“

Abgleich von Zeichenketten Triviale Suche: Laien „hoher Blutdruck“ Suchmaschine: Abgleich von Zeichenketten

Abgleich von Zeichenketten Triviale Suche: Laien „hoher Blutdruck“ Suchmaschine: Abgleich von Zeichenketten

Abgleich von Zeichenketten Triviale Suche: Laien „hoher Blutdruck“ Suchmaschine: Abgleich von Zeichenketten

Abgleich von Zeichenketten Triviale Suche: Laien „hoher Blutdruck“ Suchmaschine: Abgleich von Zeichenketten

Triviale Suche: Experten „Risiken bei Bluthochdruck“

Triviale Suche: Experten Abgleich von Zeichenketten „Risiken bei Bluthochdruck“ Suchmaschine: Abgleich von Zeichenketten

Triviale Suche: Experten Abgleich von Zeichenketten „Risiken bei Bluthochdruck“ Suchmaschine: Abgleich von Zeichenketten

Triviale Suche: Experten Abgleich von Zeichenketten „Risiken bei Bluthochdruck“ Suchmaschine: Abgleich von Zeichenketten

Triviale Suche: Experten Abgleich von Zeichenketten „Risiken bei Bluthochdruck“ Suchmaschine: Abgleich von Zeichenketten

Morphologie der Wörter Linguistische Phänomene erschweren die medizinische Textrecherche ! Flexion: Erkrankungen, Bluthochdrucks, Risiken Derivation: Krankheit, diastolisch, leukozytär Komposition: Gemeinde|krank|en|pflege|station|en Akronyme: AIDS, SARS, OECD Orthografische Varianten: Kolonkarzinom, Colonkarzinom, Ösophagus, Oesophagus, ulzerierend, ulcerierend Synonyme: Bluthochdruck – Hypertonie, Prophylaxe – Vorbeugung Eigennamen: Aspirin, ASS, ...

Triviale Suche: Experten II „Korrelation von Hypertonie und Läsion der Weißen Substanz“

Triviale Suche: Experten II „Korrelation von Hypertonie und Läsion der Weißen Substanz“ „Correlation of high blood pressure and lesion of the white substance“

Triviale Suche: Experten II „Korrelation von Hypertonie und Läsion der Weißen Substanz“ „Correlation of high blood pressure and lesion of the white substance“ Suchmaschine

Triviale Suche: Experten II „Korrelation von Hypertonie und Läsion der Weißen Substanz“ „Correlation of high blood pressure and lesion of the white substance“ Suchmaschine

Triviale Suche: Experten II „Korrelation von Hypertonie und Läsion der Weißen Substanz“ „Correlation of high blood pressure and lesion of the white substance“ Suchmaschine

Triviale Suche: Experten II „Korrelation von Hypertonie und Läsion der Weißen Substanz“ „Correlation of high blood pressure and lesion of the white substance“ Suchmaschine

Mehrsprachige Textrecherche Suchmaschine

Ansätze Übersetzung der Benutzeranfrage Übersetzung der Dokumente Übersetzung in eine Interlingua A B IL

Lösungsansatz Subwörter sind atomare konzeptuelle oder linguistische Einheiten: Stämme: verletz, entzünd, magen, schleimhaut Präfixe: ab-, an-, anti-, ge-, hervor-, hyper- Suffixe: -abel, -bar, -haft, -ion, -itis Infixe: -o-, -s- Synonyme Subwörter werden (sprachübergreifend) in Äquivalenzklassen gruppiert: #derma = { derm, cutis, skin, haut, kutis, pele, cutis, piel, … } #inflamm = { inflam, -itic, -itis, entzuend, -itis, -itisch, inflam, flog, inflam, flog, -iolitis, ... } Empirische Kriterien: hypertonie = {#hyper #tens #blood}

Ressourcen Subwort-Lexikon: Subwort-Thesaurus: Zerlegungsalgorithmus: Organisiert Subwörter (atomare Bedeutungseinheiten) in mehreren Sprachen Subwort-Thesaurus: Gruppiert synonyme Lexikoneinträge (auch sprachübergreifend) Zerlegungsalgorithmus: Extraktion von Subwörtern und Zuweisung von Äquivalenzklassen MorphoSaurus In unserem System benutzen wir sprachspezifische Lexika, welche – grob gesagt- Wortstämme und Affixe verwalten. Die Einträge im Lexikon sind oberhalb der Ebene von Morphemen und unterhalb der Ebene von Wörtern angesiedelt, weshalb wir von „Subwörtern“ sprechen. Zur Zeit existieren Lexika für Deutsch, Englisch und Portugiesisch. Subwörter werden in einem Subwort-Thesaurus organisiert, welcher synonyme Lexikoneinträge innerhalb einer Sprache, aber auch sprachübergreifend, zu Äquivalenzklassen gruppiert. Desweiteren haben wir einen Segmentierungsalgorithmus implementiert, welcher Eingabewörter in Subwörter zerlegt und entsprechend des Thesaurus Äquivalenzklassen zuweist. Alle drei Komponenten zusammen bilden das Morphosaurus System – ein Akronym für Morpheme und Thesaurus. Äquivalenzklassen nennen wir entsprechend Morphosaurus-Identifier - oder kurz – MIDs. KLICK

Subwort: Lexikon & Thesaurus Subwort Thesaurus: Gruppierung von synonymen Subwörtern zu Äquivalenzklassen gastr stomach magen ventric chamber hepat,hepar liver leber -itis, inflamm, entzünd nephr ren kidney niere #GASTR #CHAMBER #HEPAR #NEPHR #INFLAMM Hier noch ein kurzer Überblick über die Beschaffenheit der Ressourcen, die wir verwenden: Im Lexikon wird eine Liste von Subwörtern verwaltet. Diese werden im Thesaurus zu Äquivalenzklassen gruppiert und erhalten einen eindeutigen Bezeichne. KLICK

Zerlegungsalgorithmus Beispiel High TSH values suggest the diagnosis of primary hypo-thyroidism ... Original Erhöhte TSH-Werte erlauben die Diagnose einer primären Schilddrüsenunterfunktion ... high tsh values suggest the diagnosis of primary hypo-thyroidism ... erhoehte tsh werte erlauben die diagnose einer primaeren schilddruesenunterfunktion ... Orthografische Regeln Normalisierung high tsh value s suggest the diagnos is of primar y hypo thyroid ism er hoeh te tsh wert e erlaub en die diagnos e einer primaer en schilddruese n unter funktion Zerlegungsalgorithmus Subwort-Lexikon #up tsh #value #suggest #diagnost #primar #hypo #thyre Interlingua #up tsh #value #permit #diagnost #primar #thyre #hypo #function Subwort- Thesaurus Semantische Normalisierung Um Ihnen ein Beispiel zu geben, was das Morphosaurus-System mit Eingabetexten macht: Wir haben hier ein Fragment aus einem parallelen Korpus – Englisch und Deutsch. In einem ersten Schritt werden orthografische Ersetzungsregeln angewandt. In diesem Schritt wird Großschreibung durch Kleinschreibung ersetzt und beispielsweise Umlaute im Deutschen behandelt. Im zweiten Schritt werden Eingabewörter gemäß dem Lexikon segmentiert. Das heisst – vereinfacht- , Vorsilben und Nachsilben werden von Wortstämmen abgetrennt. Im letzten Schritt werden alle bedeutungstragenden Subwörter durch enstprechende Einträge im Thesaurus ersetzt – den Äquivalenzklassenbezeichnern. KLICK

Zerlegungsalgorithmus Beispiel High TSH values suggest the diagnosis of primary hypo-thyroidism ... Original Erhöhte TSH-Werte erlauben die Diagnose einer primären Schilddrüsenunterfunktion ... high tsh values suggest the diagnosis of primary hypo-thyroidism ... erhoehte tsh werte erlauben die diagnose einer primaeren schilddruesenunterfunktion ... Orthografische Regeln Normalisierung high tsh value s suggest the diagnos is of primar y hypo thyroid ism er hoeh te tsh wert e erlaub en die diagnos e einer primaer en schilddruese n unter funktion Zerlegungsalgorithmus Subwort-Lexikon #up tsh #value #suggest #diagnost #primar #hypo #thyre Interlingua #up tsh #value #permit #diagnost #primar #thyre #hypo #function Subwort- Thesaurus Semantische Normalisierung Während in den Originaltexten – oben links- keine offensichtlichen Korrespondenzen ersichtlich sind, haben wir in der Interlingua-Repräsentation, also in der sprachunabhängigen, konzeptartigen Repräsentation, eine ganze Reihe von gemeinsamen Bezeichnern. KLICK

Suche mit MorphoSaurus

Suche mit MorphoSaurus

Suche mit MorphoSaurus „Korrelation von Hypertonie und Läsion der Weißen Substanz“

Suche mit MorphoSaurus „Korrelation von Hypertonie und Läsion der Weißen Substanz“ „#correl #hyper #tens #lesion #whit #matter“

Suche mit MorphoSaurus Abgleich von Zeichenketten „Korrelation von Hypertonie und Läsion der Weißen Substanz“ „#correl #hyper #tens #lesion #whit #matter“ Suchmaschine: Abgleich von Zeichenketten

Suche mit MorphoSaurus Abgleich von Zeichenketten „Korrelation von Hypertonie und Läsion der Weißen Substanz“ „#correl #hyper #tens #lesion #whit #matter“ Suchmaschine: Abgleich von Zeichenketten

Studie

Studie: Google

Studie: Google

Studie: PubMed

Studie: PubMed

Studie: DIMDI

Studie: DIMDI

Studie: MorphoSaurus

Studie: MorphoSaurus

Sprachübergreifende Suche

Evaluation

Evaluationsszenarien Baseline: einsprachige Textrecherche Englische Benutzeranfragen Englische Texte Übersetzung der Benutzeranfrage Google Übersetzer Mehrsprachiges Medizinlexikon aus UMLS MorphoSaurus Interlingua-Repräsentation der Anfragen und der Dokumente Ich kehre jetzt zurück zum ursprünglichen Problem der sprachübergreifenden Dokumentenrecherche. Wir haben unseren Ansatz natürlich evaluiert und betrachten hierfür folgende Szenarien: Als Baseline dient die einsprachige Textrecherche, das heistt englische Benutzeranfragen werden mit englischen Dokumenten abgeglichen. Es ist zu erwarten, dass die Ergebnisse hier am besten ausfallen. Zweitens haben wir die sprachübergreifende Recherche mittels Anfrageübersetzung implmentiert. Hierfür benutzen wir den GOOGLE-Übersetzer. Da der GOOGLE-Übersetzer nicht auf medizinische Terminologie ausgelegt ist, integrierten wir ein mehrsprachiges Medizinlexikon, welches über UMLS verfügbar ist. Diesen Szenarien stellen wir unseren Morphosaurus-Ansatz gegenüber, indem Anfrage und Dokumente in einer Interlingua repräsentiert sind. KLICK

Experimente OHSUMED-Corpus (Hersh et al., 1994) Suchmaschine: Untermenge von MEDLINE ~233,000 englische Dokumente 106 englische Benutzeranfragen, von Experten übersetzt ins Deutsche und Portugiesische Relevanz der Dokumente manuell markiert Suchmaschine: Open-Source der Apache-Foundation: Lucene http://lucene.apache.org/

Resultate Deutsch Portugiesisch Baseline MorphoSaurus Top 200 Portugiesisch 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Baseline MorphoSaurus Übersetzung der Anfrage

Resultate Deutsch Portugiesisch Baseline MorphoSaurus Top 200 Portugiesisch 68% der Baseline 54% der Baseline 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Baseline MorphoSaurus Übersetzung der Anfrage

Resultate 93% der Baseline Deutsch Portugiesisch Baseline MorphoSaurus Top 200 Portugiesisch 93% der Baseline 62% der Baseline 68% der Baseline 54% der Baseline 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Baseline MorphoSaurus Übersetzung der Anfrage

Zusammenfassung SOMED Prototyp: Innovatives und erfolgreiches Suchverfahren Komposita – Suche Synonym – Suche Sprachübergreifende Suche (EN, DE, PT, FR, SP, SV) Ergebnisse nach Relevanz sortiert Sprachübergreifende Suche erreicht bis zu 93% gegenüber einsprachiger Suche (Meth Inf Med, 2005) Semantische Indexierung und Suche ist einsetzbar mit allen Suchmaschinen Einfache Pflege (Kostenersparnis) Pflege des Subwortlexikons im Vergleich zur Pflege eines Vollformensynonymlexikons überschaubar SOMED Prototyp: http://morphine.coling.uni-freiburg.de/somed/search.php

Anwendungen

Proof-of-Concept: SOMED 336.250 Dokumente (543MB XML) wurden nach Sprachen kategorisiert (TextCat): ~3000/Minute = 2 Stunden mit MorphoSaurus bearbeitet 1.7 GB XML (nur für Highlighting der Treffer) Suchmaschine: Lucene ~9000/Minute = 40 Minuten 940 MB für 2 Indices (Original + MorphoSaurus) 340 MB für 1 Index (MorphoSaurus)

Proof-of-Concept: SOMED Dekomposition der Suchanfragen „Darmkrebsrisikoreduzierung“ #enteral #neoplas #malign #risk #reduc Formulierung der Suchanfrage 1. Suche mit „UND“ 2. Falls keine Treffer: Suche mit „ODER“ Es wurden 2 Indizes erstellt: #enteral AND #neoplas AND #malign AND #risk AND #reduc OR (original:darmkrebsrisikoreduzierung) Besseres Ranking, gleiche Ergebnismenge, höherer Speicherbedarf

Proof-of-Concept: SOMED

Diagnosenkodierung nach ICD Suche in 15,278 ICD-Codes Erste Tests durch Uniklinik Freiburg erfolgreich, vor allem im Vergleich zu ICD-Browser des Zentralinstituts für die kassenärztliche Versorgung in der BRD (http://www.zi-berlin.de/) Kodierbrowser der Uniklinik Münster (http://drg.uni-muenster.de/de/webgroup/m.brdiagnosen.php) Anwendbar auf andere Klassifikationen: OPS, …

Universitätsklinikum Münster

Zentralinstitut Berlin (3M)

MorphoSaurus ICD-Suche

ICD verbunden mit MEDLINE

ICD verbunden mit MEDLINE

Forschungsbezogene Nutzung Texte in klinischen DB (Uniklinik Freiburg) Sprachübergreifende Suche im Web (HON) Suche in Bilddatenbanken (mit Uni Münster) Mapping von Terminologien (Ukl Freiburg)

MorphoSaurus - Zukunft Projekte, in denen MorphoSaurus zum Einsatz kommt: 2006: ZBMED: Integration in MedPilot 2 Jahre 2006: EU BOOTStrep (Bootstrapping of Ontologies and Terminologies Strategic Research Project) 3 Jahre 2006: @neurIST (Integrated Biomedical Informatics for the Management of Cerebral Aneurysm) 4 Jahre

www.morphosaurus.net

MorphoEdit WEB

Suchmaschinen-Indices Liest Dokumente ein und generiert einen Index mit gewichteten Indextermen (für Ranking). „Wort x kommt in Dokumenten ID1,ID2,ID6,… vor“ Normalerweise sind Indexterme Wörter der Dokumentenkollektion MorphoSaurus: Äquivalenzklassen bilden Indexterme

Lucene: Indexerstellung Indexterm (Original) ID Bluthochdruck #1 Hypertonie Erhöhung Blutdruckes Erhöhten Blutdruckwerte Blutdruckmessung Indexterm (MorphoSaurus) ID #blood #1 #high #tense #value #measure

Lucene: Indexerstellung Indexterm (Original) ID Bluthochdruck #1 Hypertonie #1 #2 Erhöhung Blutdruckes Erhöhten Blutdruckwerte Blutdruckmessung Hypertension #2 Blutdruck Risiko Hypertonikers Belastungsblutdruck Ruheblutdruck Risikofaktor Risikofaktoren Risikoevaluation Indexterm (MorphoSaurus) ID #blood #1 #2 #high #tense #value #1 #measure #risk #2 #factor #eval