Multilingual Access to Biomedical Documents

Slides:



Advertisements
Ähnliche Präsentationen
Alexander Stuber & Partner
Advertisements

Cadastre for the 21st Century – The German Way
Service Oriented Architectures for Remote Instrumentation
PRESENTATION HEADLINE
PSI and Competition The General Framework
Finding the Pattern You Need: The Design Pattern Intent Ontology
E-Solutions mySchoeller.com for Felix Schoeller Imaging
Themenportal Europäische Geschichte / Web portal European History
Energy Supply in the Region Ulm / Neu-Ulm
H - A - M - L - E - IC T Teachers Acting Patterns while Teaching with New Media in the Subjects German, Mathematics and Computer Science Prof. S. Blömeke,
R. Zankl – Ch. Oelschlegel – M. Schüler – M. Karg – H. Obermayer R. Gottanka – F. Rösch – P. Keidler – A. Spangler th Expert Meeting Business.
Herzlich Willkommen zum Informations-Forum: SAP Interoperabilität
Die ZBW ist Mitglied der Leibniz-Gemeinschaft Copyright © ZBW 2010 Seite 1 Potenziale semantischer Technologien für die Bibliothek der Zukunft Klaus Tochtermann.
First Seminar in Brussels, 15th of December 2010
Steinbeis Forschungsinstitut für solare und zukunftsfähige thermische Energiesysteme Nobelstr. 15 D Stuttgart WP 4 Developing SEC.
Peter Marwedel TU Dortmund, Informatik 12
study of medicine no obligatory training content in almost all medical schools (universities) in Germany elective subject for medical students during.
Ralf Schenkel joint work with Fabian Suchanek and Gjergji Kasneci YAWN A Semantically Annotated Wikipedia XML Corpus.
We test your ideas. Test us. ASAM-ODS Benutzertreffen, Glashütten 16. Juni 2005 Page 1 Eine Suchmaschine für ASAM-ODS Dr. Bruno Thelen
XML Entwicklungen in Giessen XML Clearinghouse - Berlin,
Insulin pump therapy in adults allows metabolic control at lower rates of hypoglycemia along with reduced insulin doses – results from the nationwide DPV-survey.
Lancing: What is the future? Lutz Heinemann Profil Institute for Clinical Research, San Diego, US Profil Institut für Stoffwechselforschung, Neuss Science.
Hochschulteam der Agentur für Arbeit Trier Preventing the Brainware Crisis Workshop Schloss Dagstuhl Student Enrollment in Computer Science.
POST MARKET CLINICAL FOLLOW UP
CTS2 based Terminology Server – Overview – Project eBPG
Deutsche Gesellschaft für Technische Zusammenarbeit GmbH Integrated Experts as interface between technical cooperation and the private sector – An Example.
virtPresenter „lecture recording framework“
Linguistically Motivated Information Retrieval
Medical Universities‘ Teaching Staff Training in Bochum Germany
Don`t make me think! A Common Sense Approach to Web Usability
Case Study Session in 9th GCSM: NEGA-Resources-Approach
Machen Sie sich schlau am Beispiel Schizophrenie.
Schweizerische Landesbibliothek ODOK05 - Workshop der VÖB-Kommission für Sacherschliessung Bozen, September 13, 2005 Cross-Language Access to Information.
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
| DC-IAP/SVC3 | © Bosch Rexroth Pneumatics GmbH This document, as well as the data, specifications and other information set forth in.
A good view into the future Presented by Walter Henke BRIT/SLL Schweinfurt, 14. November 2006.
VOCABULARY SOCCER QUESTIONS PRESENT CONTINOUS WORDLIST – CELL PHONE Unit 2 - Trainer.
Centre for Public Administration Research E-Government for European Cities Thomas Prorok
BAS5SE | Fachhochschule Hagenberg | Daniel Khan | S SPR5 MVC Plugin Development SPR6P.
Z Corp Customer Examples
The free XML Editor for Windows COOKTOP Semistrukturierte Daten 1 Vortrag Semistrukturierte Daten 1 COOKTOP The free XML-Editor for Windows
3/28/2017 8:11 PM Visual Studio Tools für Office { Rapid Application Development für Office } Jens Häupel Platform Strategy Manager Microsoft Deutschland.
Department of Computer Science Homepage HTML Preprocessor Perl Database Revision Control System © 1998, Leonhard Jaschke, Institut für Wissenschaftliches.
INTAKT- Interkulturelle Berufsfelderkundungen als ausbildungsbezogene Lerneinheiten in berufsqualifizierenden Auslandspraktika DE/10/LLP-LdV/TOI/
DEUTSCHLAND UND DIE MEDIEN
Institut für Umweltphysik/Fernerkundung Physik/Elektrotechnik Fachbereich 1 K. Bramstedt, L. Amekudzi, J. Meyer IFE/IUP Tangent heights in occultation.
Kapitel 3 – Familie und Freunde
Einführung Bild und Erkenntnis Einige Probleme Fazit Eberhard Karls Universität Tübingen Philosophische Fakultät Institut für Medienwissenschaft Epistemic.
Berner Fachhochschule Hochschule für Agrar-, Forst- und Lebensmittelwissenschaften HAFL Recent activities on ammonia emissions: Emission inventory Rindvieh.
Ein Projekt des Technischen Jugendfreizeit- und Bildungsvereins (tjfbv) e.V. kommunizieren.de Blended Learning for people with disabilities.
Digital Dashboard Toolkit 2001 SharePoint Portal Server released targeting portal market SharePoint Team Services (STS) released as free add-
Talking about yourself
Demonstration of Performance of CASCOT 5.0
German Early Level The Weather.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
HRM A – G. Grote ETHZ, WS 06/07 HRM A: Work process design Overview.
KIT – die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH) Vorlesung Knowledge Discovery - Institut AIFB Tempus fugit Towards.
Present Tense Most regular verbs follow this pattern:
Lehrstuhl für Waldbau, Technische Universität MünchenBudapest, 10./11. December 2006 WP 1 Status (TUM) Bernhard Felbermeier.
Social Media and Social Innovation a Manifesto
Selectivity in the German Mobility Panel Tobias Kuhnimhof Institute for Transport Studies, University of Karlsruhe Paris, May 20th, 2005.
How to use and facilitate an OptionFinder Audience Response System.
Technische Universität München 1 CADUI' June FUNDP Namur G B I The FUSE-System: an Integrated User Interface Design Environment Frank Lonczewski.
TUM in CrossGrid Role and Contribution Fakultät für Informatik der Technischen Universität München Informatik X: Rechnertechnik und Rechnerorganisation.
Andreas Burger ZENTRUM FÜR MEDIZINISCHE LEHRE RUHR-UNIVERSITÄT BOCHUM Irkutsk October 2012 Report about the lecture "Report of the TEMPUS IV- Project Nr.
Proposal for a unified XML-file of the avalanche report... © Patrick NAIRZ, Avalanche Warning Center Tyrol - Why do we need a unified XML-file? - Integration.
© Handwerkskammer für München und Oberbayern, Max-Joseph-Straße 4, München Dietmar Schneider Foreign Trade Department of the Chamber of Trade and.
Physik multimedial Lehr- und Lernmodule für das Studium der Physik als Nebenfach Julika Mimkes: Links to e-learning content for.
LLP DE-COMENIUS-CMP Dieses Projekt wurde mit Unterstützung der Europäischen Kommission finanziert. Die Verantwortung für den Inhalt dieser.
Computer Services Business challenge
 Präsentation transkript:

Multilingual Access to Biomedical Documents Stefan Schulz

Company

Averbis GmbH Founded in April 2007 Based in Freiburg im Breisgau Team of experts in medicine and computer sciences Averbis GmbH Shareholders Kornél Markó Philipp Daumke Campus Technologies Freiburg GmbH, Universitätsklinikum Freiburg Directors Scientific Board Prof. Dr. Rüdiger Klar PD Dr. Stefan Schulz Prof. Dr. Udo Hahn Consultants Dr. Albrecht Zaiß Prof. Dr. Bernhard Arnolds Employees & Student Workers

Averbis GmbH Innovative semantic retrieval technologies based on 10+ scientific research Search & language technologies specifically designed for health care and life sciences Target market/Scope: Averbis – Scope & Business Area

Cross Language Information Retrieval Cross language information retrieval (CLIR) deals with retrieving information written in a language different from the language of the user's query CLIR research in medicine becomes especially important in exchanging global knowledge Researchers want to share global research results Medical doctors need to exchange patient information worldwide Patients demand extensive access to medical information

Cross Language Information Retrieval Includes Monolingal Information Retrieval Benefit for multilingual users Avoid multiple queries Pose a question in their preferred language Monolingual users take advantage if their passive knowledge is sufficient to understand documents in a foreign language If (automatic) translation can be performed If image captions are used to search for images 2 3

Freiburger Handsearch-Projekt Begonnen hat das Handsearching in Deutschland im Jahr 1995 […]. Das UK Cochrane Centre koordinierte das Projekt zum Handsearching von in Europa publizierten Zeitschriften mit allgemeinem medizinischem Themenbezug. Insgesamt nahmen 16 europäische Staaten mit 12 verschiedenen Landessprachen an diesem Projekt teil. Von mehr als 100 Handsearchern wurden 119 Zeitschriften durchsucht. Dabei wurden 21.620 controlled clinical trials identifiziert (12.613 RCTs und 9.007 CCTs); davon waren 17.980 (83%) nicht als „controlled trial“ in Medline gelistet. 6.554 (30%) stammten aus Zeitschriften, die nicht in Medline aufgenommen sind. Etwa ein Drittel aller kontrollierten Studien wurden in einer anderen Sprache als Englisch publiziert, davon war ein Großteil (5.300 RCTs und CCTs) aus den 20 durchsuchten deutschsprachigen medizinischen Zeitschriften.

Core Technology

Hypotheses The true, significant elements of language are . . . either words, significant parts of words, or word groupings. [Sapir 1921] Linguistic variations make (medical) Information Retrieval difficult Levels of linguistic variations Morphology Syntax Lexico-Semantics

Linguistic variations Inflection: diseases, appendix, -ices Derivation: leucozyte, leukozytic Composition: para|sympath|ectomy Acronyms: AIDS, SARS, OECD Orthographic Variants: oesophagus, esophagus Synonyms: Sarcoidosis, Morbus Besnier-Boeck-Schaumann, Lupus pernio, benign lymphogranulomatosis, uveoparotid fever…. Proper Names: Aspirin, ASS, ...

Innovative approach conventional lexicons contain about 200.000 entries Active vocabulary is tenfold+ bigger Innovation: subword lexicons linked across languages via a thesaurus Data reduction by 90% Normalisation of all linguistic variants Optimal coding efficiency retrieval performance gain up to 50% (monolingual) and 20% (multilingual) (MedInfo 2007) Myo|card|itis Herz|muskel|entzünd|ung Inflamm|ation of the heart muscle

Morpho-Semantic Indexing High TSH values suggest the diagnosis of primary hypo-thyroidism ... Original Erhöhte TSH-Werte erlauben die Diagnose einer primären Hypo-thyreose ...

Morpho-Semantic Indexing High TSH values suggest the diagnosis of primary hypo-thyroidism ... Original Erhöhte TSH-Werte erlauben die Diagnose einer primären Hypo-thyreose ... high tsh values suggest the diagnosis of primary hypo-thyroidism ... erhoehte tsh-werte erlauben die diagnose einer primaeren hypo-thyreose ... Orthographic Rules Normalization

Morpho-Semantic Indexing High TSH values suggest the diagnosis of primary hypo-thyroidism ... Original Erhöhte TSH-Werte erlauben die Diagnose einer primären Hypo-thyreose ... high tsh values suggest the diagnosis of primary hypo-thyroidism ... erhoehte tsh-werte erlauben die diagnose einer primaeren hypo-thyreose ... Orthographic Rules Normalization high tsh value s suggest the diagnos is of primar y hypo thyroid ism er hoeh te tsh wert e erlaub en die diagnos e einer primaer en hypo thyre ose Morph. Segmentation Subword Lexicon

Morpho-Semantic Indexing High TSH values suggest the diagnosis of primary hypo-thyroidism ... Original Erhöhte TSH-Werte erlauben die Diagnose einer primären Hypo-thyreose ... high tsh values suggest the diagnosis of primary hypo-thyroidism ... erhoehte tsh-werte erlauben die diagnose einer primaeren hypo-thyreose ... Orthographic Rules Normalization high tsh value s suggest the diagnos is of primar y hypo thyroid ism er hoeh te tsh wert e erlaub en die diagnos e einer primaer en hypo thyre ose Morph. Segmentation Subword Lexicon #up tsh #value #suggest #diagnost #primar #small #thyre MID-Representation #up tsh #value #permit #diagnost #primar #small #thyre Subword Thesaurus Semantic Normalization

Products

Averbis Search Platform Ultrafast semantic search engine Optimized for Health Care and Life Sciences Content analysis and linguistic normalisation of documents Most intuitive user interfaces Laymen and expert ways to access information Multi- & crosslingual

Features Type Search for… Find… Others Averbis Typos breats cancer breast cancer Spelling oesophagus esophagus Inflection appendix appendices Word Order chronic bronchitis bronchitis, chronic Derivation leukozytic leucozyte Context parasympathectomy removal of parasympatic tissue --- Composita myocarditis Inflammation of the heart muscle Synonyms stroke apoplex Abbreviations WHO World Health Organization Laymen/Expert Breast removal mastectomy Multilinguality Herzmuskelentzündung Inflammation of the heart muscle, myocarditis

Ways to access information via Body Key E.g. Three levels Main category Sub category Diseases/Procedures (ICD/OPS) Categories selected by anatomy / functions Optional customizing to category subsets / other classifications Ear Outer Ear Middle Ear Ear Infection Hearing Loss Inner Ear Hearing Hearing loss Balance Respiratory Tract Heart and Blood Digestive System Bones, Joints and Muscles Urinary and Reproductive System Other categories >

Ways to access information Tag-Clouds Offer highly associated terms in addition to a free-text query Font size corresponds to semantic adjacency Allows a stepwise refinement or navigation through the information Sport therapy Hip Osteo-arthritis Diclofenac Ibuprofen Hip replacement Arthrose Query: Hip Joint

Ways to access information Query: Hip Joint Diseases Procedures Osteoarthritis, Hip Hip replacement Hip Disease Reoperation Hip dislocation Medicaments Researcher Kold, Søren Voltaren Ibuprofen Ovesen, Janne Related Terms: Offer highly associated terms in addition to a free-text query (like in a Tag Cloud) Grouping in predefined categories Allows to search for the most frequent diseases and procedures of an anatomical structure, e.g. „Hip Joint -> Osteoarthritis, Hip -> Hip replacements“

Classifications Averbis ist Experte für die transparente Einbindung verschiedenster medizinischer Klassifikationen in das Information Retrieval Vorteile des Einsatzes bekannter Klassifikationen: Semantische Interoperabilität Beispielsweise können Leistungen verschiedener Krankenhäuser durch Verwendung von ICD/OPS einheitlich verglichen werden Cross-Linking zwischen Terminologien Hierdurch können Benutzer per Mausklick von Organen zu Krankheiten, von Krankheiten zu Therapien, von Therapien zu Forschungsergebnissen etc. navigieren Verbesserung der Retrievalergebnisse Durch die Verwendung von Schlagwörtern wird das Auffinden von Dokumenten enorm erleichtert Fallabrechnung Effiziente Extraktion von ICD/OPS-Codes aus ärztlichen Freitexten erleichtert den klinischen Arbeitsablauf von Ärzten und führt zu mehr Zeit für die Patientenversorgung Patientensicherheit Beim instituts- und landesübergreifenden Austausch von Patientendaten können durch standardisierte Terminologien Mehrfachuntersuchungen vermieden, auf Allergien und Unverträglichkeiten hingewiesen und Krankengeschichten einheitlich übermittelt werden

Referenzen

Portal zur eigenständigen Entscheidungsfindung bei der Krankenhauswahl Aufgabe der Averbis: Einfacher Zugang zu Expertenwissen Laiensprachliche Suche Laiensprachliche Klassifikation (Körpernavigation) Launch: Frühjahr 2008 Microsite seit 18.06.07

Zentralbibliothek für Medizin Größte europäische Medizinbibliothek ~20 Millionen Datenbankeinträge 60,000 Anfragen pro Monat durch Averbis erstmalig intelligente und sprach-übergreifende Suche möglich

Thank you!