Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

9. Information Retrieval und Medizinische Literaturdatenbanken

Ähnliche Präsentationen


Präsentation zum Thema: "9. Information Retrieval und Medizinische Literaturdatenbanken"—  Präsentation transkript:

1 9. Information Retrieval und Medizinische Literaturdatenbanken
Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz

2 ? Dokumentenretrieval Anfrage (Query)
Sucher- gebnisse Kollektion von Dokumenten (Dokumentationseinheiten)

3 Problem 1: eindeutige Formulierung der Suchanfrage

4 Mehrdeutige Begriffe Ein Patient kennt das Wort "Ventrikel" nicht und gibt das Wort in eine Suchmaschine ein Wo liegt das Problem?

5 Ventrikel

6 Zwei Sprachphänomene, die die Textrecherche erschweren
Synoymie: Ein Gegenstand lässt sich durch unterschiedliche sprachliche Zeichen ausdrücken Homonymie (Ambiguität) : Unterschiedliche Gegenstände werden mit demselben sprachlichen Ausdruck belegt

7 Relevante Dokumente

8

9 Suchanfrage

10 Relevante Dokumente Suchanfrage

11 Relevante Dokumente Suchanfrage Suchmaschine

12 Relevante Dokumente Suchanfrage

13 Eine Suchanfrage… Teilt den Dokumentenraum in
Relevante Nicht relevante Dokumente Eine Suchmaschine (IR-System) Findet relevante, aber auch nichtrelevante Verfehlt relevante, schließt nichtrelevante aus

14 Gefundene Dokumente Nichtgefundene Dokumente Relevante Dokumente Nichtrelevante Dokumente

15 Precision (Genauigkeit): Anteil der relevanten an den gefundenen Dokumenten
Gefundene Dokumente Nichtgefundene Dokumente Relevante Dokumente Nichtrelevante Dokumente

16 Recall (Ausbeute, Sensitivität): Anteil der gefundenen relevanten an allen relevanten Dokumenten
Gefundene Dokumente Nichtgefundene Dokumente Relevante Dokumente Nichtrelevante Dokumente

17 Übung zu Precision / Recall
Ein Lehrbuch enthält Krankheitsbeschreibungen zu : Pneumonie, Pankreatitis, Hepatitis, Arthritis, Diabetes mellitus, Thyreoiditis, Gonarthrose, M. Crohn, Appendizitis, Rachitis. Ziel: Selektiere alle Dokumente über entzündliche Erkrankungen Methode: Jeder Titel, der den Teilstring "itis" enthält, wird als relevant betrachtet. Wie ist die Precision, wie der Recall dieser Methode ? Gegeben eine große (n > 1000) Dokumentenkollektion, was ist einfacher zu messen, Precision oder Recall ?

18 Übung zu Precision / Recall
Ein Lehrbuch enthält Krankheitsbeschreibungen zu : Pneumonie, Pankreatitis, Hepatitis, Arthritis, Diabetes mellitus, Thyreoiditis, Gonarthrose, M. Crohn, Appendizitis, Rachitis. Ziel: Selektiere alle Dokumente über entzündliche Erkrankungen Methode: Jeder Titel, der den Teilstring "itis" enthält, wird als relevant betrachtet. Wie ist die Precision, wie der Recall dieser Methode ? Gegeben eine große (n > 1000) Dokumentenkollektion, was ist einfacher zu messen, Precision oder Recall ?

19 Indexierung Feststellen und Kennzeichnen des Inhalts einer Dokumentationseinheit mit Hilfe sogenannter Deskriptoren Zuordnung von Deskriptoren zu Dokumentationseinheiten: Indexieren Manuelles Indexieren: Zuweisung von Deskriptoren aus einem vorgegebenen Vokabular durch Experten

20 Manuelles Indexieren Beispiel:MEDLINE
Fachkräfte weisen jedem Dokument Deskriptoren aus einem Indexierungsvokabular zu. Indexierungsvokabular: MeSH (Medical Subject Headings) Multihierarchisches Schlagwortsystem

21 Automatisches Indexieren
Beispiel: GOOGLE "Crawler" bewegen sich automatisch / zufallsgesteuert durch das World Wide Web und erstellen / aktualisieren Index Indexierungsvokabular: sämtliche Textwörter minus Stoppwörter

22

23 Suchmaschinen Gleichen Anfrage ab mit (asynchron erstelltem) Index
Auswahl und Verknüpfung der Indexterms bedingt die Dokumentenselektion Schilddrüsen- krankheiten Radioaktivität Schilddrüsen- krankheiten Radioaktivität

24 Suchmaschinen Gleichen Anfrage ab mit (asynchron erstelltem) Index
Auswahl und Verknüpfung der Indexterms bedingt die Dokumentenselektion OR AND

25

26

27 Anfragesyntax Vorsicht: Jede Suchmaschine hat ihre eigene Syntax
Typische Operatoren Boolesche Operatoren: AND OR NOT Trunkierung, z.B. magen* Phrasen: "sick sinus syndrome" Synonyme: ~Kidney (z.B. Google, aber Vorsicht! )

28 Medline-Datenbank Inhalt: Bibliographische Angaben zu biomedizinischen Publikation in (ausgewählten) wissenschaftlichen Fachzeitschriften und Sammelbänden. Anbieter: National Library of Medicine (USA) 5300 Journals 37 Sprachen Referenzen von 1949 bis heute 2000 – 4000 neue Referenzen täglich

29 PubMed Suchoberfläche
Anbieter: National Library of Medicine Freier Zugang zur Medline Datenbank

30 x 1000

31 ~ 5.300 Medline Journals Umfang in PubMed Aktualität
Am Medline in process Supplied by Publisher, Other: nicht oder unvollständig verschlagwortet nicht mit MeSH suchbar Zitate Oldmedline wird sukzessive in Medline integriert Medline: Verschlagwortung nach einigen Tagen bis zu einigen Monaten ~ Medline Journals

32 MEDLINE - Datenbankeintrag

33 MEDLINE - Datenbankeintrag

34 Medical Subject Headings (MeSH)
Ca MeSH-Deskriptoren Entry Terms (Synonyme und spezifischere Terms) 76 Subheadings (“Qualifier”) “Therapy”, “Prevention and Control” Definitionen Indexierungszeitraum

35 MeSH Poly-hierarchische Struktur (ein Term kann mehrere Eltern haben)

36

37 Welche Wörter sollen in einer Textwortsuche verwendet werden?
Prävention von Ösophagus-varizen-blutungen

38 2. Efficacy of prophylactic sclerotherapy for prevention of
Suche nach Primärprophylaxe von Ösophagusvarizenblutungen 1. Beta-blocker plus nitrate for primary prophylaxis of variceal bleeding. 2. Efficacy of prophylactic sclerotherapy for prevention of a first variceal hemorrhage. 3. Beta-blockers for the prevention of variceal haemorrhage in patients with cirrhosis. 4. Primary prevention of bleeding from esophageal varices.

39 Prevention of variceal bleeding (Textwortsuche)
Hemorrhage(s) Haemorrhage(s) Variceal Varices Varix Prophylaxis Prevention

40 Prevention of variceal bleeding (Textwortsuche, Trunkierung)
Hemorrhag* Haemorrhag* Varic* Prohyla* Prevent*

41 Prevention of variceal bleeding (Textwortsuche, log. Operatoren)
(bleed* OR hemorrhag* OR haemorrhag*) AND varic* AND (prophyla* OR prevent*) Bleed* Hemorrhag* Haemorrhag* Varic* Prophyla* Prevent* OR AND OR

42 Medline-Zitat (Bei PubMed: www.pubmed.gov)
MeSH/subheading (=qualifier) * Hauptaspekt des Artikels

43 MeSH=Medical Subject Headings
Thesaurus (kontrolliertes Vokabular), erstellt von der National Library of Medicine (NLM) - ca Begriffe (mit Verweisen und Synonymen) - polyhierarchische Struktur („Tree“ structure) Suche nach allen Unterbegriffen in einem Schritt mit „Explode“ (interne OR-Verbindung)

44 Vor- und Nachteile der Suche mit MeSH
Vorteile: Synonyme und versch. Schreibweisen werden automatisch berücksichtigt. Bei hierarchischem Aufbau Suche nach Ober- und Unterbegriffen in einem Schritt. Inhaltliche Zusammenhänge sind suchbar durch MeSH/Subheading-Kombination. Bsp.: Gastrointestinal Hemorrhage/prevention & control Artikel durch Fachpersonal verschlagwortet vergebenes Schlagwort ist Gegenstand der Arbeit. Nachteile: Uneinheitliche Verschlagwortung (Indexierung)  Zutreffendes wird nicht gefunden. Aktuelle, noch nicht verschlagwortete Artikel werden nicht gefunden (Komponente Premedline). Für neue Substanznamen oder neue medizinische Terme existiert noch kein MeSH.

45 Suche einschränken

46 Suche weiter einschränken

47 Search history

48 Automatic term mapping
Naive Suche Automatischer Abgleich mit Indexen MeSH, Journal, Author

49

50 Expansion von Trunkierungen

51 Suchstrategien

52 Evtl. weitere Aspekte Aspekt 1 Aspekt 2 Suchfilter
Frage in Blöcke zerlegen (PICO) Evtl. weitere Aspekte Aspekt 1 Aspekt 2 Suchfilter MeSH-Term(s) Explode: erweitern Subheadings: eingrenzen MeSH-Term(s) Explode: erweitern Subheadings: eingrenzen z.B. Cochrane highly sensitive search filter for randomized controlled trials. Suchbegriffe finden Textwörter (verwandte Begriffe, Synonyme, Trunkierung) Textwörter (verwandte Begriffe, Synonyme, Trunkierung) Begriffe kombinieren OR OR Aspekte kombinieren AND AND

53


Herunterladen ppt "9. Information Retrieval und Medizinische Literaturdatenbanken"

Ähnliche Präsentationen


Google-Anzeigen