Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Ähnliche Präsentationen


Präsentation zum Thema: "9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz."—  Präsentation transkript:

1 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz

2 Sucher- gebnisse Kollektion von Dokumenten (Dokumentationseinheiten) Anfrage (Query) ? Dokumentenretrieval

3 Problem 1: eindeutige Formulierung der Suchanfrage

4 Mehrdeutige Begriffe Ein Patient kennt das Wort "Ventrikel" nicht und gibt das Wort in eine Suchmaschine ein Wo liegt das Problem?

5 Ventrikel

6 Zwei Sprachphänomene, die die Textrecherche erschweren Synoymie: Ein Gegenstand lässt sich durch unterschiedliche sprachliche Zeichen ausdrücken Homonymie (Ambiguität) : Unterschiedliche Gegenstände werden mit demselben sprachlichen Ausdruck belegt

7 Relevante Dokumente

8

9 Suchanfrage

10 Relevante Dokumente

11 Suchanfrage Relevante Dokumente Suchmaschine

12 Suchanfrage Relevante Dokumente

13 Eine Suchanfrage… Teilt den Dokumentenraum in – Relevante – Nicht relevante Dokumente Eine Suchmaschine (IR-System) – Findet relevante, aber auch nichtrelevante – Verfehlt relevante, schließt nichtrelevante aus

14 Relevante Dokumente Nichtrelevante Dokumente Gefundene Dokumente Nichtgefundene Dokumente

15 Relevante Dokumente Nichtrelevante Dokumente Gefundene Dokumente Nichtgefundene Dokumente Precision (Genauigkeit): Anteil der relevanten an den gefundenen Dokumenten

16 Relevante Dokumente Nichtrelevante Dokumente Gefundene Dokumente Nichtgefundene Dokumente Recall (Ausbeute, Sensitivität): Anteil der gefundenen relevanten an allen relevanten Dokumenten

17 Übung zu Precision / Recall Ein Lehrbuch enthält Krankheitsbeschreibungen zu : Pneumonie, Pankreatitis, Hepatitis, Arthritis, Diabetes mellitus, Thyreoiditis, Gonarthrose, M. Crohn, Appendizitis, Rachitis. Ziel: Selektiere alle Dokumente über entzündliche Erkrankungen Methode: Jeder Titel, der den Teilstring "itis" enthält, wird als relevant betrachtet. Wie ist die Precision, wie der Recall dieser Methode ? Gegeben eine große (n > 1000) Dokumentenkollektion, was ist einfacher zu messen, Precision oder Recall ?

18 Übung zu Precision / Recall Ein Lehrbuch enthält Krankheitsbeschreibungen zu : Pneumonie, Pankreatitis, Hepatitis, Arthritis, Diabetes mellitus, Thyreoiditis, Gonarthrose, M. Crohn, Appendizitis, Rachitis. Ziel: Selektiere alle Dokumente über entzündliche Erkrankungen Methode: Jeder Titel, der den Teilstring "itis" enthält, wird als relevant betrachtet. Wie ist die Precision, wie der Recall dieser Methode ? Gegeben eine große (n > 1000) Dokumentenkollektion, was ist einfacher zu messen, Precision oder Recall ?

19 Indexierung Feststellen und Kennzeichnen des Inhalts einer Dokumentationseinheit mit Hilfe sogenannter Deskriptoren Zuordnung von Deskriptoren zu Dokumentationseinheiten: Indexieren Manuelles Indexieren: Zuweisung von Deskriptoren aus einem vorgegebenen Vokabular durch Experten

20 Manuelles Indexieren Beispiel:MEDLINE Fachkräfte weisen jedem Dokument Deskriptoren aus einem Indexierungsvokabular zu. Indexierungsvokabular: MeSH (Medical Subject Headings) Multihierarchisches Schlagwortsystem

21 Automatisches Indexieren Beispiel: GOOGLE "Crawler" bewegen sich automatisch / zufallsgesteuert durch das World Wide Web und erstellen / aktualisieren Index Indexierungsvokabular: sämtliche Textwörter minus Stoppwörter

22

23 Suchmaschinen Gleichen Anfrage ab mit (asynchron erstelltem) Index Auswahl und Verknüpfung der Indexterms bedingt die Dokumentenselektion Schilddrüsen- krankheiten RadioaktivitätSchilddrüsen- krankheiten Radioaktivität

24 Suchmaschinen Gleichen Anfrage ab mit (asynchron erstelltem) Index Auswahl und Verknüpfung der Indexterms bedingt die Dokumentenselektion AND OR

25

26

27 Anfragesyntax Vorsicht: Jede Suchmaschine hat ihre eigene Syntax Typische Operatoren Boolesche Operatoren: AND OR NOT Trunkierung, z.B. magen* Phrasen: "sick sinus syndrome" Synonyme: ~Kidney (z.B. Google, aber Vorsicht! )

28 Medline-Datenbank Inhalt: Bibliographische Angaben zu biomedizinischen Publikation in (ausgewählten) wissenschaftlichen Fachzeitschriften und Sammelbänden. Anbieter: National Library of Medicine (USA) 5300 Journals 37 Sprachen Referenzen von 1949 bis heute 2000 – 4000 neue Referenzen täglich

29 PubMed Suchoberfläche Anbieter: National Library of Medicine Freier Zugang zur Medline Datenbank –

30 x 1000

31 Umfang in PubMedAktualität Medline in process Supplied by Publisher, Other: nicht oder unvollständig verschlagwortet nicht mit MeSH suchbar Medline: Verschlagwortung nach einigen Tagen bis zu einigen Monaten ~ Medline Journals Zitate Am Oldmedline wird sukzessive in Medline integriert

32 MEDLINE - Datenbankeintrag

33

34 Medical Subject Headings (MeSH) Ca MeSH-Deskriptoren Entry Terms (Synonyme und spezifischere Terms) 76 Subheadings (Qualifier) – Therapy, Prevention and Control Definitionen Indexierungszeitraum

35 MeSH Poly-hierarchische Struktur ( ein Term kann mehrere Eltern haben)

36

37 Welche Wörter sollen in einer Textwortsuche verwendet werden? Prävention von Ösophagus- varizen- blutungen

38 Suche nach Primärprophylaxe von Ösophagusvarizenblutungen 1. Beta-blocker plus nitrate for primary prophylaxis of variceal bleeding. 2. Efficacy of prophylactic sclerotherapy for prevention of a first variceal hemorrhage. 3. Beta-blockers for the prevention of variceal haemorrhage in patients with cirrhosis. 4. Primary prevention of bleeding from esophageal varices.

39 Prevention of variceal bleeding (Textwortsuche) Bleeding Hemorrhage(s) Haemorrhage(s) Variceal Varices Varix Prophylaxis Prevention

40 Prevention of variceal bleeding (Textwortsuche, Trunkierung) Bleed* Hemorrhag* Haemorrhag* Varic* Prohyla* Prevent*

41 Prevention of variceal bleeding (Textwortsuche, log. Operatoren) Bleed* Hemorrhag* Haemorrhag* Varic* Prophyla* Prevent* OR AND (bleed* OR hemorrhag* OR haemorrhag*) AND varic* AND (prophyla* OR prevent*)

42 MeSH/subheading (=qualifier) * Hauptaspekt des Artikels Medline-Zitat (Bei PubMed:

43 Thesaurus (kontrolliertes Vokabular), erstellt von der National Library of Medicine (NLM) - ca Begriffe (mit Verweisen und Synonymen) - polyhierarchische Struktur (Tree structure) Suche nach allen Unterbegriffen in einem Schritt mit Explode (interne OR-Verbindung) MeSH=Medical Subject Headings

44 Vorteile: Synonyme und versch. Schreibweisen werden automatisch berücksichtigt. Bei hierarchischem Aufbau Suche nach Ober- und Unterbegriffen in einem Schritt. Inhaltliche Zusammenhänge sind suchbar durch MeSH/Subheading-Kombination. Bsp.: Gastrointestinal Hemorrhage/prevention & control Artikel durch Fachpersonal verschlagwortet vergebenes Schlagwort ist Gegenstand der Arbeit. Vor- und Nachteile der Suche mit MeSH Nachteile: Uneinheitliche Verschlagwortung (Indexierung) Zutreffendes wird nicht gefunden. Aktuelle, noch nicht verschlagwortete Artikel werden nicht gefunden (Komponente Premedline). Für neue Substanznamen oder neue medizinische Terme existiert noch kein MeSH.

45 Suche einschränken

46 Suche weiter einschränken

47 Search history

48 Automatic term mapping Naive Suche Automatischer Abgleich mit Indexen – MeSH, Journal, Author

49

50 Expansion von Trunkierungen

51 Suchstrategien

52 Frage in Blöcke zerlegen (PICO) Suchbegriffe finden MeSH-Term(s) -Explode: erweitern -Subheadings: eingrenzen Textwörter (verwandte Begriffe, Synonyme, Trunkierung) Begriffe kombinieren OR Textwörter (verwandte Begriffe, Synonyme, Trunkierung) OR AND Aspekt 1Aspekt 2 Evtl. weitere Aspekte Suchfilter z.B. Cochrane highly sensitive search filter for randomized controlled trials. Aspekte kombinieren AND MeSH-Term(s) -Explode: erweitern -Subheadings: eingrenzen

53


Herunterladen ppt "9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz."

Ähnliche Präsentationen


Google-Anzeigen