Visualisierung von Suchanfragen- und Ergebnissen Christian Philipp 24.07.2006 Betreuung: Sylvia Radeschütz
Skitter hyperbolic visualization using hypview tool (original tool courtesy Tamara Munzner, Stanford University) Quelle: http://www.caida.org/tools/measurement/skitter/visualizations.xml
Übersicht Einleitung Visualisierung von Suchanfragen Visualisierung von Suchergebnissen Suchunterstützende Darstellungsformen Ausblick und Zusammenfassung
Der Informationssuchprozess nach Marchionini, G. (1995)
Der Informationssuchprozess nach Marchionini, G. (1995) Erkennen des Problems
Der Informationssuchprozess nach Marchionini, G. (1995) Erkennen des Problems Definieren des Problems
Der Informationssuchprozess nach Marchionini, G. (1995) Erkennen des Problems Definieren des Problems Auswählen des Suchsystems
Der Informationssuchprozess nach Marchionini, G. (1995) Erkennen des Problems Definieren des Problems Auswählen des Suchsystems Formulieren der Anfrage
Der Informationssuchprozess nach Marchionini, G. (1995) Erkennen des Problems Definieren des Problems Auswählen des Suchsystems Ausführen der Suche Formulieren der Anfrage
Der Informationssuchprozess nach Marchionini, G. (1995) Erkennen des Problems Definieren des Problems Auswählen des Suchsystems Betrachten der Suchergebnisse Ausführen der Suche Formulieren der Anfrage
Der Informationssuchprozess nach Marchionini, G. (1995) Erkennen des Problems Definieren des Problems Auswählen des Suchsystems Betrachten der Suchergebnisse Ausführen der Suche Formulieren der Anfrage Auswählen der Suchergebnisse
Der Informationssuchprozess nach Marchionini, G. (1995) Erkennen des Problems Definieren des Problems Auswählen des Suchsystems Betrachten der Suchergebnisse Ausführen der Suche Formulieren der Anfrage Auswählen der Suchergebnisse Wiederholen oder Beenden des Suchprozesses
Wozu braucht man Informationsvisualisierung? Darstellung großer Datenmengen schnelles Erfassen von Information erkennen wesentlicher Information Darstellung von schwer beschreibbaren Information Unterstützung zur Informationsgewinnung animiert den Benutzer zum arbeiten
Probleme beschränkte Rechenleistung, lange Ladezeiten nur wenig Studien bekannt zu viele verschiedene Tools, es setzt sich nichts durch Akzeptanzprobleme hoher Entwicklungsaufwand Übersichtlichkeit nur selten gegeben
Übersicht Einleitung Visualisierung von Suchanfragen Visualisierung von Suchergebnissen Suchunterstützende Darstellungsformen Ausblick und Zusammenfassung
Visualisierung von Suchanfragen Boolesche Anfragen Kommandozeilen basierende Anfragen Fassettierte Anfragen Graphische Ansätze Anfrage Baum Venn-Diagramm Block-Diagramm Magic lenses
Boolesche Anfragen Suchanfragen werden mit logischen Operatoren verknüpft (AND,OR,NOT)
Probleme bei Booleschen Anfragen Quadrat Rechteck und Suche Dokumente, die „Quadrat“, „Rechteck“ oder beides enthalten Suche Dokumente, die nur beides „Quadrat“ und „Rechteck“ enthalten Quadrat Rechteck oder Suche Dokumente, die „Quadrat“ oder „Rechteck“ enthalten Suche Dokumente, die „Quadrat“, „Rechteck“ oder beides enthalten
Sprachlicher Ausdruck Probleme bei Booleschen Anfragen Sprachlicher Ausdruck Logischer Ausdruck
Liste mit Eingabefeldern deren Titel die genau Bedeutung vorgibt Lösung des Problems Liste mit Eingabefeldern deren Titel die genau Bedeutung vorgibt Quelle: www.google.de, ©2006 Google
Kommandobasierte Anfragen Suchanfrage wird in einer Kommandozeile eingeben Spezielle Suchanfrage Syntax verfeinert die Suche n Suchanfrage: Sucht nach php, html Dokumenten die nach dem 1.1.2006 erschienen sind und in der Beschreibung „kvv“ enthalten. Es wird direkt nach „Konzert“ gesucht oder ein Wort das auf „festival“ endet, nach der Wortgruppe „System of a Down“ aber nicht das Wort „Album“ in deren unmittelbarer nähe auch das Wort „Ticket“ oder „Karten“ steht. ((konzert. OR *festival) AND „System of a Down“ AND !album) NEAR (Ticket OR Karten) AFTER:01/01/2006 DOCTYPE: php,html DISCRIPTION:kvv
Probleme Syntax der Anfragesprache muss erst erlernt werden ist oft schwer zu merken wird nach seltenem Benutzen wieder vergessen wenn man mehrere Suchmaschinen mit ähnlicher Syntax benutzt, kommt man durcheinander
Formular zur Suchanfrage Lösung der Probleme Formular zur Suchanfrage Quelle: www.google.de, ©2006 Google Quelle: www.google.de, ©2006 Google
Fassettierte Suchanfrage oft wird zu viel oder zu wenig gefunden Anfrage in Gruppen unterteilen Anzeigen wie viel dazu gefunden wird Suchergebnisse einer Gruppe (Fassette) anzeigen, mit anderen verbinden oder neue Suchbegriffe hinzufügen Fassette erklären
Fassettierte Suchanfrage Suchanfrage: Open Jazz Stuttgart Herbi Hancock 2006 Open 77.700.000 Jazz 19.600.000 Stuttgart 73.600.000 Herbi Hancock 64 2006 736.000.000 Gesamtanzahl: 906.900.064
Fassettierte Suchanfrage Suchanfrage: Open Jazz Stuttgart Herbi Hancock 2006 Open 77.700.000 Jazz 19.600.000 Stuttgart 73.600.000 Herbi Hancock 64 2006 736.000.000 Gesamtanzahl: 170.900.064
Fassettierte Suchanfrage Suchanfrage: Open Jazz Stuttgart Herbi Hancock 2006 Open 77.700.000 Jazz 19.600.000 Stuttgart 73.600.000 Herbi Hancock 64 2006 736.000.000 Gesamtanzahl: 93.200.064
Erweiterte fassettierte Suche Zeile 1 Computer Rechner Laptop Notebook Zeile 2 Kühler Lüfter Zeile 3 Systeme mehre Eingabezeilen Jede Zeile kann mehrere Begriffe haben alle Begriffskombination senkrecht ergeben eine Suchanfrage
Erweiterte fassettierte Suche Zeile 1 Computer Rechner Laptop Notebook Zeile 2 Kühler Lüfter Zeile 3 Systeme Suchanfrage 1: Computer Kühler Systeme mehre Eingabezeilen Jede Zeile kann mehrere Begriffe haben alle Begriffskombination senkrecht ergeben eine Suchanfrage
Erweiterte fassettierte Suche Zeile 1 Computer Rechner Laptop Notebook Zeile 2 Kühler Lüfter Zeile 3 Systeme Suchanfrage 1: Computer Kühler Systeme mehre Eingabezeilen Jede Zeile kann mehrere Begriffe haben alle Begriffskombination senkrecht ergeben eine Suchanfrage Suchanfrage 2: Laptop Lüfter Systeme
Erweiterte fassettierte Suche Zeile 1 Computer Rechner Laptop Notebook Zeile 2 Kühler Lüfter Zeile 3 Systeme Suchanfrage 1: Computer Kühler Systeme mehre Eingabezeilen Jede Zeile kann mehrere Begriffe haben alle Begriffskombination senkrecht ergeben eine Suchanfrage Suchanfrage 2: Laptop Lüfter Systeme … Suchanfrage 8: Laptop Lüfter Systeme
Graphische Suchanfragen Anfrage-Baum Venn-Diagramm Block-Diagramm Magic lenses
Anfrage-Baum Programm WinZip Vorteil: Nachteil: Pack Entpack
Venn-Diagramm Informatik Novanet Stuttgart StuPro A Universität 73.800.000 361.000 Stuttgart StuPro A 1.180.000 132.000.000 Universität ist ein Mengendiagramm besteht aus Ringen und Punkten Zahlen geben die Anzahl der Dokumente an ein ausgewählter Rahm legt den Suchbereich fest Punkte markieren Suchbegriff Vorteile: ? Nachteile:? Begriffe statt A,B,C 153.000.000
Venn-Diagramm Informatik Novanet Stuttgart StuPro A Universität 73.800.000 361.000 Stuttgart StuPro A 1.180.000 132.000.000 Universität ist ein Mengendiagramm besteht aus Ringen und Punkten Zahlen geben die Anzahl der Dokumente an ein ausgewählter Rahm legt den Suchbereich fest Punkte markieren Suchbegriff Vorteile: ? Nachteile:? Begriffe statt A,B,C 153.000.000
Venn-Diagramm Informatik Novanet Stuttgart StuPro A Universität 73.800.000 361.000 Stuttgart StuPro A 1.180.000 132.000.000 Universität ist ein Mengendiagramm besteht aus Ringen und Punkten Zahlen geben die Anzahl der Dokumente an ein ausgewählter Rahm legt den Suchbereich fest Punkte markieren Suchbegriff Vorteile: ? Nachteile:? Begriffe statt A,B,C 153.000.000
Venn-Diagramm Suchanfrage: Informatik Informatik Novanet Stuttgart 73.800.000 361.000 Stuttgart StuPro A 1.180.000 132.000.000 Universität ist ein Mengendiagramm besteht aus Ringen und Punkten Zahlen geben die Anzahl der Dokumente an ein ausgewählter Rahm legt den Suchbereich fest Punkte markieren Suchbegriff Vorteile: ? Nachteile:? Begriffe statt A,B,C 153.000.000 Suchanfrage: Informatik
Venn-Diagramm Suchanfrage: Universität Stuttgart | Informatik Novanet 73.800.000 361.000 Stuttgart StuPro A 1.180.000 132.000.000 Universität ist ein Mengendiagramm besteht aus Ringen und Punkten Zahlen geben die Anzahl der Dokumente an ein ausgewählter Rahm legt den Suchbereich fest Punkte markieren Suchbegriff Vorteile: ? Nachteile:? Begriffe statt A,B,C 153.000.000 Suchanfrage: Universität Stuttgart | Informatik
Venn-Diagramm Suchanfrage: Universität Stuttgart [ohne] Informatik Novanet 73.800.000 361.000 Stuttgart StuPro A 1.180.000 132.000.000 Universität ist ein Mengendiagramm besteht aus Ringen und Punkten Zahlen geben die Anzahl der Dokumente an ein ausgewählter Rahm legt den Suchbereich fest Punkte markieren Suchbegriff Vorteile: ? Nachteile:? 153.000.000 Suchanfrage: Universität Stuttgart [ohne] Informatik
Block-Diagramm nach Anick et al. Suchanfrage wird in Blöcke aufgeteilt Blöcke die hintereinander stehen werden mit „Und“ verknüpft Blöcke die untereinander stehen werden mit „Oder“ verknüpft Blöcke können aktiviert und deaktiviert werden
Block-Diagramm Suchanfrage: Elektronische Bass Gitarre schwarz Akustische Bass Gitarre schwarz Elektronische Bassgitarre Suchanfrage: Elektronische Bass Gitarre schwarz
Block-Diagramm Suchanfrage: Elektronische Gitarre schwarz Akustische Bass Gitarre schwarz Elektronische Bassgitarre Suchanfrage: Elektronische Gitarre schwarz
Block-Diagramm Suchanfrage: Elektronische Gitarre Akustische Bass schwarz Elektronische Bassgitarre Suchanfrage: Elektronische Gitarre
Block-Diagramm Suchanfrage 1: Elektronische Gitarre Akustische Bass Gitarre schwarz Elektronische Bassgitarre Vorteile: Nachteile: Suchanfrage 1: Elektronische Gitarre Suchanfrage 2: Akustische Gitarre
Magic lenses gegeben ist eine Grundmenge von Dokumenten Begriffe entsprechen Linsen Linsen übereinander entspricht der „Und“- Verknüfung Linsen nebeneinander entsprechen der „Oder“-Verknüpfung die Anzahl der zu findenden Wörter lässt sich einstellen
Magic lenses Fussball 20
Magic lenses Fussball 20 Torwart 1
Übersicht Einleitung Visualisierung von Suchanfragen Visualisierung von Suchergebnissen Suchunterstützende Darstellungsformen Ausblick und Zusammenfassung
Visualisierung von Suchergebnissen Trefferliste Tile Bars ScatterPlot
Trefferliste Quelle: www.fireball.de, © 2006 Lycos Europe GmbH Auflistung der Treffer Dokumenttitel als Überschrift Metadaten werden angezeigt (URL, Größe,Kontext) Bei der Websuche verweist der Dokumenttitel auf die gefundene Seite Quelle: www.fireball.de, © 2006 Lycos Europe GmbH
Trefferliste bei vielen Treffern seitenweises Anzeigen zwei Ansichten für die Treffer Kurz- und Detailansicht öffnen des Trefferdokumentes über oder anstatt der Trefferliste oder im neuen Fenster Hervorhebungen Kontextdaten unter dem Dokumenttitel Vorschaufunktion des Trefferdokumentes
Hervorhebungen Quelle: www.altavista.com, © 2006 Overture Services, Inc.
Kontextanzeige zeigt den Suchbegriff mit seinem Kontext im Trefferdokument an Satzteile die den Suchbegriff enthalten werden mit „…“ getrennt Satzteile in chronologischer Reihenfolge des Trefferdokumentes Suchbegriff wird hervorgehoben oft auf 2-3 Zeilen beschränkt Quelle: www.altavista.com, © 2006 Overture Services, Inc.
TileBars Suchanfrage erfolgt facettiert mit einem Begriff pro Zeile Bungeejumping Begriff 2 Brücke Begriff 3 Hubschrauber
TileBars Spalten entsprechen Abschnitten im Dokument Bungeejumping Brücke Hubschrauber Länge des Dokumentes Je dunkler der Abschnitt desto größer, ist die Übereinstimmung mit den jeweiligen Begriffen
TileBars Bungeejumping www.jump.de Jump www.shee.de Bungeefotos www.wuhaaa.com Brücken www.bruecken.de Ebay www.ebay.de Hubschrauber www.schrauber.org Fluggeräte www.schrauber.org
ScatterPlot Quelle: Pacific Northwest Laboratori Ergebnisdokument wird gescannt und Begriffe die oft auftauchen werden mit Bergen gekennzeichnet Vorteile: Nachteile: Quelle: Pacific Northwest Laboratori
Übersicht Einleitung Visualisierung von Suchanfragen Visualisierung von Suchergebnissen Suchunterstützende Darstellungsformen Ausblick und Zusammenfassung
Suchunterstützende Darstellungsformen Clustering Bäume Standard Baum Cylindrical Tree Cone Tree / Cam Tree Hotspotvisualisierung Hub und Autorities Linksturktur Hyperbolische Graphen
Clustering Quelle: www.vivisimo.com, © vivisimo, Inc. 2000-2006
Clustering Bezeichnet das ermitteln von Gruppen aus ein Grundmenge von Objekten Für das ermitteln dieser Gruppen werden Clusteralgorithmen benutzt Clusteralgorithmen werden in Hierarchische und Partitionierende Verfahren unterteilt
Hierachisches Clustering Es gibt teilende und anhäufende Verfahren Eine Ähnlichkeits- oder Distanzfunktion d(a,b) ermittelt den Abstand zwischen zwei Punkten Das Ergebnis wird oft als Dendrogramm dargestellt
Dendrogramm A B C D E A,B D,E A,B,C A,B,C,D,E Teilende: Anhäufende: Bei anhäufenden Verfahren wird jedes Element als Cluster betrachtet und anhand einer Distanzfunktion d(a,b) zu einem neuen Cluster hinzugefügt A,B,C A,B,C,D,E
Standard Baum Quelle: http://asi-www.informatik.uni-hamburg.de/themen/se/arbeiten/historytool/historytool/gesamt.zip
Collapsible Cylindrical Trees Quelle: http://users.informatik.haw-hamburg.de/~use-lab/papers/DA-Harms.pdf
Cone Tree Nachteil: Beschriftungteil zu Kurz Quelle: http://www.limsi.fr/Individu/jacquemi/IRI-TR/visu-inter2.html
Cam Tree Vorteile: Bessere Beschriftung als bei Cone Tree Nachteile: einige Daten werden verdeckt und müssen erst gedreht werden um sie zu erkennen Bei Bäumen mit hoher Tiefe wird der Baum schnell unüberichtlich (Robertson et al. 1991) Quelle: http://www.ifs.tuwien.ac.at/~silvia/wien/gwa/ws05/
Hotspotvisualisierung eine weiter Möglichkeit Mengen von Suchergebnissen darzustellen Dokumente werden durch ihre Referenzen beschrieben Hub Autorities Linkstruktur Hyperbolische Graphen
Dokumente mit ausgehenden Links Hubs Dokumente mit ausgehenden Links
Dokumente auf die verlinkt wird Authorities Dokumente auf die verlinkt wird
Linkstruktur zeigt Verknüpfung von Suchergebnissen untereinander an Kann genutzt werden um die Verlinkung von Suchergebnissen aufzuzeigen, oder auch um die interne Struktur einer Webseite anzuzeigen. Vorteile: Nachteile:
Linkstruktur Quelle: www.google.de, ©2006 Google Beispiel: Google Browser Tough Graph Quelle: www.google.de, ©2006 Google
GoogleBrowser Quelle: http://www.touchgraph.com/TGGoogleBrowser.html
Hyperbolische Graphen Skitter hyperbolic visualization using hypview tool (original tool courtesy Tamara Munzner, Stanford University)
Hyperbolische Graphen kann mehr Konten erfassen als ein normaler Graph lässt sich zoomen das Objekt von Interesse kommt in der Vordergrund Vorteile: Nachteile: Skitter Projekt Quelle: http://www.caida.org/tools/measurement/skitter/
Übersicht Einleitung Visualisierung von Suchanfragen Visualisierung von Suchergebnissen Suchunterstützende Darstellungsformen Ausblick und Zusammenfassung
Ausblick Graphische Darstellung haben ein enormes Potenzial, den Webnutzer das Suchen zu erleichtern Durch die ständige Leistungssteigerung der Computerhardware werden neuere Darstellungsmöglichkeiten im 3D Bereich möglich sein Das Thema Visualisierung von Suchanfragen und Suchergebnissen ist noch weitestgehend unerforscht, es steckt als noch eine Menge Potential darin Berücksichtigung der Zeit in Visualisierungen
Zusammenfassung Informationsvisualisierung ist im gesamten Suchprozess einsetzbar Möglichkeiten zur Visualisierung von Suchanfragen wurden aufgezeigt Möglichkeiten zur Visualisierung von Suchergebnissen wurden aufgezeigt graphische Ansätze und Techniken die bei der Informationsvisualisierung nützlich sein können
Quellen Modern Information Retrieval Chapter 10: User Interfaces and Visualization - by Marti Hearst http://www.sims.berkeley.edu/~hearst/irbook/10/chap10.html A Tutorial on Clustering Algorithms http://www.elet.polimi.it/upload/matteucc/Clustering/tutorial_html/index.html Wikipedia http://wikipedia.org/ Datenvisualisierung und Data Mining, Daniel A. Keim http://fusion.cs.uni-magdeburg.de/pubs/spektrum.pdf Visualisierung großer Datenmengen von Zvonimir Jembrih und Andrea Klöpfel http://www.hdm-stuttgart.de/~ak073/downs/HCI_Visualis-gr-Datenmengen-sw.pdf
Danke für Ihre Aufmerksamkeit
Fragen? …