Inhalt der Präsentation

Slides:



Advertisements
Ähnliche Präsentationen
Kohonennetze für Information Retrieval mit User Feedback
Advertisements

Inhalt Saarbrücken,.
Tipps und Tricks bei der Internetsuche
What Computers still cant do A Critique of Artificial Reason Hubert L. Dreyfus.
Internet Applikationen – Search Engines Copyright ©2003, 2004 Christian Donner. Alle Rechte vorbehalten. Architektur Moderner Internet Applikationen.
Google Larry Page Sergej Brin 7. Sept Google Inc. PageRank – Citation Index – Qualität der Suchergebnisse Wider die Lügen im Hyperraum – Ranking.
Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik Vertiefung.
16. Juni 2006 Stefan Ukena Burstein und McDermott: Ontology Translation for Interoperability Among Semantic Web Services Hamburg, 16. Juni 2006.
Klaus Kopperschmidt 22. Januar 2001
Datenbankzugriff im WWW (Kommerzielle Systeme)
Auswertung der Interviews
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
QBE in MS Access formulieren
WIRTSCHAFTSINFORMATIK Westfälische Wilhelms-Universität Münster WIRTSCHAFTS INFORMATIK Seminar Software Agenten Agenten als Informationsfilter Referent.
Markplätze für Agenten Seminar Softwareagenten Timo Hoelzel.
1 KM-Modul: Knowledge Wizard Personalisierte Verknüpfung von Wissensprozessen und Geschäftsprozessen auf Basis von Metainformationen Dr. Marc Diefenbruch.
Bau effizienter und effektiver Metasuchmaschinen
Suchmaschinenlabor an der Uni Hannover Derek Daniel.
Oracle WebServer - Einführung. © Prof. T. Kudraß, HTWK Leipzig Oracle Web Application Server HTML WebServer ® File system Static HTML PL/SQL Packages.
SYSTRAN Information and translation technologies.
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
Rigi und Web2Rsf vorgestellt von Tobias Weigand. Inhalt Ziel von Web2Rsf und Rigi Vorstellung des Parsers Web2Rsf Vorstellung des Werkzeugs Rigi Analyse.
Semantisch gestützte Suche im Internet
Access 2000 Datenbanken.
Wie funktionieren Suchmaschinen?
MeiNetz-Suche Wie kann man in meiNetz etwas suchen? 1.durch Gruppen browsen 2.Suchfunktion.
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski.
Manfred Thaller, Universität zu Köln Köln 26. November 2007
Entitäten Extraktion Einführung
Wie Google Webseiten bewertet
Suchmaschinen Das "Surfen" im Internet ist eine gewisse Zeit lang interes-sant, aber auf Dauer ist dies ineffektiv und teuer, wenn man bestimmte Informationen.
Zur Arbeit mit Suchmaschinen
Knowledge Discovery mit Wordnet und Alembic Workbench
1 Knowledge Discovery mit Wordnet und Alembic Workbench (Julia Faion) (Markus Reiter)
W w w. s a f e r i n t e r n e t. a t Die Welt zu Hause Informationen suchen und finden.
Fressen Tiger Menschenkinder? Eine Einführung ins Internet als Quelle MATA -Workshop 2010.
Automatic composition of UI mashups Vortrag zum Seminar Webengineering 2011 Michael Reißner.
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Proseminar: „Webtechnologien für Ecommerce“
Sesame Florian Mayrhuber
Wegweiser im Datenjungel
Der SLUB Katalog und die Semantische Suche Ralf Talkenberger, SLUB / 21. März 2012.
Struktur von RDF Fabian Scheller.
Trust and context using the RDF- Source related Storage System (RDF‑S3) and easy RQL (eRQL) Karsten Tolle und Fabian Wleklinski.
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
Suchmaschinen.
Die Ganze Welt im Computer? Informationsbeschaffung im Internet
SharePoint 2013 Web Services
„Wenn du den Fluss Halys überschreitest, wirst du
26. Oktober 2005Autor: Walter Leuenberger Computeria Urdorf Treff vom 26. Oktober 2005 Suchmaschinen im Internet Google & Co.
Live Search Die Suchmaschine von Microsoft. Was ist Live Search? Live Search gehört zur Microsoft Windows Live Familie (Windows Live Messenger, Windows.
Semantic Web.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Kapitel 5Strukturen Information aus der realen Welt werden in einem informationsverarbeitenden System als Daten abgelegt. Diese stellen also eine (vereinfachte)
The PicSOM Retrieval System 1 Christian Steinberg.
Die Übersetzung von “Diskursdialekten” für die Suche: Das Mapping zwischen Fachsprachen und Indexierungssprachen Vivien Petras Vortrag im Berliner Bibliothekswissenschaftlichen.
© Fraunhofer-Institut für Angewandte Informationstechnik FIT Social Search.
Das World Wide Web Stephan Becker TIT05BGR SS06. Das World Wide Web Übersicht Hypertext & Hypermedia HTML Dokumentenidentifikation Dokumententransport.
Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)
Das Internet Ein Netzwerk, das viele Rechner miteinander verbindet
HYPERLINK WAS IST DAS WEB 2.0? SEMANTIC WEB.
The PageRank Axioms Johannes Zaunschirm. Überblick / Outline  Alon Altman and Moshe Tennenholtz. “Ranking Systems: The PageRank Axioms”., 2005  Basisstruktur.
Der Mitbewerb Wie sieht Google eine Seite. Suchtypen Warum suchen wir.
Suchen und Finden Wie verwende ich Suchmaschinen richtig?
Suchmaschinen im Internet
Integrating Knowledge Discovery into Knowledge Management
Wie sucht man im Internet und welche Web-Browser kennt man
 Präsentation transkript:

Inhalt der Präsentation Probleme der Informationssuche im WWW: Semantische Lücke Schlüsselwort-Suche Ranking-System Entwicklung des WebSifter II mit den folgenden Eigenschaften Genaue Semantikerfassung (umgehen der „semantischen Lücke“) Verbesserung der Schlüsselwort-Suche Benutzerdefinierte Beurteilung und Darstellung gefundener Webseiten Lösungsvorschlag

Weighted Semantic Taxonomy Tree (WSTT) Die Suche eines Geschäftsmannes nach einem Bürostuhl Er durchsucht das Web alternativ nach: „chair“ „office“ AND „chair“ (a) und (b) sind einfache „taxonomy trees“, die schon von Suchmaschinen (z.B. Yahoo) benutzt werden (a) chair office (b) chair office

WSTT Beispiel eines WSTT in bezug auf die Suche des Geschäftsmannes office equipment 10 office furniture 10 chair 9 desk 6 phone 4 office supplies 3 paper 3 pen 7 computers - Gewichte von 1 bis 10 - repräsentativer Term Vorteil: Gewichtszuordnung Nachteil: keine Eindeutigkeit der Terme

Wordnet Allgemein: linguistische Datenbank die die Wörter enthält, die dieselbe Semantik haben (Synsets) jedes Synset hat eine spezifische Bedeutung im Englischen, wobei jedes Wort mehrere Synsets (Konzepte) haben kann Beispiel „chair“: {chair, seat} A seat for one person, with a support for the back {professorship, chair} The position of professor, or a chaired professorship {president, chairman, chairwoman, chair, chairperson} The officer who presides at the meetings of an organization {electric chair, chair, death chair, hot seat} An instrument of death by electrocution that resembles a chair

Positive und negative Konzepte {chair, seat} A seat for one person, with a support for the back {professorship, chair} The position of professor, or a chaired professorship {president, chairman, chairwoman, chair, chairperson} The officer who presides at the meetings of an organization {electric chair, chair, death chair, hot seat} An instrument of death by electrocution that resembles a chair Positive Konzepte: {chair, seat} Negative Konzepte: {professorship, president, chairman, chairwoman, chairperson, electric chair, death chair, hot seat}

Interne Repräsentation des WSTT pct = {chair, seat} nct = {professorship, president, chairman, chairwoman, chairperson, electric chair, death chair, hot seat} 10 pct = {office furniture, furniture, piece of furniture, article of furniture} nct = {} pct = {office equipment} nct = {} 10 4 9 pct = {office supplies} nct = {} 7 6 pct = {desk, table} nct = {} pct = {computer, data processor, electronic computer, information processing, system, machine} nct = {calculator, reckoner, figurer, estimator} pct = {telephone, phone, telephone set, electronic equipment} nct = {speech sound, sound, earphone, earpiece, headphone}

Sammeln der Informationen Übersetzung des WSTT in boolesche Ausdrücke, die für bestehende Suchmaschinen verständlich sind Generierung von Anfragen basierend auf den Pfaden des WSTT Logischer Operator „AND“ Beispiel: Pfad {office equipment, office furniture, chair} “office equipment” AND “office furniture” AND “chair” “office equipment” AND “office furniture” AND “seat” “office equipment” AND “furniture” AND “chair” “office equipment” AND “furniture” AND “seat” “office equipment” AND “piece of furniture” AND “chair” “office equipment” AND “piece of furniture” AND “seat” “office equipment” AND “article of furniture” AND “chair” “office equipment” AND “article of furniture” AND “seat”

Suchanfrage durch den Search Broker Search Broker und Search Request Broker Search Broker schickt jede generierte Anfrage an bestehende Suchmaschinen wie Google, Yahoo, Altavista etc. Page Broker extrahiert den Inhalt der Seite mittels HTTP Anfrage Analyse der Resultate und Speicherung in interne Datenstruktur (XML) Query String Identifikation der Suchmaschine URL Titel Inhalt Rang von der Suchmaschine Kategorie (optional) Beliebtheit (optional)

Präsentation der Suchpräferenzen (1) Semantische Komponente Inhalt der Seite Syntaktische Komponente Inhalt der URL, Struktur Kategorischer Treffer Ähnlichkeit zwischen Struktur des WSTT des Benutzers und Kategorie der Suchmaschine Suchmaschinen-Komponente Vorliebe und Vertrauen des Benutzers in Suchmaschinenergebnisse Authorität/Hub Komponente Beliebtheitskomponente

Präsentation der Suchpräferenzen Schema User’s Search Preference 10 8 6 3 Semantic Component Syntactic Component Categorical Match Component Search Engine Component Popularity Component Authority/Hub Component 2 Benutzer kann den verschiedenen Komponenten Gewichte (von 1 bis 10) zuweisen Jede Seite erhält genau einen Relevanzwert, nachdem die Seiten sortiert werden Jede Seite hat genau 6 Relevanzwerte bestimmt durch die Gewichte Mittels AHP werden diese in einem Wert vereint

Systemarchitektur WebSifter II Ontology Engine (Wordnet) World Wide Web and Internet Ontology Agent Stemming Agent Spell Checker Agent WSTT Base WSTT Elicitor Search Broker External Search Engines Personalized Evaluation Rule Base List of Web Pages Search Engine Preference Personal Preference Agent Web Page Rater Component Preference Base Ranked Web Pages Page Request Broker

Komponenten des Web Sifter II WSTT Elictor Unterstützt die Erstellung des WSTT in der GUI Umgebung Erstellung des taxonomy trees Gewichtszuweisung der Knoten Auswahl des entsprechenden Konzepts (Wordnet) Speicherung des fertigen WSTT in XML-Format in der WSTT Base Ontology Agent Anfrage an Wordnet (Web Version) für Auswahl der Konzepte Kann modifiziert werden um mit anderen Wörterbüchern zu arbeiten

Komponenten des WebSifter II (2) Stemming Agent Arbeitet mit Porter‘s Algorithmus Kooperiert mit WSTT Elictor, indem er die Konzepte in Stammformen verwandelt Transformiert den Inhalt der gefundenen Webseite in Stammformen, um Anfrage und Ergebnis vergleichen zu können Spell Check Agent Beobachtet die Texteingaben des Benutzers und prüft und macht Vorschläge für eine korrekte Rechtschreibung in Echtzeit

Komponenten des WebSifter II (5) Search Preference Elictor Unterstützt den Prozess, der nötig ist, die Suchpräferenzen des Benutzers zu erfassen Gewichtszuweisung der Suchpräferenzen (Component Preference Base) Präferenz für Suchmaschinen (Search Engine Preference) Präferenzen für syntaktische Regeln (Personalized Evaluation Rule Base) Direct Hit, Directory Hit, Page Hit

Komponenten des WebSifter II (4) Search Broker Interpretiert den XML-basierenden WSTT und generiert dann alle möglichen Anfragen für die Suchmaschinen Schickt diese booleschen Anfragen an bestehende Suchmaschinen Interpretiert die Resultate der Suchmaschinen und speichert die geparsten Informationen in einer temporären Datenbank Aktiviert nach seinem Ablauf den Page Request Broker Page Request Broker Anfrage des Inhalts einer spezifischen URL Kooperiert mit Stemming Agent und Web Page Rater Web Page Rater Unterstützt die gesamte Auswertung der Webseiten Darstellung der Ergebnisse für den Benutzer

Fazit Entwicklung des WSTT Umgehen der semantischen Lücke (Wordnet) Aktive Suche des Benutzers, mehr Ausdruckskraft Suchpräferenzen Darstellung der Suchpräferenzen des Benutzers Semantische Relevanz, syntaktische Relevanz etc.