Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Multiagentensysteme in der Informationssuche Überblick über bestehende Technologien und Entwicklungsperspektiven Dariusz Kordoński Seminar Agentensysteme.

Ähnliche Präsentationen


Präsentation zum Thema: "Multiagentensysteme in der Informationssuche Überblick über bestehende Technologien und Entwicklungsperspektiven Dariusz Kordoński Seminar Agentensysteme."—  Präsentation transkript:

1 Multiagentensysteme in der Informationssuche Überblick über bestehende Technologien und Entwicklungsperspektiven Dariusz Kordoński Seminar Agentensysteme

2 2 Agenda I. traditionelle Informationssuche im Internet Einführung in Information Retrieval Grundlagen von IR Web-Suchmaschinen das Problem des Informationsüberflusses II. Agenten in der Informationssuche Grundlagen Überblick über Technologien Mängel der Suchagenten III. Multiagentensysteme Grundlagen Vorteile der Multiagentensystemen

3 3 Agenda IV. der biologische Ansatz in der KI neuronale Netze der genetische Ansatz V. praktische MAS-Anwendungen in der Suche die InfoSpiders- und MySpiders-Systeme das Amalthaea-System VI. die Entwicklung Entwicklungsperspektiven der Konzept einer evolutionären Suchmaschine VII. Fazit

4 4 Einführung in die IR Traditionelle IR im Internet Agenten im Suchen Multiagentensysteme Praxisbeispiele Biologie in KI Fazit Entwicklung Information Retrieval InformationswiedergewinnungInformationsbeschaffung Informationsrückgewinnung … die Nutzende mit Informationen zu versorgen computergestützte, inhaltsorientierte Suche

5 5 Einführung in die IR Agenten im Suchen Multiagentensysteme Praxisbeispiele Fazit Herausforderungen des Internets: verteilte Daten größer Anteil der wandelbaren Daten riesige Ausmaße unstrukturierte und überflüssige Daten niedrige Qualität von Daten heterogene Daten Die wichtigste Methoden: Web-Suchmaschinen Webkataloge Hyperlink-Suchen Traditionelle IR im Internet Biologie in KI Entwicklung

6 6 Grundlagen von IR Traditionelle IR im Internet Agenten im Suchen Multiagentensysteme Praxisbeispiele Fazit Biologie in KI Entwicklung das Vektorraummodell die tf-idf-Gewichtung precision und recall technische Tools (parsing, noise-word-Beseitigung, stemming)

7 7 Traditionelle IR im Internet Web-Suchmaschinen Agenten im Suchen Multiagentensysteme Praxisbeispiele Fazit Die Architektur sofortige Antwort auf die Anfrage Rangliste der Ergebnisse Kostensenkung durch Indizierung SKALIERBARKEITSMANGEL Biologie in KI Entwicklung

8 8 Traditionelle IR im Internet Informationsüberfluss Agenten im Suchen Multiagentensysteme Praxisbeispiele Fazit die im vorigen Punkt besprochen wurden, bedingen ständige Beteiligung des Benutzers am Suchprozess. Oft sogar sehr ausführliche Anfragen rufen Ergebnislisten hervor, die aus Millionen von Links bestehen. Dabei ist Internet-Surfing nur ein winziger Teil der allen Bedürfnissen, die Entwicklung des Internets nach sich gezogen hat. E-commerce, news groups, Web Services, (jeszcze?) alle diese Internetbezogenen Technologien bedingen ständige Informationssuche. Man kann sich nicht mehr gönnen, auf manuelle Suche die Zeit zu verschwenden. Diese Situation wird sehr bildlich durch das Zitat dargestellt: Zusammengefasst führt das Web zu der paradoxen Situation, dass der Einzelne jetzt unbeschränkten Zugang zu unendlich vielen Informationen hat, aber die meiste Zeit verbringt, das Gesuchte zu finden. Ein anderes Beispiel für die Verfolgung der Natur in KI sind die genetischen Algorithmen, die ursprünglich zur Problemlösung durch Suche entwickelt worden sind. Sie verwenden die Hauptprinzipien der Theorie vom Überleben des Stärkeren. Problemlösung ist ein Zweig von KI, der sich mit Herausfindung des besten möglichen Zustandes in einem bestimmten Zustandsraum, die erlaubte Zustande eines Problems umfasst, beschäftigt, wobei üblicherweise die Regeln zum Übergang von einem Zustand in den anderen vorliegen Der beste bedeutet nicht immer der optimale. In sehr komplexen Problemen, mit denen man überall immer mehr zu tun hat, gibt es Unmenge von Zustände, übergreifende und komplizierte Übergangsregeln. Sehr besteht das Ziel darin, eine Lösung zu finden, die bestimmte Kriterien zufrieden stellend erfüllt und nicht unbedingt global die beste ist. In solchen Fällen sind die genetischen Algorithmen besonders geeignet, da sie den Zustandsraum sozusagen parallel die im vorigen Punkt besprochen wurden, bedingen ständige Beteiligung des Benutzers am Suchprozess. Oft sogar üblicherweise die Regeln zum Übergang von einem Zustand in den anderen vorliegen Der beste bedeutet nicht immer der optimale. In sehr komplexen Problemen, mit denen stellend erfüllt sehr ausführliche Anfragen rufen Ergebnislisten hervor, die aus Millionen von Links bestehen. Dabei ist Internet-Surfing nur ein winziger Teil der allen Bedürfnissen, die Entwicklung des Internets nach sich gezogen hat. E-commerce, news groups, Web Services, (jeszcze?) alle diese Internetbezogenen Technologien bedingen ständige Informationssuche. Man kann sich die im vorigen Punkt besprochen wurden, bedingen ständige Beteiligung des Benutzers am Suchprozess. Oft sogar üblicherweise die Regeln zum Übergang von einem Zustand in den anderen vorliegen Der beste bedeutet nicht immer der optimale. In sehr komplexen Problemen, mit denen stellend erfüllt die im vorigen Punkt besprochen wurden, bedingen ständige Beteiligung des Benutzers am Suchprozess. Oft sogar nicht mehr gönnen, auf manuelle Suche die Zeit zu verschwenden. Diese Situation wird sehr bildlich durch das Zitat dargestellt: Zusammengefasst führt das Web zu der paradoxen Situation, dass der Einzelne jetzt unbeschränkten Zugang zu unendlich vielen Informationen hat, aber die meiste Zeit verbringt, das Gesuchte zu finden. Größe des Internets vs. Möglichkeiten der Suchmaschine Zeit des Wiederbesuches durch einen crawler Menge und Relevanz der gelieferten Links Web Index Biologie in KI Entwicklung

9 9 Agenda I. traditionelle Informationssuche im Internet II. Agenten in der Informationssuche Grundlagen Überblick über Technologien Mängel der Suchagenten III. Multiagentensysteme Einführung in Information Retrieval Grundlagen von IR Web-Suchmaschinen das Problem des Informationsüberflusses Grundlagen Vorteile der Multiagentensystemen

10 10 Grundlagen der Agenten Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Praxisbeispiele Fazit Aufgabedelegierungautonome Erfüllung Entlastung des Benutzers selbständige Bewertung der Relevanz Filterung der Ergebnisse. Wissensdarstellung Schlussfolgerung Lernen Kontexterkennung … Autonomie Intelligenz Reaktivität Proaktivität Kommunikation Mobilität Sozialverhalten Adaptivität … lokale Zugriff auf Information Leistungssteigerung (Zukunft) Biologie in KI Entwicklung

11 11 Überblick über Technologien Traditionelle IR im Internet Multiagentensysteme Praxisbeispiele Fazit Web-Roboter Informationssuchagenten Informationsfilteragenten kollaborative Agenten Biologie in KI Entwicklung Agenten in Suche

12 12 Agenten in Suche Mängel der Suchagenten Traditionelle IR im Internet Multiagentensysteme Praxisbeispiele Fazit Beruhung auf den traditionellen Tools Erweiterung Intelligenz Teilentlastung precision recall Teilentlastung Das Problem des Informationsüberflusses wird nicht gelöst! Biologie in KI Entwicklung

13 13 Agenda II. Agenten in der Informationssuche Grundlagen Überblick über Technologien Mängel der Suchagenten III. Multiagentensysteme I. traditionelle Informationssuche im Internet Einführung in Information Retrieval Grundlagen von IR Web-Suchmaschinen das Problem des Informationsüberflusses Grundlagen Vorteile der Multiagentensystemen

14 14 Grundlagen Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Praxisbeispiele Fazit mehrere AgentenMehragentensysteme beschränkte Sicht auf die Umgebung keine globale Steuerung Dezentralisierung der Daten asynchrones Handeln Multiagentensysteme DPS vs. MAS Biologie in KI Entwicklung

15 15 Vorteile der MAS Traditionelle IR im Internet Agenten in Suche Multiagentensysteme Praxisbeispiele Fazit InternetMAS verteilte Daten niedrige Qualität von Daten riesige Ausmaße unstrukturierte und überflüssige Daten heterogene Daten schnelle, lokale Anpassung Skalierbarkeit heterogene Architektur Mangel der zentralen Planung ständige dezentrale Entwicklung verteilte Daten dynamische Struktur Biologie in KI Entwicklung

16 16 Agenda IV. der biologische Ansatz in der KI neuronale Netze der genetische Ansatz V. praktische MAS-Anwendungen in der Suche die InfoSpiders- und MySpiders-Systeme das Amalthaea-System VI. die Entwicklung Entwicklungsperspektiven der Konzept einer evolutionären Suchmaschine VII. Fazit

17 17 Neuronale Netze Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Multiagentensysteme Vorbild: menschliches Gehirn Neurone durch gewichtete Synapsen verbunden Änderung des Zustandes (Aktivierung) durch Eingabe (input) von anderen Zellen Ausgabe (output) aufgrund einer bestimmten Aktivierung Haupteigenschaft - Lernfähigkeit Biologie in KI Entwicklung

18 18 Der genetische Ansatz Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Multiagentensysteme Vorbild: die Evolution in Natur Chromosome bilden die Population Bewertung von Fitness (Güte) Charles Darwin – Überleben des Stärkeren Probabilistische Auswahl der Fitness-stärken Chromosomen Biologie in KI Entwicklung ständige Steigerung von Fitness: Reproduktion Cross-over Mutation

19 19 Der genetische Ansatz Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Multiagentensysteme Eigenschaften paralleles Verfahren Rauschen Flexibilität dezentrale Anpassung InternetMultiagentensysteme Biologie in KI Entwicklung

20 20 Agenda IV. der biologische Ansatz in der KI neuronale Netze der genetische Ansatz V. praktische MAS-Anwendungen in der Suche die InfoSpiders- und MySpiders-Systeme das Amalthaea-System VI. die Entwicklung Entwicklungsperspektiven der Konzept einer evolutionären Suchmaschine VII. Fazit

21 21 InfoSpiders/MySpiders Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Multiagentensysteme Multiagentensystem zur Suche im Internet InfoSpiders - Einleitung Hyperlink-Suchen-Ansatz Realisierung der genetischen Methoden Parallele, autonome Informationsauffindung Verfolgung der Graf-Struktur, ohne Indizierung Bewertung von Fitness Reproduktion, Mutation, Crossover, Elimination Anpassung Verwendung von NN, Lernen mit Relevanzrückmeldung Dynamische Anpassung der Querende Biologie in KI Entwicklung

22 22 Biologie in KI Relevanzrückmeldung InfoSpiders/MySpiders Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Multiagentensysteme InfoSpiders – Architektur eines Spider HTML Parser noise-word-Eliminator Stemmer Dokumentvektor Der Genotyp Stichwörter Energie Adresse und Zurück-Link Entwicklung

23 23 Biologie in KI odge Wörterbuch - Übersetzung Deutsch-Englisch Beginnend mit "a" Kostenlose Übersetzungen beim Deutsch-Englisch online Wörterbuch odge.de - Aktuell mit mehr als Begriffen. Czlmcsalc;szkc;azlsc ;ascs;,aszclsa;ldxas Restposten-Plattform.de Cazsasxcx Zxxczczxc InfoSpiders/MySpiders Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme InfoSpiders – der Algorithmus (1/4) Moment N + Gewinn- Kosten odge Wörterbuch - Übersetzung Deutsch-Englisch Beginnend mit "a" Kostenlose Übersetzungen beim Deutsch-Englisch online Wörterbuch odge.de - Aktuell mit mehr als Begriffen. Czlmcsalc;szkc;azlsc ;ascs;,aszclsa;ldxas Restposten-Plattform.de Cazsasxcx Zxxczczxc

24 24 Biologie in KI odge Wörterbuch - Übersetzung Deutsch-Englisch Beginnend mit "a" Kostenlose Übersetzungen beim Deutsch-Englisch online Wörterbuch odge.de - Aktuell mit mehr als Begriffen. Czlmcsalc;szkc;azlsc ;ascs;,aszclsa;ldxas Restposten-Plattform.de Cazsasxcx Zxxczczxc InfoSpiders/MySpiders Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme Moment N InfoSpiders – der Algorithmus (2/4)

25 25 Biologie in KI odge Wörterbuch - Übersetzung Deutsch-Englisch Beginnend mit "a" Kostenlose Übersetzungen beim Deutsch-Englisch online Wörterbuch odge.de - Aktuell mit mehr als Begriffen. Czlmcsalc;szkc;azlsc ;ascs;,aszclsa;ldxas Restposten-Plattform.de Cazsasxcx Zxxczczxc InfoSpiders/MySpiders Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme Moment N InfoSpiders – der Algorithmus (3/4)

26 26 InfoSpiders/MySpiders Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme InfoSpiders – der Algorithmus (4/4) Evolution: Θ – globale Energieschwelle für Reproduktion Crossover – der Stichwortvektor Mutation – der Stichwortvektor und das neuronale Netz (Gewichten) der lokale Kontext bei der Mutation Haltbedingungen: Aussterben der Population MAX_PAGES wird erreicht Anweisung des Benuzters Biologie in KI Rangfolge der Ergebnisse: Ähnlichkeit zum Genotyp Fitness des spider

27 27 Biologie in KI InfoSpiders/MySpiders Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme MySpiders - Einleitung Realisierung von IS als Java Applett Verwendung von Multithreading

28 28 Biologie in KI InfoSpiders/MySpiders Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme MySpiders – die Architektur Benutzerschnittstelle Manager Spiders Gemeinsame Objekte Cache Namensgeber Ergebnistabelle Log Hilfsprogramme Dokumentenwiedergewinnung, Parsing, Stemming usw. Gemeinsame XML Daten

29 29 Biologie in KI InfoSpiders/MySpiders Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme Eigenschaften Evolution Anpassung lokale Selektion lokale Verinnerlichung selektive Expansion der Querende Personalisierbarkeit Skalierbarkeit Aktualität Mobilität (Zukunft) Suchmaschinen-Abhängigkeit Geschwindigkeit

30 30 Amalthaea Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme Einleitung Multiagentensystem zum Informationsfiltern künstliches Ekosystem zwei Populationen von Agenten Marktorientierte Kontrolle Informationsfilteragenten (IFA) Informationsrückgewinnungsagenten (IDA) Empfehlungssystem (Informationsrückgewinnung und – Filtern) Benutzerrückmeldung bedeutsam Kooperation und Wettbewerb Biologie in KI Meta-Suche-Ansatz Realisierung des evolutionären Ansatzes

31 31 Amalthaea Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme IFA -Architektur IFA - Architektur Agent IDint Fitness dateEntstehungsdatum bool Benutzererschaffungsflag Stichwort ………… Schlüsselwortvektor mov cx,1 int 21 add cx,dx mov dx,2 …… Der Ausführungskode Biologie in KI

32 32 Amalthaea Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme fordert an und bekommt die Dokumente von IDAs Vergleich mit dem eigenen Stichwortvektor (Kosinusmaß) entscheidet, ob der Benutzer an dem Dokument IFA -Algorithmus IFA - Algorithmus interessiert wäre (Vertrauensniveau von Fitness abhängig) Benutzerrückmeldung ins Kredit umgesetzt (vom Vertrauensniveau abhängig) Biologie in KI Teil des bekommenen Kredits als Bezahlung an IDA weitergegeben

33 33 Amalthaea Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme IDA -Architektur IDA - Architektur Agent IDint Fitness date array Transaktionsgeschichte Suchdaten mov cx,1 int 21 add cx,dx mov dx,2 …… Der Ausführungskode Suchmaschine Anzahl der Stichwörter Min Treffer Max Treffer Kombinationsmethode Biologie in KI Entstehungsdatum

34 34 Amalthaea Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme bekommt Suchaufträge von IFAs drei grundlegende Arten: selbständige Wahl des Auftrages aufgrund der Geschichte IDA -Algorithmus IDA - Algorithmus der Transaktionen (80% der Zeit) Beobachten Auffindung Strömung Biologie in KI

35 35 Amalthaea Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme das System (1/2) Benutzer Benutzerschnittstelle Informationsfilteragenten Informationsrückgewinnungsagenten Informationsquellen BeobachtenAuffindungStrömung Dokumente gefilterte Dokumente Digest Ekosystem Kredit Rückmeldung Hilfs- programme Biologie in KI

36 36 Amalthaea Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme Anfang: verschiedene Methoden zur Erzeugung der ersten das System (2/2) Generation der IFAs Erzeugung der IDAs durch zufälliges Zugeben vom Genotyp Biologie in KI Kredit/Fitness: Weitergeben an IDAs durch IFAs (Bezahlung) lineare Verringerung von Fitness als Handelnsanstoß Strafen für Empfehlung derselben Dokumente Evolution: Reproduktion, Cross-over, Mutation, Elimination Dynamik abhängig von der allgemeinen Fitness Bewertung der IFAs in Interessengruppen

37 37 Amalthaea Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme Anpassung Eigenschaften Biologie in KI Konvergenz zum Gleichgewichtspunkt Evolution Personalisierbarkeit Aktualität Suchmaschinen-Abhängigkeit Meta-Suche

38 38 Agenda IV. der biologische Ansatz in der KI neuronale Netze der genetische Ansatz V. praktische MAS-Anwendungen in der Suche die InfoSpiders- und MySpiders-Systeme das Amalthaea-System VI. die Entwicklung Entwicklungsperspektiven der Konzept einer evolutionären Suchmaschine VII. Fazit

39 39 Die Entwicklungsperspektiven Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme die zurzeit entwickelten Systeme sind nur als Komplementierung der üblichen Methoden vorgesehen die beiden vorgestellten Systeme werden nicht mehr Biologie in KI weiterentwickelt sie greifen mehr oder weniger auf die Indexe der Suchmaschinen zurück die grundlegende Ansätze könnten unter Umständen benutzt werden, um eine selbständige, evolutionäre Suchmaschine zu erschaffen, die die Mängel der traditionellen search engines vermeidet

40 40 Eine evolutionäre Suchmaschine Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme Evolution Biologie in KI marktorientierte Kontrolle Hauptkonzepte zwei Populationen von Agenten – IDAs und IFAs Gestaltung der Populationen durch Anfragen und globale Fitness kollaborativer Ansatz bei Klassifizierung der Anfragen (Interessengruppen)

41 41 Eine evolutionäre Suchmaschine Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme auf dem InfoSpiders-Konzept basiert Fitness von zwei Faktoren abhängig Biologie in KI Wahl der Aufträge der IFAs dynamische Gestaltung des Zahlbestandes Auftragsannahme verursacht Mutation Informationsrückgewinnungsagenten Entdeckung der relevanten Seiten Kredit von Auftraggeber

42 42 Eine evolutionäre Suchmaschine Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme auf dem Amalthaea-Konzept basiert Wettbewerb in Gruppen Biologie in KI Kampf um den Benutzer (Versteigerung) Ähnlichkeit der Querende mit dem eigenen Stichwortvektor Fitness kollaborativer Ansatz bei Klassifizierung der Anfrage Informationsfilteragenten Geschichte der Transaktionen – die erste Quelle der Antwort Kredit aufgrund Rückmeldung

43 43 Agenda IV. der biologische Ansatz in der KI neuronale Netze der genetische Ansatz V. praktische MAS-Anwendungen in der Suche die InfoSpiders- und MySpiders-Systeme das Amalthaea-System VI. die Entwicklung Entwicklungsperspektiven der Konzept einer evolutionären Suchmaschine VII. Fazit

44 44 Das Fazit Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme Information Retrieval im Web ist heutzutage eines der bedeutendsten Fachgebiete der IT die Größe und Dynamik des Internets machen ein extrem schwieriges Problem für leistungsfähige Informations- beschaffung aus die Web-Suchmaschinen, die traditionell das populärste Tool zum Suchen im Internet sind, leiden unter Mängel der Skalierbarkeit die Agenten werden schon seit längerem in Web-IR benutzt, bieten aber keine vollständige Lösung des Problems der Informationsüberfluss Multiagentensysteme erfüllen eine Menge von Voraus- setzungen für ein innovatives Internet-Suchsystem Biologie in KI

45 45 Das Fazit Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Entwicklung Multiagentensysteme die moderne Technologien der KI, die Lösungen der Natur nachahmen, erweisen sich als sehr hilfreich bei Realisierung eines dezentralen Multiagentensystemes die schon seit des Enden des letzten Jahrhunderts vorgenommene Forschung hat zur Entwicklung einiger MAS zur Suche geführt, die erheblich höhere Leistung als traditionelle Suchmaschinen vorweisen diese Systeme greifen aber mehr oder weniger auf die Dienste der Suchmaschinen zurück und werden eher als eine Unterstützung der klassischen Methoden angesehen der Konzept von MAS im Suchen könnte aufgrund der erreichten Ergebnisse weiterentwickelt werden und zur Realisierung eines völlig unabhängigen Systems zur Informationssuche führen Biologie in KI

46 46 THE END Seminar Agentensysteme Danke für Eure Aufmerksamkeit! Danke für Eure Aufmerksamkeit! Dariusz Kordoński

47 47 HILFSFOLIEN Seminar Agentensysteme Dariusz Kordoński

48 48 Einführung in IR Traditionelle IR im Internet Agenten im Suchen Multiagentensysteme Praxisbeispiele Fazit Schwerpunkt: Suche verständliche Form Umsetzung des Ergebnisses in eine für den Benutzer Form Hauptprobleme: Vagheit Umsetzung des Bedarfs in für die Maschine verständliche Unsicherheit Biologie in KI Entwicklung

49 49 Grundlagen von IR Traditionelle IR im Internet Agenten im Suchen Multiagentensysteme Praxisbeispiele Fazit Das Vektorraummodell … Gewichtung zwischen den beiden Vektoren kalkuliert. Da alle die Gewichtungen gleich oder größer als 0 sind, nimmt der Kosinus die Werte zwischen 0 und 1 an. Daher kann man auf diese Weise feststellen, inwieweit der Dokument die Abfrage erfüllt und die herausgefundene Dokumente in Hinsicht auf ihre Relevanz ordnen. Einer der bedeutendsten Probleme dabei ist die entsprechende Gewichtung der Schlüsselwörter. Am häufigsten benutzt man eine der Variationen der so genannten term-frequency-inverted document frequency-Gewichtung (tf-idf- Gewichtung). Die Gewichtung des Terms wird aus zwei Werten zusammengestellt. (Termhäufigkeit des Terms im Dokument) ist einfach die relative Häufigkeit des Auftretens des Wortes im Dokument… … Gewichtung Abfrage zwischen … … … … … Dokument als eine Kollektion der Schlüsselwörter in einem bestimmten Dokument gewichtet ( ) Gleich wird die Querende dargestellt ( ) Jedes Stichwort im Vektor wird in Hinsicht aufs Auftreten Biologie in KI Entwicklung

50 50 Grundlagen von IR Agenten im Suchen Multiagentensysteme Praxisbeispiele Fazit Das Vektorraummodell Das Ähnlichkeitsmaß der Anfrage mit einem bestimmten Dokument – Kosinus des Winkels: VorteileNachteile Rückgewinnung nur teilweise übereinstimmenden Dokumente Erschaffung einer Rangfolge in Hinsicht auf Relevanz möglich Relativ gute Leistung Annahme der unabhängigen Terme (umstritten) Traditionelle IR im Internet Biologie in KI Entwicklung

51 51 Grundlagen von IR Agenten im Suchen Multiagentensysteme Praxisbeispiele Fazit Die tf-idf-Gewichtung Fragestellung: Wie soll man die Terme im Vektor gewichten? Proportional zu Häufigkeit im Dokument (term frequency): Umgekehrt proportional zu Häufigkeit in der ganzen Sammlung (inverted document frequency): das zusammengestellte Gewicht: (daher: tf-idf) Traditionelle IR im Internet Biologie in KI Entwicklung

52 52 Grundlagen von IR Agenten im Suchen Multiagentensysteme Praxisbeispiele Fazit Die Bewertungsmethoden Die Sammlung Relevante Dokumente |R| Gelieferte Dokuente |A| Aufgefundene relevante Dokumente |Ra| Traditionelle IR im Internet Biologie in KI Entwicklung

53 53 Grundlagen von IR Agenten im Suchen Multiagentensysteme Praxisbeispiele Fazit Die Bewertungsmethoden Precision (Präzision): Recall (Vollständigkeit): Precision-Recall-Diagramm - Beispiel Traditionelle IR im Internet Biologie in KI Entwicklung

54 Der genetische Ansatz Traditionelle IR im Internet Agenten in Suche Praxisbeispiele Fazit Multiagentensysteme Das genetische Rauschen Reproduktion Crossover Mutation Biologie in KI Entwicklung


Herunterladen ppt "Multiagentensysteme in der Informationssuche Überblick über bestehende Technologien und Entwicklungsperspektiven Dariusz Kordoński Seminar Agentensysteme."

Ähnliche Präsentationen


Google-Anzeigen