Multiagent Systems Einführung: Kommunikation

Slides:



Advertisements
Ähnliche Präsentationen
Powerpoint-Präsentation
Advertisements

Regina Mirvis, Senior Consultant
Routing – Routing Protokolle
Wissensanalyse von Aufgaben mit TKS Eine Methode zur Problemlösung
Definition des Wirtschaftens
SOAP Simple Object Access Protocol
2 Kommunikationssysteme bieten Kommunikationsdienste an, die das Senden und Empfangen von Nachrichten erlauben (sending & receiving messages) bestehen.
Prinzipal-Agenten Beziehungen
Lightweight Directory Access Protocol
Präsentation zum Thema Netzwerk Von Jan Metz.
KQML – Eine Programmiersprache für Agenten Seminar Software Agenten Carsten Grosch
CIDOC-CRM Universität zu Köln Historisch-kulturwissenschaftliche Informationsverarbeitung AM 2 Dozent: Prof. Dr. Manfred Thaller Referent: Nelson Marambio.
Kognitive Robotik. – oder – Wie spielt man Roboter-Fußball? Vortrag Allgemeine Psychologie Universität Tübingen 15. Mai 2002 Dirk Neumann
Reinforcement Learning
Das klassische Kommunikationsmodell des Informations-Austauschs
OSI-Schichtenmodell Unterschiedliche Rechner brauchen eine gemeinsame Basis, um sich miteinander zu „unterhalten“. Geklärt werden muss dabei u. a. Folgendes:
Projekt A4: Alignment of Situation Models Gert Rickheit Sven Wachsmuth Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,
Seminar: Architekturbeschreibungssprachen
UNIVERSITY OF PADERBORN Projektgruppe KIMAS Projektgruppe KIMAS Organisatorisches Andreas Goebels.
Projektgruppe KIMAS Kommunikation in MAS
1/16 UNIVERSITY OF PADERBORN Projektgruppe KIMAS Projektgruppe KIMAS Agenten Andreas Goebels, Alexander Weimer.
1/25 UNIVERSITY OF PADERBORN Projektgruppe KIMAS Projektgruppe KIMAS MultiAgenten-Systeme Andreas Goebels.
Interaktionen Verteilte Anwendungen Wintersemester 06/07 © Wolfgang Schönfeld Wie arbeiten VS mit ihrem Material (im einfachsten Fall)?
ROUTINGVERFAHREN ZUR LASTVERTEILUNG IN CONTENT-DELIVERY-NETWORKS
1. Einführung Lernziele: Auffrischen des Wissens aus Rechnernetze
Agentenkooperationen Ulrike Abelein 17. Januar 2006 Seminar Spezifikations- und Selektionsmethoden für Daten und Dienste, IPD, Lehrstuhl Prof. Böhm.
Vorlesung Gestaltung von soziotechnischen Informationssystemen - RequirementsEngineering und Contextual Design- Thomas Herrmann, Lehrstuhl Informations-
Steffen Mankiewicz 1.
Kontrollfragen zu Kapitel 1
Evaluierung des ITU-T.124 Telekonferenzstandards
Entwicklung verteilter eingebetteter Systeme - Einführung
Future Network-based Semantic Technologies
Einführung in die Agenten-Technologie
Internet: Funktionsweise und Dienste
WAP = Wireless Application Protocol Protokollstack Ein Protokoll ...
Das OSI Schichtenmodell
Tobias Kluge: FAME Middleware / Karlsruhe / The FAME project – Middleware.
Theorien, Methoden, Modelle und Praxis
Grundlagen: Client-Server-Modell
UML-Kurzüberblick Peter Brusten.
Inhaltsverzeichnis: 1. Telefonie mit analog und digital
Sprachenlernen im face-to-face und eTandem
OSI- MODELL 7 Schichten Gruppe : WRJ.
Grundlagen der Kommunikation in Verbindung mit der Codierung von Daten
Standardisierung einer herstellerübergreifenden Funkkommunikation
Interprozess- kommunikation (IPC)
Sicher Lernen! Sicher Lehren!
1 Strukturierung von Situationen (Strukturierung als Lernkomponente) Thomas Höpfel Seminar für Rechtstheorie und Rechtsinformatik WS 2004/05.
Evaluationen sind nicht nur technische Vorgänge, sondern immer auch soziale Prozesse. Bei der Gestaltung von Evaluationen muss auf beides geachtet werden,
->Prinzip ->Systeme ->Peer – to – Peer
Knowledge Management.
Artificial Intelligience
Agenten und Multi-Agenten-System
Semantic Web.
von Prof. Thomas Deutsch
Projekt A4: „Alignment of Situation Models“ Dr. Gerd Rickheit Dr. Sven Wachsmuth Dr. Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,
Interoperabilität in Digitalen
Lisa Huber DHBW Mannheim
Kommunikation - Die Macht von Bildern in Unternehmen
Übersichtsschaubilder
Kooperatives Lernen.
Comprehensive Information Base (CIB) – ein Prototyp zur semantischen Datenintegration Stefan Arts
Ein Projekt in Zusammenarbeit des Mechatronics Engineering Labors und des Studiengangs Technik Management Ein Projekt in Zusammenarbeit des Mechatronics.
Identity Management.  Zentrale Begriffe und Probleme  Modellbildung  Methoden zur Authentisierung über HTTP  Technische Aspekte  Compliance  Hindernisse,
Webservices SOAP und REST Nicole Fronhofs 1. Betreuer: Prof. Dr. Volker Sander 2. Betreuer: B. Sc. Sebastian Olscher.
Fragenkatalog GK Informatik Zur Vorbereitung auf das mündliche Abitur.
1. Einführung Lernziele: Auffrischen des Wissens aus Rechnernetze
2 Kommunikationssysteme
Kapitel II: Das ISO-Referenzmodell
 Präsentation transkript:

Multiagent Systems Einführung: Kommunikation Computation Intelligence Seminar A Helmut GRABNER Multiagent Systems Einführung: Kommunikation Multiagent Systems: A Survey from a Machine Learning Perspective [Peter Stone, Manuela Veloso 2000]

Übersicht Kurze Wiederholung Homogeneous Communication MA Beispiel: Reaktives Multiagentensystem Heterogeneous Communication MA Interaktionen Multiagent Q-Learning

Wiederholung - Einteilung

Homogeneous Communicating Multiagent Systems

Homogeneous Communicating Multiagent Systems Allgemein Agenten können direkt (!) miteinander kommunizieren gleicher Aufbau, nur Input variiert

Homogeneous Communicating Multiagent Systems Beispiel: Pursuit domain [Stephen, Merx 1990] Kommunikation um sicherzustellen, dass jeder an eine andere „Capture-Pos.“ fährt. (vgl. Homogeneous no communication.)

Homogeneous Communicating Multiagent Systems Aufgaben/Fragen Verteiltes erfassen von Informationen Trafficopter Fragen Was, wann, wie und mit wem soll kommuniziert werden? Sensorinformationen/Ziele

Communication in Reactive Multiagent Robotic Systems Homogeneous Communicating Multiagent Systems Reaktives Multiagentensystem Beispiel Communication in Reactive Multiagent Robotic Systems [Balch, Arkin 1994]

Beispiel: Reaktives Multiagentensystem Inhalt Kommunikationsmethoden no communication State communication Goal communication Aufgaben Futtersuche (Forage – Task) Abgrasen (Graze – Task) Umgebung 2D, Roboter, Hindernisse, Arttraktoren Zusammenfassung

Agent (Roboter) als Automat Beispiel: Reaktives Multiagentensystem - Kommunikationsmethode No communication Agent (Roboter) als Automat keine direkte Kommunikation, Jeder Agent ist auf seine Wahrnehmung der Welt beschränkt Unterscheidungen: andere Agenten (Roboter), Arttraktoren, Hindernisse

Kein direktes Senden, andere können den Zustand aber abfragen Beispiel: Reaktives Multiagentensystem - Kommunikationsmethode State Communication Kein direktes Senden, andere können den Zustand aber abfragen Agenten erkennen den Status eines anderen Agent hat „Arbeit“ gefunden Agent fährt zu demjenigen

Explizite Kommunikation Beispiel: Reaktives Multiagentensystem - Kommunikationsmethode Goal Communication Explizite Kommunikation Position des Arttraktors Sender – Übertragung – Empfänger Biologie: Honigbiene – Tanz Roboter fährt direkt zum Arttraktor eventuell kürzerer Weg

Beispiel: Reaktives Multiagentensystem - Aufgabe Forage-Task Roboter sucht die Umgebung nach „Futter“ (Arttraktoren) ab und bringt diese „nach Hause“ Hindernisse in der Umgebung Die Masse eines Arttraktors bestimmt, wie schnell er transportiert werden kann. Mehrere Roboter gemeinsam können dies beschleunigen.

State und Goal communication Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-Task Kommunikationsmethoden No communication Automat State und Goal communication Realisiert mit 1 Bit: „Suchen“ oder „hinbewegen“ / „nach Hause“

5145 Schritte 4470 Schritte 3495 Schritte Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-Task Vergleiche 5145 Schritte 4470 Schritte 3495 Schritte

Roboter (1..5) x Arttraktoren (1..7) Steps (Zeitschritte) Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-Task Vergleichsmaß Roboter (1..5) x Arttraktoren (1..7) Steps (Zeitschritte) Vergleich (Division) der beiden Messungen (Speedup Vergleich) Mittelwert

Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-Task Auswertung Verbesserung Mittelwert beste schlechteste State vs. no 16 % 66 % -5 % Goal vs. no 19 % 59 % -7 % Goal vs. State 3 % 34 % -19 %

Beispiel: Reaktives Multiagentensystem – Aufgabe Graze-Task „Abgrasen“ der gesamten Umgebung Hindernisse in der Umgebung

State und Goal communication Beispiel: Reaktives Multiagentensystem – Aufgabe Graze-Task Kommunikationsmethoden No communication Automat State und Goal communication Realisiert mit 1 Bit: „Suchen“ oder „hinbewegen“ / „weiden“

Beispiel: Reaktives Multiagentensystem – Aufgabe Graze-Task Auswertung Verbesserung Mittelwert beste schlechteste State vs. no 1 % 19 % 0 % Goal vs. no Goal vs. State Kommunikation bringt fasst nichts Wenn der Roboter „grast“ hinterlässt er unvermeidlich eine „Spur“ -> Diese Änderung der Umgebung kann als indirekte Kommunikation verstanden werden!

Beispiel: Reaktives Multiagentensystem Zusammenfassung Kommunikation bringt viel, bei Anwendungen mit wenig impliziter Kommunikation (Forage) Kommunikation ist nicht notwendig, bei Anwendungen wo (viel) implizite Information vorhanden ist. Komplexere Kommunikationsstrategien bringen relativ kleinen Gewinn

Heterogeneous Communicating Multiagent Systems

Heterogeneous Communicating Multiagent Systems Allgemein Verschieden auf jegliche Art sehr komplex und leistungsstark (allgemeinster Fall) Wohlwollend vs. Wettbewerb

Heterogeneous Communicating Multiagent Systems Beispiel: Pursuit domain Extremfall: Ein „intelligenter“ Agent steuert mehrere ausführende (single agent)

Heterogeneous Communicating Multiagent Systems Aufgaben/Fragen Untereinander verstehen Wohlwollend vs. Wettbewerb Trainer Verhandlungen Temperaturkontrolle Verpflichtungen Ressource Management

Interaktion

Möglichkeit zur Abstimmung von Aktionen Interaktion Wozu? Möglichkeit zur Abstimmung von Aktionen Alternative: vollständige wechselseitige Modellierung bei homogenen: Modell der internen Zustände bei heterogenen: Komplizierter - Ziel, Aktionen, Wissen der anderen Agenten sind möglicherweise nicht bekannt und müssen durch Beobachtung modelliert werden.

Maximieren des Gesamtergebnisses Interaktion Ziele Maximieren des Gesamtergebnisses Sicherstellung des Bestehens und der Leistungsfähigkeit des Gesamtsystems Arbeitsteilung (Bestimmung gemeinsamer Ziele/Aufgaben) Vermeidung von Redundanzen Abhängigkeiten der Aktionen der einzelnen Agenten (Reihenfolge) Behandlung von Interferenzen und Konflikten („widersprüchliche“ Ziele) Vermeidung unnötiger Konflikte Kombination unterschiedlichen Wissens Erfüllungen von Nebenbedingungen (z.B. begrenzte Ressourcen)

? Speech acts Kommunikation „extra - Environment“ Interaktion Wie? Speech acts Kommunizieren mittels Aktionen Kommunikation „extra - Environment“ ?

Interaktion Begriffe Interaktion: Wechselbeziehung, bes. die Kommunikation zw. Individuen innerhalb einer Gruppe. Kommunikation: Prozess der Mitteilung; der wechselseitige Austausch von Gedanken, Meinungen, Wissen, Erfahrungen und Gefühlen sowie die Übertragung von Nachrichten und Informationen Koordination: Abstimmen verschiedener Vorgänge Kooperation: Zusammenarbeit Konkurrenz: Wettbewerb

Interaktion Agenteninteraktion Kommunikation (communication) Verständigung mehrerer Agenten untereinander Koordination (coordination) jene Kommunikation welche zur aufgabenbezogenen Tätigkeit notwendig ist Kooperation (cooperation) jene Kommunikation welche zur Koordination und Vereinbarung gemeinsamer Ziele notwenig ist Verhandlung (negotiation) jene Kommunikation für die Aushandlung der Kompromisse

Interaktion Kommunikationstypen keine Kommunikation indirekte Kommunikation Austausch von Information über einen gemeinsamen Informationsraum (Umwelt) einfache Kommunikation individueller Austausch von einfachen Nachrichten bzw. Ereignissen Kommunikation basierend auf Konversation Austausch von strukturierten Nachrichten Konversationstheorie: Äußerungen werden mit Handlung gleichgesetzt (Sprechen ist eine Art Aktion) und wie sie die Zukunft verändern (Ich verurteile Sie zu...)

Interaktion Agentenkommunikation Voraussetzungen für erfolgreiche Kommunikation (heterogene Agenten) Gemeinsame Ontologie Gemeinsame Begriffsmenge (Vokabular) Gemeinsame Semantik für diese Begriffe Gemeinsame Kommunikationssprache in Syntax und Semantik Technische Voraussetzungen (Übertragungskanäle,..)

Interaktion Knowledge Interchange Format (KIF) Zwischensprache zur Übersetzung einer Wissensbasis von einer Repräsentation zu einer anderen. Muss mächtig genug sein, um alle in der Sprache formierten Wissensinhalte zu transportieren Deklarative Semantik Bedeutung von Ausdrücken mittels Interpretation über Modelle (logisch verwertbar) (Common Lisp ähnlich)

Interaktion Knowledge Query and Manipulation Language (KQML) spezifiziert ein Nachrichtenformat zum Austausch von Informationen Nachricht wird in eine Struktur gebracht, die von jedem Agenten verstanden wird. Die Nachricht selbst jedoch muss nicht unbedingt verstanden werden. 3 Ebenen Inhaltsebene aktueller Nachrichteninhalt (z.B.: in KIF) Nachrichtenebene spezifiziert den Nachrichtentyp/Nachrichtenparameter (Fragen, Mitteilen, „tu was“, Benachrichtigen,...) Kommunikationsebene Sender/Empfänger

Interaktion Simple Knowledge Transfer Protocol (SKTP) content SKTP message communication application ISO/OSI presentation session transport network data link physical Inhaltsebene (content Layer) Inhalt der Nachricht. Das in „Wörtern“ ausgedrückte „Wissen“ Nachrichteneben (message Layer) Nachrichtentyp, Thema der Nachricht Kommunikationsebene (communication Layer) Daten aus der KQML Nachricht für die Datenübertragung (Adressen)

Interaktion Beispiel: KQML Nachrichtenebene Kommunikationsebene Inhaltseben (ask-one : sender helmut : receiver boerse_server : replay-with euro_kurs : content (WERT EURO_DOLLAR ?wert) : language Prolog : ontology Boerse) (tell : sender boerse_server : receiver helmut : in-replay-to euro_kurs : content (WERT EURO_DOLLAR 1.0029) : language Prolog : ontology Boerse) Nachrichtentypen: Anfragen: ask-one, ask-all,... Antworten: replay, sorry,... Informationsverm.: tell,... Funktionsangebot: advertiese,... Zustand: ready, standby,...

Interaktion Koordination von Agenten Welcher Agent soll was machen – Verteilte Künstliche Intelligenz Kooperation Notwendig? Selbstsüchtig Delegieren von Aufgaben (hierarchische Strukturen) Konkurrenz Marktmechanismus Gegenseitige Kooperation (Abmachungen) Manager - mehrere Anbieter keine zentrale Kontrolle jeder Partner evaluiert Information aus seinem Standpunkt

Interaktion Koordinationsvarianten direkter Nachrichtenaustausch (point to point) message parsing Klassisch: Verbindungsarten (Client/Server), Protokolle, Synchronisation,... Blackboard (broadcast) Verwendung von gemeinsamen Datenstrukturen (shared memory) Agent entscheidet wann und was er bekannt gibt und ob er wann und welche Informationen sucht und diese bewertet Synchron und Asynchron Meeting

Multiagent Q-Learning Beispiel für die Komplexität, ohne Theorie Multiagent Q-Learning [Hu, Wellmann 2002]

Multiagent Q-Learning Multiagent Q-Learning Was soll in dem aktuellen Zustand gemacht werden? Join Action Values Ein Agent muss n Q-Tables (eine für ihn und je eine für die anderen Agenten - Modellierung) erstellen

Multiagent Q-Learning Singleagent vs. Multiagent Q-Function Optimal Q-value aktueller Reward + zukünftige Rewards wenn die optimale Strategie verwendet wird aktueller Reward + zukünftige Rewards wenn alle Agenten die optimale Strategie (Nash-Gleichgewicht) verwenden werden

Multiagent Q-Learning Beispiel Agent 1 und Agent 2 jeweils in die diagonale Ecke Gewinner: der als erster angekommen ist (oder beide zugleich – Ziel) kein Zusammenstoß

Beispiel: Multiagent Q-Learning States,... States: 9 x 9 Anfangszustand (0, 2) Aktionen: 4 Q Table: 81 x 4 = 324

Beispiel: Multiagent Q-Learning Ergebnis im Zustand (0, 2) Agent 2 Links Hinauf Agent 1 Rechts 86, 87 83, 85 96, 91 95, 95 Spieltheorie Nash Gleichgewicht Wie kann Kooperation aus Handlungen von Egoisten entstehen? Bimatrix-game (Gefangenen Dilemma)

Multiagent Q-Learning Komplexität m = Anzahl der Zustände n = Anzahl der Agenten A = möglichen Aktionen Ein Agent muss n Q – Functions lernen!