Gliederung Problemstellung

Slides:



Advertisements
Ähnliche Präsentationen
Agent Based Supply Chain Management1 ABSCM-Vorlesung im WS 2001/2002.
Advertisements

Agent based computational economics Das Konzept rationalen Verhaltens im Umfeld maschineller Akteure Spezielles Seminar Wirtschaftsinformatik SS2001 Frankfurt.
Anreizkompatible Auktionsformen
Christian Scheideler SS 2009
Spieltheorie Analyse und Umsetzung in Java
Themen Grundlagen Bedingungen für Koalitionsstrukturen
Rekursion: Rekurrenz: Algorithmen rufen sich selbst (rekursiv) auf.
Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,
GIN2 SS05 Prof. Dr. W. Conen, Nullsummen-Spiele - Min-Max-Suche - Alpha-Beta-Pruning (späterer Termin)
Proof-Planning. Übersicht Einleitung Proof-Planning Bridge-Taktiken Repräsentation des Gegenspiels Planungsalgorithmus Suchen mit Histories.
Internationale Vereinbarungen II
Prof. Dr. W. Conen 15. November 2004
Suche in Texten (Stringsuche )
Sicherheitsäquivalent der Lotterie L
Seminar „Extrapolationsmethoden für zufällige Felder“
Seminar über Algorithmen
Andreas Kalender Institut für Informatik FU Berlin Seminar über Algorithmen Durchschnittsverzögerung.
Prinzipal-Agenten Beziehungen
Spielbäume Richard Göbel.
SciAgents - Eine agentenbasierte Umgebung für verteilte wissenschaftliche Berechnungen Alexander StarkeSeminar Software Agenten
Lernende Agenten Seminar Softwareagenten Wintersemester 2001/2002 Norman Neuhaus.
Algorithmentheorie 04 –Hashing
Algorithmentheorie 6 – Greedy-Verfahren
Prof.Dr.S. Albers Prof. Dr. Th. Ottmann
Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 4 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät.
Algorithmentheorie 7 – Bin Packing
Genetische Algorithmen
Kapitel 5 Stetigkeit.
Professionelles Projektmanagement in der Praxis
PG 520 Intelligence Service – gezielte Informationen aus dem Internet
1/25 UNIVERSITY OF PADERBORN Projektgruppe KIMAS Projektgruppe KIMAS MultiAgenten-Systeme Andreas Goebels.
(Ron Rivest, Adi Shamit, Leonard Adleman , 1977)
Tutorium: Wirtschaftliche Grundlagen für den Arbeitslehreunterricht
Y2y2 y1y1 O E y C y-a y-L y-L-a A K F J M H Prof. Dr. Johann Graf Lambsdorff Universität Passau SS 2009 Abschnitt 10: Unvollständige Verträge und das Problem.
Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz.
Folien zur Veranstaltung Einführung in die Systemwissenschaften Wichtig: Die Folien dienen nur zur Präsentation, sie enthalten nicht die vollständige Veranstaltung!
Kontrollfragen zu Kapitel 1
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Kakuro Regeln und Strategien
Effiziente Algorithmen
Universität Stuttgart Wissensverarbeitung und Numerik I nstitut für K ernenergetik und E nergiesysteme Numerik partieller Differentialgleichungen, SS 01Teil.
Effiziente Algorithmen
Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.
Theorien, Methoden, Modelle und Praxis
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/ /23.1.
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Polynome und schnelle Fourier-Transformation
Spieltheorie Mária Némethy.
Management, Führung & Kommunikation
ENDLICHE KÖRPER RSA – VERFAHREN.
Management, Führung & Kommunikation
Analyse der Laufzeit von Algorithmen
HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik Algorithmische Probleme in Funknetzwerken VIII Christian Schindelhauer
1.1 Einführung und institutionelle Grundlagen  Wagenhofer/Ewert Alle Rechte.
SS 2009Maschinelles Lernen und Neural Computation 133 Kapitel 7: Ensemble Methoden.
Gliederung der Vorlesung
Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 3 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Einige Elemente der Spieltheorie
Verhandlungstechnik und alternative Streiterledigung, FS 2012 Dr. iur. Peter Liatowitsch Büttel Deborah, Giacometti Lorette, Herzog Julian, Hochstrasser.
Lineare Optimierung Nakkiye Günay, Jennifer Kalywas & Corina Unger Jetzt erkläre ich euch die einzelnen Schritte und gebe Tipps!
Vorlesung im Rahmen des Deutsch-Französischen Dozenten-Austauschprogramms „Minerve“ Dr. Matthias Hanauske Institut für Wirtschaftsinformatik Goethe-Universität.
1. 2 Das Grundproblem der Beurteilenden Statistik ● Wir haben uns bisher mit Problemen der Wahrscheinlichkeitsrechnung beschäftigt: – Die Wahrscheinlichkeit.
 Präsentation transkript:

Gliederung Problemstellung Spieltheoretische Konzepte der Verhandlungsspiele (axiomatisch, strategisch) Multiagentensysteme: Kriterien für Mechanismen Umgebungsabhängige Mechanismen Einbeziehung des Zeitaspekts Berücksichtigung einer Deadline Beschränkte Rationalität bei der Lösung von Aufgaben Kooperation im Gefangenendilemma, insbesondere Simulationen von Axelrod Schlussbemerkungen Agent-Based Computational Economics: Game Theoretic Foundations

Problemstellung Systeme werden immer häufiger von verschiedenen Teilnehmern mit eigenen Präferenzen und Zielen genutzt (auch durch verstärkten Einsatz des Internets) Das System kann deshalb nicht mehr zentral kontrolliert werden Zentral können Mechanismen (sozus. Spielregeln) vorgegeben werden, die konkreten Strategien werden aber lokal von den verschiedenen Agenten ausgewählt Agenten müssen Anreize erhalten, so zu handeln, dass ein gewünschtes Ergebnis erzielt wird  Konzepte der Spieltheorie, um Mechanismen für Multiagentensysteme zu entwickeln. Agent-Based Computational Economics: Game Theoretic Foundations 1

Problemstellung Probleme bei der Anwendung der Spieltheorie: Traditionell Annahme der vollständigen Rationalität der Spieler. Computer unterliegen aber insbesondere Rechenzeitrestriktionen Dann gilt das Gleichgewicht aus der traditionellen Spieltheorie u.U. nicht mehr. Beschränkte Rationalität lässt sich für Computer-Agenten besser darstellen als für menschliche. Verhandlungen benötigen Zeit und verursachen u.U. sehr viel Kommunikation Agent-Based Computational Economics: Game Theoretic Foundations 2

Verhandlungsspiele Verhandlungsspiel: Menge von Spielern Menge aller möglichen Nutzenvektoren u = (u1, ..., un) Konfliktpunkt c = (c1, ..., cn) Eigenschaften der Lösung: Individuell rational Pareto-optimal Agent-Based Computational Economics: Game Theoretic Foundations 3

Axiomatische Lösungskonzepte Nash-Lösung: Axiome: Unabhängigkeit von äquivalenter Nutzentransformation Symmetrie Unabhängigkeit von irrelevanten Alternativen Pareto-Optimalität Nutzenvektor u, der für beide Spieler besser ist als der Konfliktpunkt, und der außerdem folgendes maximiert: (u1 – c1) (u2 – c2) Agent-Based Computational Economics: Game Theoretic Foundations 4

Axiomatische Lösungskonzepte (2) Problem: Verschiedene Lösungskonzepte, die auf intuitiven Axiomen aufbauen, aber zu verschiedenen Ergebnissen führen. Welches davon ist das „Richtige“? Nicht beachtet: wie ist das tatsächliche Verhalten in Verhandlungen? Stattdessen: nichtkooperatives Verhandlungsspiel, Suche nach Gleichgewicht Agent-Based Computational Economics: Game Theoretic Foundations 5

Strategisches Lösungskonzept Rubinstein: Unendlicher Zeithorizont Abwechselnd Gebote Nutzen sinkt im Zeitablauf Teilspielperfektes Gleichgewicht: Konstante Kosten: c1 > c2: (c2, 1-c2) falls 1. Spieler das 1. Angebot macht, sonst (0,1) Diskontfaktor: Vorteilhaft: Niedrige Zeitpräferenz („geduldiger“) 1. Gebot Agent-Based Computational Economics: Game Theoretic Foundations 6

Strategisches Lösungskonzept (2) Probleme: In Realität keine beliebig kleine Teilung des „Kuchens“ möglich (dann steigt die Anzahl der teilspielperfekten Gleichgewichte) Experimente führen zu anderen Ergebnissen (Ultimatum Game) Was passiert, wenn jemand vom teilspielperfekten Gleichgewicht abweicht? Theorie: der andere Spieler geht davon aus, dass dies ein Versehen war und in Zukunft nicht mehr vorkommen wird. Was passiert aber, wenn man die Rationalitätsannahme aufgibt? Vollständige Information Agent-Based Computational Economics: Game Theoretic Foundations 7

Kriterien für Mechanismen (nach Kraus, Wilkenfeld, Zlotkin) Verteilt (dezentralisierte Entscheidungen) Augenblicklich (ohne Verzögerung) Effizient (pareto-optimal) Einfach (auch was Berechnungs- und Kommunikationsaufwand betrifft) Symmetrisch (kein Unterschied, falls es nur Unterschiede bei nichtrelevanten Eigenschaften der Agenten gibt) Stabil (Gleichgewichte, d.h. kein Designer eines Agenten würde davon profitieren, von bestimmten Strategien abzuweichen) Zugang/Erfüllbarkeit (zu Ressourcen oder gemeinsames Ziel erreicht) Agent-Based Computational Economics: Game Theoretic Foundations 8

Umgebungsabhängige Mechanismen Zlotkin, Rosenschein (1996) State oriented domains: Aktionen eines Agenten können Auswirkungen auf die Zielerreichung eines anderen Agenten haben. Annahmen: Zwei Spieler maximieren ihren Erwartungsnutzen Keine langfristigen Verträge Vergleichbarkeit der Nutzen der Agenten Symmetrische Fähigkeiten Bindende Vereinbarungen Kein expliziter Nutzentransfer Agent-Based Computational Economics: Game Theoretic Foundations 9

Umgebungsabhängige Mechanismen (2) Vollständige Information: Nutzen aus Kooperation für Agent i: Kosten bei individueller Problemlösung – Kosten für i aus gemeinsamer Lösung Notwendige und hinreichende Bedingung für eine individuell rationale und pareto-optimale Lösung: Gesamte Kosten für gemeinsames Ziel  Summe aus der Erreichung beider Einzelziele. (Summenbedingung) Kleinste Kosten aus einem Einzelziel  minimale Kosten, die Agent bei gemeinsamer Lösung tragen muss. (Minimumbedingung) Kooperationssituation  Nash-Lösung Agent-Based Computational Economics: Game Theoretic Foundations 10

Umgebungsabhängige Mechanismen (3) Kompromisssituation: Mindestens eine der beiden Bedingungen ist verletzt. Nutzen für Agent i: Wertschätzung des individuellen Ziels – Kosten für i aus gemeinsamer Lösung Analog zu Kooperationssituation Eine höhere Wertschätzung führt dazu, dass man einen höheren Anteil der Kosten tragen muss. Agent-Based Computational Economics: Game Theoretic Foundations 11

Umgebungsabhängige Mechanismen (4) Konfliktsituation: Es gibt keine Möglichkeit mehr, beide Ziele gemeinsam zu erreichen. Münzwurf Zwischenziel, dann Münzwurf (semi-kooperativer Handel) Münzwurf, dann gemeinsames Erreichen des Ziels (Multi-Plan-Handel. Vereinbarung muss verbindlich sein.) Agent-Based Computational Economics: Game Theoretic Foundations 12

Umgebungsabhängige Mechanismen (5) Unvollständige Information: Ziele nicht bekannt: Anreiz, leichtere Ziele anzugeben, dabei muss aber bei einer gemeinsamen Lösung das tatsächliche Ziel erreicht werden. Werte nicht bekannt: Anreiz, weniger zu berichten, um einen kleineren Anteil der Kosten tragen zu können. Generelles Problem: nicht wahrheitsinduzierend Agent-Based Computational Economics: Game Theoretic Foundations 13

Einbeziehung des Zeitaspekts Kraus, Wilkenfeld, Zlotkin (1995) Annahmen: Keine Seitenzahlungen möglich Zeitaspekt wichtig bei Nutzenbestimmung (Unterschied zu Zlotkin, Rosenschein) Keine langfristigen Verträge möglich Abwechselnd Gebote Gesucht: Teilspielperfekte Gleichgewichte für verschiedene Szenarien Agent-Based Computational Economics: Game Theoretic Foundations 14

Einbeziehung des Zeitaspekts (2) Betrachtete Situationen: Zwei vollständig informierte Agenten, keine Möglichkeit des Verhandlungsabbruchs  Rubinstein: Einigung in erster Periode, Vorteil für geduldigeren Spieler, für 1. Bieter Zwei vollständig informierte Agenten, Möglichkeit des Verhandlungsabbruchs, beide Spieler verlieren im Zeitablauf, es gibt einen Zeitpunkt, zu dem eine Einigung für beide besser ist als ein Abbruch  Einigung in erster Periode. Der geduldigere Spieler hat einen Vorteil. Agent-Based Computational Economics: Game Theoretic Foundations 15

Einbeziehung des Zeitaspekts (3) Zwei vollständig informierte Spieler, Möglichkeit des Verhandlungsabbruchs, ein Spieler gewinnt (A), der andere verliert (W) im Zeitablauf  zwei Fälle: W verliert weniger als A gewinnt: maximal eine Periode Verzögerung, da W mit einem Abbruch drohen kann. Nicht pareto-optimal, da A später mehr bekäme und dies aufteilen könnte. Hat aber Anreiz, diesen Zeitpunkt immer weiter hinauszuzögern. Die Verzögerung entsteht, wenn W zuerst bietet, da A ablehnt und dann ein Angebot macht, das W annimmt. Dieser würde sonst aus der Verhandlung aussteigen. W verliert mehr als A gewinnt: Einigung in erster Periode, da A sonst zuviel bezahlen müsste. Agent-Based Computational Economics: Game Theoretic Foundations 16

Einbeziehung des Zeitaspekts (4) 4. Wie Situation 3, aber unvollständig informierte Agenten. Es gibt verschiedene A- und W-Typen. Hier nun gesucht: sequentielles Gleichgewicht Jeder W verhält sich in der 1. Periode wie der der Typ, der am wenigsten im Zeitablauf verliert und am ehesten die Verhandlung abbricht, da er sonst befürchten muss, dass A ein schlechteres Angebot macht. A lehnt in der 1. Periode jedes Angebot ab und macht aufgrund seiner Einschätzungen über den Typ W ein Angebot. Manche Ws brechen dann die Verhandlungen ab, andere nehmen an. A legt sein Gebot so fest, dass sein erwarteter Nutzen maximiert wird. Insgesamt evt. Einigung in 2. Periode, u.U. kommt es aber auch zu keiner Einigung. Agent-Based Computational Economics: Game Theoretic Foundations 17

Berücksichtigung einer Deadline Sandholm, Vulkan (2002) Kritik an Rubinstein: unendlicher Zeithorizont ist unrealistisch, Ergebnisse ändern sich, wenn es eine Deadline gibt. Annahme der vollständigen Information unrealistisch. Annahmen: Deadline ist private Information, Verteilung common knowledge Zu jedem Zeitpunkt geben beide Agenten ein Angebot ab, welchen Anteil der Ressource sie haben möchten. Zunächst beanspruchen beide alles. Deadline eines Agenten erreicht: der andere erhält gesamte Ressource Agent-Based Computational Economics: Game Theoretic Foundations 18

Berücksichtigung einer Deadline (2) Betrachtete Situationen: stetige Zeitintervalle, keine Diskontierung, risikoneutrale Agenten  sequentielles Gleichgewicht: Agent mit späterer Deadline erhält gesamte Ressource zum Zeitpunkt der früheren Deadline. Jeder verlangt bis zu diesem Zeitpunkt alles, da Angebote Signale darstellen, die die Einschätzung über die Deadline des Gegenspielers verändern. Wie 1., mit Diskontierung  sequentielles Gleichgewicht wie in Situation 1. Einziges sequentielles Gleichgewicht, falls das Produkt der beiden Diskontfaktoren größer als 0,5 ist. D.h. der Einfluss der Deadline ist größer als der Einfluss der Diskontierung, wenn der „Kuchen“ im Zeitablauf nicht zu sehr abnimmt. Agent-Based Computational Economics: Game Theoretic Foundations 19

Berücksichtigung einer Deadline (3) Wie 1, aber keine Annahme mehr zur Risikoeinstellung  sequentielles Gleichgewicht wie in Situation 1. Einziges sequentielles Gleichgewicht, falls das Produkt der beiden maximalen Risikoaversionen (Maximum von ui(x)/x über alle x) kleiner als 2 ist. diskrete Zeitintervalle  beide Spieler erreichen mit positiver Wahrscheinlichkeit die Deadline zum gleichen Zeitpunkt  falls diese Deadline die maximal mögliche ist, ist jeder Split möglich. Sonst einziges sequentielles Gleichgewicht wie oben. Mechanismus: beide berichten Deadline. Agent mit späterer Deadline erhält alles zum Zeitpunkt der früheren Deadline. Wahrheitsgemäßer Bericht ist dominante Strategie. Verringert Kommunikationsaufwand. Agent-Based Computational Economics: Game Theoretic Foundations 20

Beschränkte Rationalität Larson, Sandholm (2001) Möglichkeit, eine Aufgabe gemeinsam zu lösen (Verhandlungsgegenstand), oder jeder Agent löst sein individuelles Problem Problem: beschränkte Rationalität. Der Wert des Verhandlungsgegenstandes ist u.U. noch gar nicht bekannt, d.h. die Agenten wissen noch gar nicht, wie hoch der Nutzen aus dem Gewinn der Verhandlung ist. Es gibt Anytime-Algorithmen zur Berechnung des Werts des Verhandlungsgegenstandes. Es gibt statistische Leistungsprofilbäume, die angeben, wie sich die Lösungsqualität nach t Rechenschritten verändern kann. Agent-Based Computational Economics: Game Theoretic Foundations 21

Beschränkte Rationalität (2) Deadline T. Dann wird ein Gebot abgegeben. Vorher gibt es keine Kommunikation. Möglichkeit, die Verhandlungen abzubrechen (die Agenten lösen dann ihre individuellen Probleme) Strategie: Welches Problem wird näher untersucht? (eigenes, das des anderen oder gemeinsames) Welches Gebot? Gesucht: „deliberation equilibrium“ Agent-Based Computational Economics: Game Theoretic Foundations 22

Beschränkte Rationalität (3) Bieter bekannt: Dominante Strategie des anderen Agenten: berechnet nur eigenes Problem und nimmt jedes Angebot an, das zu einem höheren Nutzen führt als die Lösung seines eigenen Problems. Bieter: Zeitpunkt der Deadline bekannt, es gibt deterministischen Leistungsprofilbaum: Berechnet das Problem, das ihm den größten Nutzen bringt Stochastischer Baum: höchster erwarteter Nutzen bei Auswahl des Problem Agent-Based Computational Economics: Game Theoretic Foundations 23

Beschränkte Rationalität (4) Deadline nicht bekannt: Agenten haben eine Einschätzung über den Zeitpunkt der Deadline. Diese Einschätzung wird in jeder Periode revidiert. Bieter entscheidet über die Berechnung seines eigenen und des gemeinsamen Problems anhand des erwarteten Nutzens daraus. Optimale Strategie des anderen Agenten ist analog zur Basissituation. Falls der Bieter nicht bekannt ist, haben beide keine dominante Strategie. Es gibt Situationen, in denen es kein Gleichgewicht in reinen Strategien gibt. Außerdem gibt es Fälle, in denen das einzige Nash-Gleichgewicht nicht zu einem pareto-optimalen Ergebnis führt. Agent-Based Computational Economics: Game Theoretic Foundations 24

Kooperation im Gefangenendilemma Dominant: keine Kooperation. Kooperation führt aber zu höherem Nutzen. Wiederholtes Spiel: Reputation möglich. Endliche Wiederholung: wie einmaliges Spiel Unendliche Wiederholung: unendlich viele Nash-Gleichgewichte Spieler 2: Kooperation Spieler 2: keine Kooperation Spieler 1: Kooperation (3, 3) (1, 4) Spieler 1: keine Kooperation (4, 1) (2, 2) Agent-Based Computational Economics: Game Theoretic Foundations 25

Simulationen von Axelrod Simulation verschiedener Strategien im wiederholten Gefangenendilemma Beste Strategie: Tit for Tat Bleibt auch beste Strategie bei evolutionärer Betrachtung, wenn bessere Strategien sich in der Menge aller Strategien der Simulation tendenziell stärker verbreiten, wenn der Diskontfaktor ausreichend groß ist. Agent-Based Computational Economics: Game Theoretic Foundations 26

Zusammenspiel Multiagentensysteme - Spieltheorie Die verschiedenen Ansätze zeigen, dass spieltheoretische Konzepte beim Design von Multiagentensystemen eine hilfreiche Unterstützung liefern können. Umgekehrt können Simulationen mit Hilfe von Multiagentensystemen auch zu neuen Erkenntnissen im Rahmen der Spieltheorie führen. Dies wird vor allem im Bereich der evolutionären Spieltheorie verwendet. Agent-Based Computational Economics: Game Theoretic Foundations 27