Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Gliederung 1.Problemstellung 2.Spieltheoretische Konzepte der Verhandlungsspiele (axiomatisch, strategisch) 3.Multiagentensysteme: 1.Kriterien für Mechanismen.

Ähnliche Präsentationen


Präsentation zum Thema: "Gliederung 1.Problemstellung 2.Spieltheoretische Konzepte der Verhandlungsspiele (axiomatisch, strategisch) 3.Multiagentensysteme: 1.Kriterien für Mechanismen."—  Präsentation transkript:

1 Gliederung 1.Problemstellung 2.Spieltheoretische Konzepte der Verhandlungsspiele (axiomatisch, strategisch) 3.Multiagentensysteme: 1.Kriterien für Mechanismen 2.Umgebungsabhängige Mechanismen 3.Einbeziehung des Zeitaspekts 4.Berücksichtigung einer Deadline 5.Beschränkte Rationalität bei der Lösung von Aufgaben 4.Kooperation im Gefangenendilemma, insbesondere Simulationen von Axelrod 5.Schlussbemerkungen Agent-Based Computational Economics: Game Theoretic Foundations

2 Problemstellung Systeme werden immer häufiger von verschiedenen Teilnehmern mit eigenen Präferenzen und Zielen genutzt (auch durch verstärkten Einsatz des Internets) Das System kann deshalb nicht mehr zentral kontrolliert werden Zentral können Mechanismen (sozus. Spielregeln) vorgegeben werden, die konkreten Strategien werden aber lokal von den verschiedenen Agenten ausgewählt Agenten müssen Anreize erhalten, so zu handeln, dass ein gewünschtes Ergebnis erzielt wird Konzepte der Spieltheorie, um Mechanismen für Multiagentensysteme zu entwickeln. Agent-Based Computational Economics: Game Theoretic Foundations 1

3 Problemstellung Probleme bei der Anwendung der Spieltheorie: Traditionell Annahme der vollständigen Rationalität der Spieler. Computer unterliegen aber insbesondere Rechenzeitrestriktionen Dann gilt das Gleichgewicht aus der traditionellen Spieltheorie u.U. nicht mehr. Beschränkte Rationalität lässt sich für Computer-Agenten besser darstellen als für menschliche. Verhandlungen benötigen Zeit und verursachen u.U. sehr viel Kommunikation Agent-Based Computational Economics: Game Theoretic Foundations 2

4 Verhandlungsspiele Verhandlungsspiel: Menge von Spielern Menge aller möglichen Nutzenvektoren u = (u 1,..., u n ) Konfliktpunkt c = (c 1,..., c n ) Eigenschaften der Lösung: Individuell rational Pareto-optimal Agent-Based Computational Economics: Game Theoretic Foundations 3

5 Axiomatische Lösungskonzepte Nash-Lösung: Axiome: Unabhängigkeit von äquivalenter Nutzentransformation Symmetrie Unabhängigkeit von irrelevanten Alternativen Pareto-Optimalität Nutzenvektor u, der für beide Spieler besser ist als der Konfliktpunkt, und der außerdem folgendes maximiert: (u 1 – c 1 ) (u 2 – c 2 ) Agent-Based Computational Economics: Game Theoretic Foundations 4

6 Axiomatische Lösungskonzepte (2) Problem: Verschiedene Lösungskonzepte, die auf intuitiven Axiomen aufbauen, aber zu verschiedenen Ergebnissen führen. Welches davon ist das Richtige? Nicht beachtet: wie ist das tatsächliche Verhalten in Verhandlungen? Stattdessen: nichtkooperatives Verhandlungsspiel, Suche nach Gleichgewicht Agent-Based Computational Economics: Game Theoretic Foundations 5

7 Strategisches Lösungskonzept Rubinstein: Unendlicher Zeithorizont Abwechselnd Gebote Nutzen sinkt im Zeitablauf Teilspielperfektes Gleichgewicht: Konstante Kosten: c 1 > c 2: (c 2, 1-c 2 ) falls 1. Spieler das 1. Angebot macht, sonst (0,1) Diskontfaktor: Vorteilhaft: Niedrige Zeitpräferenz (geduldiger) 1. Gebot Agent-Based Computational Economics: Game Theoretic Foundations 6

8 Strategisches Lösungskonzept (2) Probleme: In Realität keine beliebig kleine Teilung des Kuchens möglich (dann steigt die Anzahl der teilspielperfekten Gleichgewichte) Experimente führen zu anderen Ergebnissen (Ultimatum Game) Was passiert, wenn jemand vom teilspielperfekten Gleichgewicht abweicht? Theorie: der andere Spieler geht davon aus, dass dies ein Versehen war und in Zukunft nicht mehr vorkommen wird. Was passiert aber, wenn man die Rationalitätsannahme aufgibt? Vollständige Information Agent-Based Computational Economics: Game Theoretic Foundations 7

9 Kriterien für Mechanismen (nach Kraus, Wilkenfeld, Zlotkin) Verteilt (dezentralisierte Entscheidungen) Augenblicklich (ohne Verzögerung) Effizient (pareto-optimal) Einfach (auch was Berechnungs- und Kommunikationsaufwand betrifft) Symmetrisch (kein Unterschied, falls es nur Unterschiede bei nichtrelevanten Eigenschaften der Agenten gibt) Stabil (Gleichgewichte, d.h. kein Designer eines Agenten würde davon profitieren, von bestimmten Strategien abzuweichen) Zugang/Erfüllbarkeit (zu Ressourcen oder gemeinsames Ziel erreicht) Agent-Based Computational Economics: Game Theoretic Foundations 8

10 Umgebungsabhängige Mechanismen Zlotkin, Rosenschein (1996) State oriented domains: Aktionen eines Agenten können Auswirkungen auf die Zielerreichung eines anderen Agenten haben. Annahmen: Zwei Spieler maximieren ihren Erwartungsnutzen Keine langfristigen Verträge Vergleichbarkeit der Nutzen der Agenten Symmetrische Fähigkeiten Bindende Vereinbarungen Kein expliziter Nutzentransfer Agent-Based Computational Economics: Game Theoretic Foundations 9

11 Umgebungsabhängige Mechanismen (2) Vollständige Information: Nutzen aus Kooperation für Agent i: Kosten bei individueller Problemlösung – Kosten für i aus gemeinsamer Lösung Notwendige und hinreichende Bedingung für eine individuell rationale und pareto-optimale Lösung: Gesamte Kosten für gemeinsames Ziel Summe aus der Erreichung beider Einzelziele. (Summenbedingung) Kleinste Kosten aus einem Einzelziel minimale Kosten, die Agent bei gemeinsamer Lösung tragen muss. (Minimumbedingung) Kooperationssituation Nash-Lösung Agent-Based Computational Economics: Game Theoretic Foundations 10

12 Umgebungsabhängige Mechanismen (3) Kompromisssituation: Mindestens eine der beiden Bedingungen ist verletzt. Nutzen für Agent i: Wertschätzung des individuellen Ziels – Kosten für i aus gemeinsamer Lösung Analog zu Kooperationssituation Eine höhere Wertschätzung führt dazu, dass man einen höheren Anteil der Kosten tragen muss. Agent-Based Computational Economics: Game Theoretic Foundations 11

13 Umgebungsabhängige Mechanismen (4) Konfliktsituation: Es gibt keine Möglichkeit mehr, beide Ziele gemeinsam zu erreichen. Münzwurf Zwischenziel, dann Münzwurf (semi-kooperativer Handel) Münzwurf, dann gemeinsames Erreichen des Ziels (Multi-Plan- Handel. Vereinbarung muss verbindlich sein.) Agent-Based Computational Economics: Game Theoretic Foundations 12

14 Umgebungsabhängige Mechanismen (5) Unvollständige Information: Ziele nicht bekannt: Anreiz, leichtere Ziele anzugeben, dabei muss aber bei einer gemeinsamen Lösung das tatsächliche Ziel erreicht werden. Werte nicht bekannt: Anreiz, weniger zu berichten, um einen kleineren Anteil der Kosten tragen zu können. Generelles Problem: nicht wahrheitsinduzierend Agent-Based Computational Economics: Game Theoretic Foundations 13

15 Einbeziehung des Zeitaspekts Kraus, Wilkenfeld, Zlotkin (1995) Annahmen: Keine Seitenzahlungen möglich Zeitaspekt wichtig bei Nutzenbestimmung (Unterschied zu Zlotkin, Rosenschein) Keine langfristigen Verträge möglich Abwechselnd Gebote Gesucht: Teilspielperfekte Gleichgewichte für verschiedene Szenarien Agent-Based Computational Economics: Game Theoretic Foundations 14

16 Einbeziehung des Zeitaspekts (2) Betrachtete Situationen: 1.Zwei vollständig informierte Agenten, keine Möglichkeit des Verhandlungsabbruchs Rubinstein: Einigung in erster Periode, Vorteil für geduldigeren Spieler, für 1. Bieter 2.Zwei vollständig informierte Agenten, Möglichkeit des Verhandlungsabbruchs, beide Spieler verlieren im Zeitablauf, es gibt einen Zeitpunkt, zu dem eine Einigung für beide besser ist als ein Abbruch Einigung in erster Periode. Der geduldigere Spieler hat einen Vorteil. Agent-Based Computational Economics: Game Theoretic Foundations 15

17 Einbeziehung des Zeitaspekts (3) 3.Zwei vollständig informierte Spieler, Möglichkeit des Verhandlungsabbruchs, ein Spieler gewinnt (A), der andere verliert (W) im Zeitablauf zwei Fälle: i.W verliert weniger als A gewinnt: maximal eine Periode Verzögerung, da W mit einem Abbruch drohen kann. Nicht pareto-optimal, da A später mehr bekäme und dies aufteilen könnte. Hat aber Anreiz, diesen Zeitpunkt immer weiter hinauszuzögern. Die Verzögerung entsteht, wenn W zuerst bietet, da A ablehnt und dann ein Angebot macht, das W annimmt. Dieser würde sonst aus der Verhandlung aussteigen. ii.W verliert mehr als A gewinnt: Einigung in erster Periode, da A sonst zuviel bezahlen müsste. Agent-Based Computational Economics: Game Theoretic Foundations 16

18 Einbeziehung des Zeitaspekts (4) 4. Wie Situation 3, aber unvollständig informierte Agenten. Es gibt verschiedene A- und W-Typen. Hier nun gesucht: sequentielles Gleichgewicht Jeder W verhält sich in der 1. Periode wie der der Typ, der am wenigsten im Zeitablauf verliert und am ehesten die Verhandlung abbricht, da er sonst befürchten muss, dass A ein schlechteres Angebot macht. A lehnt in der 1. Periode jedes Angebot ab und macht aufgrund seiner Einschätzungen über den Typ W ein Angebot. Manche Ws brechen dann die Verhandlungen ab, andere nehmen an. A legt sein Gebot so fest, dass sein erwarteter Nutzen maximiert wird. Insgesamt evt. Einigung in 2. Periode, u.U. kommt es aber auch zu keiner Einigung. Agent-Based Computational Economics: Game Theoretic Foundations 17

19 Berücksichtigung einer Deadline Sandholm, Vulkan (2002) Kritik an Rubinstein: unendlicher Zeithorizont ist unrealistisch, Ergebnisse ändern sich, wenn es eine Deadline gibt. Annahme der vollständigen Information unrealistisch. Annahmen: Deadline ist private Information, Verteilung common knowledge Zu jedem Zeitpunkt geben beide Agenten ein Angebot ab, welchen Anteil der Ressource sie haben möchten. Zunächst beanspruchen beide alles. Deadline eines Agenten erreicht: der andere erhält gesamte Ressource Agent-Based Computational Economics: Game Theoretic Foundations 18

20 Berücksichtigung einer Deadline (2) Betrachtete Situationen: 1.stetige Zeitintervalle, keine Diskontierung, risikoneutrale Agenten sequentielles Gleichgewicht: Agent mit späterer Deadline erhält gesamte Ressource zum Zeitpunkt der früheren Deadline. Jeder verlangt bis zu diesem Zeitpunkt alles, da Angebote Signale darstellen, die die Einschätzung über die Deadline des Gegenspielers verändern. 2.Wie 1., mit Diskontierung sequentielles Gleichgewicht wie in Situation 1. Einziges sequentielles Gleichgewicht, falls das Produkt der beiden Diskontfaktoren größer als 0,5 ist. D.h. der Einfluss der Deadline ist größer als der Einfluss der Diskontierung, wenn der Kuchen im Zeitablauf nicht zu sehr abnimmt. Agent-Based Computational Economics: Game Theoretic Foundations 19

21 Berücksichtigung einer Deadline (3) 3.Wie 1, aber keine Annahme mehr zur Risikoeinstellung sequentielles Gleichgewicht wie in Situation 1. Einziges sequentielles Gleichgewicht, falls das Produkt der beiden maximalen Risikoaversionen (Maximum von u i (x)/x über alle x) kleiner als 2 ist. 4.diskrete Zeitintervalle beide Spieler erreichen mit positiver Wahrscheinlichkeit die Deadline zum gleichen Zeitpunkt falls diese Deadline die maximal mögliche ist, ist jeder Split möglich. Sonst einziges sequentielles Gleichgewicht wie oben. Mechanismus: beide berichten Deadline. Agent mit späterer Deadline erhält alles zum Zeitpunkt der früheren Deadline. Wahrheitsgemäßer Bericht ist dominante Strategie. Verringert Kommunikationsaufwand. Agent-Based Computational Economics: Game Theoretic Foundations 20

22 Beschränkte Rationalität Larson, Sandholm (2001) Möglichkeit, eine Aufgabe gemeinsam zu lösen (Verhandlungsgegenstand), oder jeder Agent löst sein individuelles Problem Problem: beschränkte Rationalität. Der Wert des Verhandlungsgegenstandes ist u.U. noch gar nicht bekannt, d.h. die Agenten wissen noch gar nicht, wie hoch der Nutzen aus dem Gewinn der Verhandlung ist. Es gibt Anytime-Algorithmen zur Berechnung des Werts des Verhandlungsgegenstandes. Es gibt statistische Leistungsprofilbäume, die angeben, wie sich die Lösungsqualität nach t Rechenschritten verändern kann. Agent-Based Computational Economics: Game Theoretic Foundations 21

23 Beschränkte Rationalität (2) Deadline T. Dann wird ein Gebot abgegeben. Vorher gibt es keine Kommunikation. Möglichkeit, die Verhandlungen abzubrechen (die Agenten lösen dann ihre individuellen Probleme) Strategie: Welches Problem wird näher untersucht? (eigenes, das des anderen oder gemeinsames) Welches Gebot? Gesucht: deliberation equilibrium Agent-Based Computational Economics: Game Theoretic Foundations 22

24 Beschränkte Rationalität (3) Bieter bekannt: Dominante Strategie des anderen Agenten: berechnet nur eigenes Problem und nimmt jedes Angebot an, das zu einem höheren Nutzen führt als die Lösung seines eigenen Problems. Bieter: Zeitpunkt der Deadline bekannt, es gibt deterministischen Leistungsprofilbaum: Berechnet das Problem, das ihm den größten Nutzen bringt Stochastischer Baum: höchster erwarteter Nutzen bei Auswahl des Problem Agent-Based Computational Economics: Game Theoretic Foundations 23

25 Beschränkte Rationalität (4) Deadline nicht bekannt: Agenten haben eine Einschätzung über den Zeitpunkt der Deadline. Diese Einschätzung wird in jeder Periode revidiert. Bieter entscheidet über die Berechnung seines eigenen und des gemeinsamen Problems anhand des erwarteten Nutzens daraus. Optimale Strategie des anderen Agenten ist analog zur Basissituation. Falls der Bieter nicht bekannt ist, haben beide keine dominante Strategie. Es gibt Situationen, in denen es kein Gleichgewicht in reinen Strategien gibt. Außerdem gibt es Fälle, in denen das einzige Nash- Gleichgewicht nicht zu einem pareto-optimalen Ergebnis führt. Agent-Based Computational Economics: Game Theoretic Foundations 24

26 Kooperation im Gefangenendilemma Dominant: keine Kooperation. Kooperation führt aber zu höherem Nutzen. Wiederholtes Spiel: Reputation möglich. Endliche Wiederholung: wie einmaliges Spiel Unendliche Wiederholung: unendlich viele Nash-Gleichgewichte Agent-Based Computational Economics: Game Theoretic Foundations 25 Spieler 2: KooperationSpieler 2: keine Kooperation Spieler 1: Kooperation(3, 3)(1, 4) Spieler 1: keine Kooperation(4, 1)(2, 2)

27 Simulationen von Axelrod Simulation verschiedener Strategien im wiederholten Gefangenendilemma Beste Strategie: Tit for Tat Bleibt auch beste Strategie bei evolutionärer Betrachtung, wenn bessere Strategien sich in der Menge aller Strategien der Simulation tendenziell stärker verbreiten, wenn der Diskontfaktor ausreichend groß ist. Agent-Based Computational Economics: Game Theoretic Foundations 26

28 Zusammenspiel Multiagentensysteme - Spieltheorie Die verschiedenen Ansätze zeigen, dass spieltheoretische Konzepte beim Design von Multiagentensystemen eine hilfreiche Unterstützung liefern können. Umgekehrt können Simulationen mit Hilfe von Multiagentensystemen auch zu neuen Erkenntnissen im Rahmen der Spieltheorie führen. Dies wird vor allem im Bereich der evolutionären Spieltheorie verwendet. Agent-Based Computational Economics: Game Theoretic Foundations 27


Herunterladen ppt "Gliederung 1.Problemstellung 2.Spieltheoretische Konzepte der Verhandlungsspiele (axiomatisch, strategisch) 3.Multiagentensysteme: 1.Kriterien für Mechanismen."

Ähnliche Präsentationen


Google-Anzeigen