Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Projektvortrag von Andreas Hapek

Ähnliche Präsentationen


Präsentation zum Thema: "Projektvortrag von Andreas Hapek"—  Präsentation transkript:

1 Projektvortrag von Andreas Hapek
Inspektionsspiele Projektvortrag von Andreas Hapek

2 Ein Inspektionsspiel ist ein 2 Personen Spiel, in der ein Inspektor (Kontrolleur) darüber wacht, dass sich die Gegen-Partei, der sog. Inspizierte, an bestimmte Regeln hält. Der Inspizierte hat dabei Anreize gegen diese Regeln zu verstoßen. Will dabei aber nicht vom Inspektor erwischt werden. Das oberste Ziel für den Inspektor ist dabei ein illegales Verhalten des Inspizierten durch Überwachungsmaßnahmen zu verhindern. Erklären was es alles für varianten gibt: Zeitabhängig / unabhängig Simultan / nicht simultan …. Typische Beispiele: zufällige Kontrollen im Personennahverkehr unangekündigte Kontrollen im Abrüstungsprozess von Waffen

3 Inspektionsspiele in sequentieller Form
Variante mit n Stufen und k Kontrollen Inspektor I führt k · n Kontrollen durch Der Inspizierte O hat höchstens eine illegale Aktion zur Verfügung, die er zu jedem n einsetzen kann. O weiß zu jedem Zeitpkt. t, wie viele Kontrollen I noch einsetzen kann. 3 Abbruchfälle: I hat O bei einer illegalen Handlung erwischt I hat alle Kontrollen frühzeitig aufgebraucht > O verhält sich sofort illegal I kann noch so oft kontrollieren, wie es restliche Stufen gibt. > O verhält sich für die restlichen Stufen immer legal

4 Hier eine graphische Darstellung des Spiels mit n = 2 und k = 1.
Dabei sei 0 < a < b, 0 < c, 0 < d : O t = 1 l ̅l l I I K K (-a,-b) t = 2 ̅l, K̅ l, K l, K (-c,d) (0,0) (-c,d) Die Spieler kennen dabei immer nur die vergangenen Entscheidungen des Gegenspielers. Die zukünftige Wahl treffen sie also nur auf Grund der zurückliegenden Strategiekombinationen. Erklären dass es sich um ein simultanes Spiel handelt . Also beide Spieler wählen ihre Strategie unabhängig und ohne Kenntnis der gegnerischen Strategie. Anders als bei der nicht-simultanen Variante , das sog. Führerschaftsspiel. (siehe säter!) I\O l ̅l K (-c,+d) (-a,-b) (0,0) Man weiß bereits nach t = 1 welche Auszahlung am Ende stehen werden:

5 Lösung des simultanen Spiels nach Nash:
Dabei existiert kein Gleichgewicht in reiner Strategie. Gesucht ist also ein Glg. für eine gemischte Strategie. q 1-q I\O l ̅l K (-c,+d) (-a,-b) (0,0) p 1-p Seien I(p,q) und O(p,q) die Auszahlungsfunktionen. Das Paar (p*,q*) ist Glg. Des Spiels, wenn Nash-Bedingung I(p*,q*) ¸ I(p,q*) 8{p 2 P} O(p*,q*) ¸ O(p*,q) 8{q 2 Q} erfüllt sind. Die Bedingungen sind erfüllt, wenn beide Spieler ihre Wahl so treffen, dass der Gegenspieler jeweils indifferent ist: p* ∙ d + (1-p*) ∙ 0 = -p* ∙ b + (1-p*) ∙ d = O* - q* ∙ c - (1-q*) ∙ a = q* ∙ 0 - (1-q*) ∙ c = I* Daraus folgt: Sagen dasss P und Q Strategieräume sind. Lösungen sind eindeutig, da zyklische Auszahlungsstruktur in Normalform Matrix!!! Mit den dazugehörigen Auszahlungen:

6 Führerschaftspiel (nicht simultane Variante) :
Was ändert sich, wenn der Inspektor die Möglichkeit hat, seine Strategie glaubhaft anzukündigen ? Kann der Inspektor das ausnutzen, und wenn ja wie ? Führerschaftspiel (nicht simultane Variante) : Bedingungen: Inspektor muss sich an seine Ankündigung halten Inspizierte hat keine Zweifel über die Glaubwürdigkeit d. Inspektors Extensive Form: I p O O O Wichtig hierbei ist, daß nur er seine Strategie ankündigen kann, denn der Inspizierte hat sich laut Vertrag zu legalen Verhalten verpflichtet. Spieler 2 kann nicht vor „Spielbeginn“ ankündigen, daß er mit positiver Wahrscheinlichkeit illegal handelt, also den Vertrag verletzt, obwohl dies für ihn von der Auszahlungsstruktur her einen Vorteil bedeutet…. Ein Zweipersonen-Spiel, bei dem ein Spieler, hier mit Spieler 1 bezeichnet, seine Strategie in glaubhafter und für den anderen Spieler erkennbarer Weise ankündigt, bezeichnen wir als Führerschaftsspiel Als dritte bedingung müsste man noch sagen, dass O die richtige Info erhält Strategien von O sind jetzt Funktionen von P nach Q und keine Punkte oder Vektoren mehr! Die funktion q(p) : je größer p desto kleiner q q(p) q(p) q(p) Der Inspektor I hat weiterhin die gleiche Strategiemenge P wie im simultanen Spiel. Die Strategiemenge d. Inspizierten O hängt nun von P ab. ) QP = { q(∙) | q: P ! Q}

7 Lösung des Führerschaftspiels (nicht-simultanes Spiel):
Strategiekombination (p**,q**) mit p** 2 P und q** 2 QP heißt Nash-Lsg., wenn: I(p**, q**(p**)) ¸ I(p , q**(p**)) 8{p 2 P} O(p**,q**(p**)) ¸ O(p**,q(p**)) 8{q(∙) 2 QP} Satz: Bei gegebenem, eindeutigem Glg.Punkt eines simultanen 2x2 Spiels, ist im entsprechenden Führerschafts-Spiel die Gleichgewichtsstrategie p* aus dem simultanen Spiel für den Inspektor auch hier Gleichgewichtsstrategie. Und der Inspizierte spielt, unter seinen besten Antworten auf die angekündigte Strategie p*,diejenige als Gleichgewichtsstrategie, welche die Inspektorauszahlung I(p*,q*(p*)) maximiert. Also: Dadurch bleibt auch die Auszahlung d. Inspizierten gleich: q(p) 1-q(p) Sei ein eindeutiger gemischter Gleichgewichtspunkt eines simultanen 2 x 2-Spieles gegeben. Dann ist im entsprechenden Führerschafts-Spiel die Gleichgewichtsstrategie p* aus dem simultanen Spiel für den Inspektor auch hier Gleichgewichtsstrategie. Beste Antworten sind dabei alle rationalen Antworten, die nach Ankündigung von Strategie von I die Auszahlung des Inspizierten maximiert. D.H wenn bei p = d/2d+b der Inspizierte indifferent war verhält er sich bei p >= … immer legal und ungekehr illegal. Dabei ist P* und q**(p*) ein Nash.Glg. Für das Führerspiel. Also: q**(p**)=1 I\O l ̅l K (-c,+d) (-a,-b) (0,0) p 1-p Mit: Als Gleichgewichtsauszahlung an den Inspektor im Führersschaftspiel.

8 als im simultanen Spiel, i.Z. I** > I*.
Ist die Gleichgewichtsauszahlung für den Inspektor im Führerschaftspiel größer als im simultanen Spiel ? Dann muss gelten: Damit ist also die Erwartungsauszahlung des Inspektors im Führerschaftsspiel höher als im simultanen Spiel, i.Z. I** > I*. Die Auszahlung an den Inspizierten ist im Führerschaftsspiel unverändert, i.Z. O**=O* . Vorteil für den Inspektor liegt darin, dass er seinen Kontrolleinfluss auf die 2 Stufen verteilen kann und dabei die Strategie des Inspizierten durch seine eigene Strategie beeinflusst wird. Damit besteht für den Inspizierten eine positve W‘keit , dass er bei einer Kontrolle erwischt wird. Deshalb wählt O die rationale Antwort, sich legal zu verhalten. Zu baum: Durch die Wahl von p* durch I , weiss O dass er mit positiver W‘keit erwischt wird. deshalb wählt er seine ratoinale Antwort sich legal zu verhalten , da erwartete Auszahlung dann zw. 0 und d liegt und nicht zwischen –b und d.


Herunterladen ppt "Projektvortrag von Andreas Hapek"

Ähnliche Präsentationen


Google-Anzeigen