Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Präskriptive Entscheidungstheorie 6 Entscheidungen bei bewusst handelnden Gegenspielern.

Ähnliche Präsentationen


Präsentation zum Thema: "Präskriptive Entscheidungstheorie 6 Entscheidungen bei bewusst handelnden Gegenspielern."—  Präsentation transkript:

1 Präskriptive Entscheidungstheorie 6 Entscheidungen bei bewusst handelnden Gegenspielern

2 Gliederung 6 Entscheidungen bei bewusst handelnden Gegenspielern 6.1 Kurzer Überblick über die Zweige der Entscheidungstheorie 6.2 Grundmodell und Grundbegriffe der Spieltheorie 6.3 Überblick über unterschiedliche Spielformen 6.4 Zwei-Personen-Nullsummenspiele 6.5 Das Gefangenendilemma Allgemeine Darstellung Wiederholtes Gefangenendilemma Beispiel für eine betriebswirtschaftliche Anwendung (6.5.3 Gefangenendilemma und Unternehmensethik 6.6 Kooperative Spiele) wahrscheinlich erst nächste Sitzung

3 6.1 Zweige der Entscheidungstheorie Ein Aktor Mehrere Aktoren Theorie sozialer Entscheidungen SpieltheorieSicherheit - ein Ziel - mehrere Ziele Ungewissheit Risiko

4 6.2 Grundmodell und Grundbegriffe der Spieltheorie Spieler 1 hat die Strategiemenge A i = {a 1,…,am} (hier a 1 und a 2 ) Spieler 2 hat die Strategiemenge B j = {b 1,…,bn} (hier b 1 und b 2 ) Aus jeder Strategiekombination (a i,b j ) ergibt sich eine Auszahlungskombination für Spieler 1 (u 1 ) und Spieler 2 (u 2 ). Eine solche Darstellung heißt Bimatrix. Die Funktionen, die die Konsequenzen der Strategien in Abhängigkeit von der Wahl der Spieler angeben heißen Auszahlungsfunktionen u i. Für Spieler 1 stehen die Auszahlungen für seine Strategie 1 in der 1. Zeile, für Spieler 2 stehen die Auszahlungen für seine Strategie 1 in der 1. Spalte der Bimatrix. Spieler 2 Spieler 1 b 1 b 2 a1a2a1a2 u 1 (a 1,b 1 ),u 2 (a 1,b 1 ) u 1 (a 1,b 2 ),u 2 (a 1,b 2 ) u 1 (a 2,b 1 ),u 2 (a 2,b 1 ) u 1 (a 2,b 2 ),u 2 (a 2,b 2 )

5 Charakteristika von Spielsituationen Die Ergebnisse der Entscheidungen eines Aktors hängen ab von den bewussten Entscheidungen anderer Aktoren. Die Entscheidungen sind interdependent. Die Spieler haben zumindest teilweise konfligierende Ziele und verfolgen ihren eigenen Nutzen. Jeder Aktor muss bei seinen Entscheidungen berücksichtigen, wie sich der Gegenspieler vermutlich entscheiden wird.

6 Begriffe der Spieltheorie Interdependente Entscheidungen werden strategisch genannt. Ein Plan mit passenden Handlungsschritten heißt Strategie. Der Zweig der Sozialwissenschaften, der sich mit strategischem Entscheiden beschäftigt, nennt sich Spieltheorie. Die Aktoren sind die Spieler. Ein beendetes Spiel ist eine Partie. Spiele, bei denen jeder Spieler nur einen Zug pro Partie ausführt, heißen Spiele in Normalform. (Beispiel: Preisfestlegung im Dyopol).

7 Begriffe der Spieltheorie Spiele, bei denen jeder Spieler pro Partie mehrere Züge auszuführen hat, heißen Spiele in extensiver Form (Beispiel: Schach). Durch einen Kunstgriff können Spiele in extensiver Form in Spiele in Normalform überführt werden. Als Handlungsalternativen gelten nicht mehr die einzelnen Züge eines Spielers, sondern umfassende Strategien. Als Strategie bezeichnet man einen Plan, der für jede Information, die dem Spieler i im Zeitpunkt der Ausführung eines Zuges zur Verfügung stehen kann, eine bedingte Anweisung enthält, wie der Zug auszuführen ist (vollständiger Verhaltensplan).

8 6.3 Überblick über Spielformen Kriterium Anzahl der Spielzüge pro Partie Jeder Spieler macht unabhängig vom anderen einen Spielzug pro Partie; Spiele in Normalform Mehrere Spielzüge pro Partie; Spiele in extensiver Form Anzahl der SpielerZwei-Personen-SpieleN-Personen-Spiele Reihenfolge der SpielzügeSimultan; beide Spieler entscheiden gleichzeitig Sequentiell; Spieler 1 beginnt, dann entscheidet Spieler 2 Absprachen zwischen den Spielern Jeder Spieler entscheidet für sich; unkooperative Spiele Spieler einigen sich auf eine gemeinsame Strategiewahl; kooperative Spiele Anzahl der PartienEine PartieWiederholte Partien Anzahl der StrategienEndlich; MatrixspieleUnendlich; kontinuierliche Spiele

9 Überblick über Spielformen AuszahlungssummeNullsummenspiele; die Auszahlungssumme für die Spieler ist konstant; was der eine gewinnt, muss der andere verlieren, d.h. die Summe der Gewinne und Verluste ist Null. Nicht-Nullsummenspiele; die Spieler können durch Kooperation gemeinsam eine bessere Situation erreichen (win-win- Situation). Anzahl der LösungenDeterminierte Spiele; es existiert genau eine Lösung Indeterminierte Spiele InformationenPerfekte Information; jeder kennt die Anzahl der Spieler, Strategien, die Auszahlungen und den Verlauf der bisherigen Partie. Imperfekte Information;

10 6.4 Zwei-Personen- Nullsummenspiele Der Gewinn des ersten Spielers ist genau gleich dem Verlust des zweiten Spielers: u 2 = -u 1 Die Interessen der Spieler sind antagonistisch, eine Kooperation ist nicht sinnvoll. Spieler 2 Spieler 1 b 1 b 2 b 3 Minimum a i a1a2a3a1a2a3 4/-4 1/-1 2/-2 1/-1 5/-5 0/0 4/-4 3/-3 3/ Maximum b j 4 5 3

11 Zwei-Personen-Nullsummenspiel Eine Möglichkeit zur Entscheidung ist die Maximin-Strategie. Spieler 1 schaut sich die Auszahlungen für seine 3 Strategien an und bestimmt jeweils das Zeilenminimum. Dann wählt er die Alternative mit dem maximalen Minimum, hier also a 3. Diese Auszahlung, die der Spieler aus eigener Kraft garantieren kann, heißt unterer Spielwert.

12 Zwei-Personen-Nullsummenspiel Spieler 2 schaut sich die Auszahlungen für seine 3 Strategien an und bestimmt die maximalen Verluste für die Strategien, also das Spaltenmaximum. Dann wählt er das Minimum der Maxima, hier also b 3. Dieser Verlust, den der Spieler 2 maximal riskiert, heißt oberer Spielwert.

13 Zwei-Personen-Nullsummenspiel Die aus dem Spiel resultierende Auszahlung liegt auf jeden Fall zwischen dem unteren und dem oberen Spielwert, im sog. Indeterminiertheitsintervall. Stimmen oberer und unterer Spielwert überein, dann ist die Lösung eindeutig, das Spiel ist determiniert.

14 Zwei-Personen-Nullsummenspiel Im Beispiel ist die Lösung determiniert im Punkt a 3 /b 3. Da beide Spieler in diesem Punkt ihre beste Strategie sehen, besteht dort ein sog. Gleichgewichtspunkt. Es handelt sich um eine wechselseitig beste Antwort und eine stabile Lösung, von der keiner abweicht.

15 Zwei-Personen-Nullsummenspiel Wechselseitig beste Antworten heißt: Spieler 1 bestimmt zu jedem möglichen b seine beste Antwort. Wenn Spieler 2 b 3 wählt, dann ist die beste Antwort a 3 mit einer Auszahlung von 3. Spieler 2 bestimmt zu jedem möglichen a seine beste Antwort. Wenn Spieler 1 a 3 wählt, dann ist b 3 eine beste Antwort.

16 Zwei-Personen-Nullsummenspiel Spieler 1 wählt a 1. Unterer Spielwert ist1. Spieler 2 wählt b 2. Oberer Spielwert ist a 1 /b 2 ist kein Gleichgewichtspunkt. Warum? Spieler 2 Spieler 1 b 1 b 2 Minimum a i a1a2a3a1a2a3 10/-10 1/-1 0/0 1000/ / /0 1 0 Maximum b j

17 Rechnet Spieler 1 mit der Maximinstrategie von Spieler 2 und dass dieser b 2 wählt, dann würde er besser a 2 wählen und einen Gewinn von 1000 einstreichen. Da Spieler 2 in diesem Fall einen Verlust von 1000 erleiden würde, legt er sich lieber nicht auf b 2 fest. Allerdings darf er sich auch nicht auf b 1 festlegen, denn dann würde Spieler 1wiederum a 3 wählen und ihm sogar einen Verlust von 2000 zufügen. Es ist für Spieler 2 unmöglich, eine optimale Strategie festzulegen. Die Spieler gehen am besten zu sog. gemischten Strategien über. Zwei-Personen-Nullsummenspiel

18 Gemischte Strategien Von gemischten Strategien spricht man, wenn alle Strategien mit einer gewissen Wahrscheinlichkeit in Betracht kommen. Die Entscheidung wird einem Zufallsmechanismus überlassen, der die gewünschte Wahrscheinlichkeitsverteilung abbildet, bspw. Münzwurf bei zwei gleich wahrscheinlichen Strategien.

19 Unberechenbarkeit Der große Vorteil einer solchen Vorgehensweise ist die Unberechenbarkeit der Strategiewahl für den Gegner. Unberechenbarkeit ist immer dann von Vorteil, wenn der Gegner das Wissen um unsere Entscheidung ausnutzen könnte. Unberechenbarkeit ist bspw. sehr vorteilhaft bei Kontrollen. (Kontrolleur = Spieler 1, Kontrollierter = Spieler 2)

20 6.5 Gefangenendilemma Eines der bekanntesten Zwei-Personen- Spiele in der BWL. Unkooperatives Zwei-Personen Matrixspiel, aber kein Nullsummenspiel. Kooperation kann nützlich sein. Es gibt Interessenharmonien und –konflikte gleichzeitig.

21 6.5.1 Allgemeine Auszahlungsmatrix beim Gefangenendilemma a = bestes Ergebnis b = zweitbestes Ergebnis c = schlechtestes Ergebnis d = drittbestes Ergebnis Spieler 2 Spieler 1 b 1 b 2 a1a2a1a2 b,b c,a a,c d,d

22 Beispiel Zwei des schweren Raubes Verdächtige werden getrennt verhört. Beide haben zwei Strategien: nicht gestehen (a1,b1) oder gestehen (a2,b2). a1,b1 sind kooperative Strategien, a2,b2 defektive Strategien. Spieler 2 Spieler 1 nicht gestehen gestehen nicht gestehen gestehen 2,2 10,0 0,10 6,6

23 Beispiel Halten beide dicht, bekommen sie nur wegen unerlaubten Waffenbesitzes je 2 Jahre. Gestehen beide, bekommen sie beide 6 Jahre. Gesteht nur einer, dann kommt dieser als Kronzeuge ungestraft davon, während der andere 10 Jahre bekommt. Spieler 2 Spieler 1 nicht gestehen gestehen nicht gestehen gestehen 2,2 10,0 0,10 6,6

24 Gleichgewichtspunkt Spieler 1 überlegt: Wenn ich nicht gestehe (a 1 ) und der andere gesteht (b 2 ), dann bekomme ich 10 Jahre und der Verräter geht nach Hause. Also gestehe ich besser (a 2 ). Wenn der andere nicht gesteht (b 1 ) und ich gestehe (a 2 ), dann komme ich ungestraft davon. Also gestehe ich besser. Es ist für ihn die dominante Strategie zu gestehen. Spieler 2 stellt genau die gleichen Überlegungen an, so dass bei a 2,b 2 ein Gleichgewichtspunkt liegt. Man spricht auch von einem Nash-Gleichgewicht.

25 Das Dilemma Das Dilemma besteht darin, dass beide durch ihre individuell beste Strategie eine Situation herbeiführen, die für beide schlechter ist als die Kooperation. Diese Überlegung trifft auf viele Situationen zu: - zwei Unternehmen im Dyopol, die versuchen, sich durch Preissenkungen Marktanteile abzujagen, erzeugen gemeinsam einen ruinösen Wettbewerb. - Fischer, die versuchen durch engmaschige Netze einen größeren Fang zu erzielen, erzeugen gemeinsam die Vernichtung ihrer Existenzgrundlage. - zwei Nationen, die durch Aufrüstung versuchen der anderen Nation militärisch überlegen zu werden, erzeugen gemeinsam ein teures Wettrüsten. - usw.

26 Das Dilemma Manchmal ist ein Gefangenendilemma erwünscht, nämlich bspw. als Wettbewerbsanreiz im Dyopol, zur Destabilisierung von Kartellen. Meistens führt die Situation aber dazu, dass die kollektiv rationale Lösung gerade dadurch verhindert wird, dass alle Spieler ihren individuellen Nutzen maximieren.

27 Wege aus dem Dilemma Eigentlich sind beide Spieler daran interessiert, den schlechten Gleichgewichtspunkt zu verlassen. Allerdings nur, wenn der andere auch (zuverlässig) kooperiert. Was könnte man tun? - einfache Absprachen - persönlichkeitsbestimmte Lösung - Defektieren entdecken und bestrafen - Selbstbindung an kooperative Strategie

28 Absprachen Einfache Absprachen ohne zusätzliche Sicherungsinstrumente gelten als nicht sehr zuverlässig, da bei jedem der Anreiz zum Defektieren groß bleibt.

29 Persönlichkeitsbestimmte Lösung Damit ist gemeint, dass die Spieler sich gegenseitig gut kennen und deshalb das Verhalten des anderen gut einschätzen können. Vertrauen sie einander, bspw. weil sie langjährige Freunde sind, dann kommen sie eher zu einer kooperativen Lösung. Auch wer den anderen als besonders rachsüchtige Person kennt, könnte deshalb auf ein Defektieren verzichten, aus Angst vor Strafe.

30 Garantierte Bestrafung Man kann versuchen, den Gegenspieler zu kooperativem Verhalten zu zwingen, indem man jedes Defektieren garantiert bestraft. Beispiel: Eine Niedrigpreisgarantie an die eigenen Kunden zu geben führt bei jeder Preissenkung der Konkurrenz unweigerlich zu einem Preiskrieg, der auch dem anderen schadet. Das stabilisiert die Preise auf einem höheren Niveau.

31 Selbstbindung Kooperation kann auch erleichtert werden, indem man sich selbst auf kooperatives Verhalten unwiderruflich verpflichtet. Beispiel: Man schließt einen Vertrag ab mit Garantien und Vertragsstrafen für den Fall der Nichteinhaltung. Damit verschwindet sozusagen der Vorteil aus dem Defektieren. Man kann auch noch einen Dritten mit der Vertragsüberwachung beauftragen.

32 6.5.2 Wiederholtes Gefangenendilemma Das Entdecken und Bestrafen von unkooperativem Verhalten wird leichter bei wiederholten Partien zwischen den gleichen Spielern. Auch eine glaubwürdige Selbstbindung wird leichter, weil man mit fortdauernder Kooperation eine Reputation aufbaut, die man nicht verlieren möchte.

33 Wiederholtes Gefangenendilemma Ist die Anzahl der Spielrunden ex ante bekannt, dann ist das Nash-Gleichgewicht allerdings wieder der gegenseitige Verrat. In der letzten Runde wird auf jeden Falle defektiert, weil keine Bestrafung mehr folgen kann. Dann wird aber auch in der vorletzten Runde defektiert, weil kein Spieler sich ausbeuten lassen will. Dann wird auch in vorvorletzten Runde defektiert usw. Es findet keine Kooperation mehr statt.

34 Wiederholtes Gefangenendilemma Bei einem von Robert Axelrod durchgeführten Turnier mit verschiedenen Strategien bei zufällig oft wiederholten Spielen, schnitt im Durchschnitt die Strategie tit-for-tat am besten ab. Der Spieler kooperiert in der ersten Runde und spielt danach immer so, wie der Gegner in der Vorrunde gespielt hat, also kooperativ, wenn der Gegner kooperativ war und defektiv, wenn der Gegner defektiert hat.

35 Stärken von tit-for-tat Die Strategie ist klar und einfach. Sie ist nett, weil sie mit Kooperation startet. Sie ist provozierbar, d.h. sie bestraft das Defektieren des anderen sofort. Sie ist nachsichtig, denn wenn der andere wieder kooperiert, dann ist man auch wieder zur Kooperation bereit.

36 Schwächen von tit-for-tat Man muss einseitig mit Kooperation in Vorleistung gehen. Spielen beide Spieler nach dieser Strategie, dann bricht durch ein einziges Missverständnis die ganze Kooperation zusammen, weil man dann nie mehr zu kooperativem Verhalten zurückfindet. (Echos) Die Strategie ist im Durchschnitt die beste, weil sie fast immer zumindest ein Unentschieden erreicht, aber sie gewinnt so gut wie nie im direkten Paarvergleich mit anderen Strategien.

37 Weitere Strategien Immer defektieren Immer kooperieren zufällig defektieren oder kooperieren mit Kooperation beginnen, aber nach einer Defektion des anderen nie mehr kooperieren. Tit-for-tat, aber in 10% der Fälle defektieren nach einer Kooperation des anderen Tit-for-n-tat, erst wenn der andere n-mal defektiert, reagiert man auch mit Defektion

38 Beste Strategie? Es gibt keine beste Strategie, da es immer auf die Strategie des Gegners ankommt. Das Zusammenspiel ist entscheidend! Insgesamt schneiden die freundlichen Strategien besser ab, die zunächst mal mit Kooperation beginnen und die auf Defektion begrenzt nachsichtig reagieren. Die Strategie, immer zu kooperieren, ist dann besonders erfolgreich, wenn der andere auch diese Strategie hat. Gegen ausbeuterische Strategien verliert sie.

39 Empfehlungen für das Spielverhalten Sei nicht neidisch! Beachte, dass es nicht um ein Nullsummenspiel geht, bei dem du um jeden Preis gewinnen willst. Versuche, gemeinsam Erfolg zu haben. Defektiere nie als erster! Das erzeugt nur Vergeltung und schadet beiden. Erwidere sowohl Kooperation als auch Defektion! Sei nicht zu rachsüchtig und kehre zur Kooperation zurück, wenn der andere es auch tut. Lasse dich aber auch nicht endlos ausnutzen. Sei nicht zu raffiniert! Erlaube dem anderen, deine Strategie zu durchschauen, damit er sich darauf einstellen kann.

40 6.5.3 Beispiel für eine betriebswirtschaftliche Anwendung Bei der Weitergabe von Wissen an die Kollegen in einem Betrieb kann ein Gefangenendilemma auftreten. Für alle zusammen wäre es das beste, wenn jeder sein Wissen weitergibt. Für den Einzelnen kann es noch attraktiver sein, das eigene Wissen zu behalten, zugleich aber vom Wissen der anderen zu profitieren. Wenn jeder versucht, die Trittbrettfahrerposition einzunehmen, landet man bei der unkooperativen Lösung, die für alle schlechter ist. (Wissensweitergabe als spieltheoretisches Problem, in Zeitschrift für Personalforschung, 2003, Heft 1, S )

41 Maßnahmen zur Förderung der Wissensweitergabe Defektieren bestrafen bzw. kooperieren belohnen; schon im Arbeitsvertrag die Wissensweitergabe verpflichtend machen und Strafen androhen bzw. Belohnungen versprechen. Problem: Wissensweitergabe beobachten und messen, insbesondere auch die Qualität des Wissens. Längere Spiele in Aussicht stellen, bspw. durch langfristige Beschäftigungsverhältnisse und interne Arbeitsmärkte. Eher kleinere Gruppen bilden, damit die Mitarbeiter sich besser kennen und wechselseitig kontrollieren und Vertrauen aufbauen. Den Mitarbeitern viele Gelegenheiten zum Austausch geben, bspw. in Qualitätszirkeln. Sorgfältige Mitarbeiterauswahl, Pflege einer offenen Unternehmenskultur, Schulung der Führungskräfte.


Herunterladen ppt "Präskriptive Entscheidungstheorie 6 Entscheidungen bei bewusst handelnden Gegenspielern."

Ähnliche Präsentationen


Google-Anzeigen