Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Präskriptive Entscheidungstheorie

Ähnliche Präsentationen


Präsentation zum Thema: "Präskriptive Entscheidungstheorie"—  Präsentation transkript:

1 Präskriptive Entscheidungstheorie
6 Entscheidungen bei bewusst handelnden Gegenspielern

2 Gliederung 6 Entscheidungen bei bewusst handelnden Gegenspielern
6.1 Kurzer Überblick über die Zweige der Entscheidungstheorie 6.2 Grundmodell und Grundbegriffe der Spieltheorie 6.3 Überblick über unterschiedliche Spielformen 6.4 Zwei-Personen-Nullsummenspiele 6.5 Das Gefangenendilemma 6.5.1 Allgemeine Darstellung 6.5.2 Wiederholtes Gefangenendilemma 6.5.3 Beispiel für eine betriebswirtschaftliche Anwendung (6.5.3 Gefangenendilemma und Unternehmensethik 6.6 Kooperative Spiele) wahrscheinlich erst nächste Sitzung

3 6.1 Zweige der Entscheidungstheorie
Ein Aktor Mehrere Aktoren Theorie sozialer Entscheidungen Spieltheorie Sicherheit - ein Ziel - mehrere Ziele Ungewissheit Risiko

4 6.2 Grundmodell und Grundbegriffe der Spieltheorie
Spieler 2 Spieler 1 b b2 a1 a2 u1(a1,b1),u2(a1,b1) u1(a1,b2),u2(a1,b2) u1(a2,b1),u2(a2,b1) u1(a2,b2),u2(a2,b2) Spieler 1 hat die Strategiemenge Ai = {a1,…,am} (hier a1 und a2) Spieler 2 hat die Strategiemenge Bj = {b1,…,bn} (hier b1 und b2) Aus jeder Strategiekombination (ai,bj) ergibt sich eine Auszahlungskombination für Spieler 1 (u1) und Spieler 2 (u2). Eine solche Darstellung heißt Bimatrix. Die Funktionen, die die Konsequenzen der Strategien in Abhängigkeit von der Wahl der Spieler angeben heißen Auszahlungsfunktionen ui. Für Spieler 1 stehen die Auszahlungen für seine Strategie 1 in der 1. Zeile, für Spieler 2 stehen die Auszahlungen für seine Strategie 1 in der 1. Spalte der Bimatrix.

5 Charakteristika von Spielsituationen
Die Ergebnisse der Entscheidungen eines Aktors hängen ab von den bewussten Entscheidungen anderer Aktoren. Die Entscheidungen sind interdependent. Die Spieler haben zumindest teilweise konfligierende Ziele und verfolgen ihren eigenen Nutzen. Jeder Aktor muss bei seinen Entscheidungen berücksichtigen, wie sich der Gegenspieler vermutlich entscheiden wird.

6 Begriffe der Spieltheorie
Interdependente Entscheidungen werden „strategisch“ genannt. Ein Plan mit passenden Handlungsschritten heißt Strategie. Der Zweig der Sozialwissenschaften, der sich mit strategischem Entscheiden beschäftigt, nennt sich Spieltheorie. Die Aktoren sind die Spieler. Ein beendetes Spiel ist eine Partie. Spiele, bei denen jeder Spieler nur einen Zug pro Partie ausführt, heißen Spiele in Normalform. (Beispiel: Preisfestlegung im Dyopol).

7 Begriffe der Spieltheorie
Spiele, bei denen jeder Spieler pro Partie mehrere Züge auszuführen hat, heißen Spiele in extensiver Form (Beispiel: Schach). Durch einen Kunstgriff können Spiele in extensiver Form in Spiele in Normalform überführt werden. Als Handlungsalternativen gelten nicht mehr die einzelnen Züge eines Spielers, sondern umfassende Strategien. Als Strategie bezeichnet man einen Plan, der für jede Information, die dem Spieler i im Zeitpunkt der Ausführung eines Zuges zur Verfügung stehen kann, eine bedingte Anweisung enthält, wie der Zug auszuführen ist (vollständiger Verhaltensplan).

8 6.3 Überblick über Spielformen
Kriterium Anzahl der Spielzüge pro Partie Jeder Spieler macht unabhängig vom anderen einen Spielzug pro Partie; Spiele in Normalform Mehrere Spielzüge pro Partie; Spiele in extensiver Form Anzahl der Spieler Zwei-Personen-Spiele N-Personen-Spiele Reihenfolge der Spielzüge Simultan; beide Spieler entscheiden gleichzeitig Sequentiell; Spieler 1 beginnt, dann entscheidet Spieler 2 Absprachen zwischen den Spielern Jeder Spieler entscheidet für sich; unkooperative Spiele Spieler einigen sich auf eine gemeinsame Strategiewahl; kooperative Spiele Anzahl der Partien Eine Partie Wiederholte Partien Anzahl der Strategien Endlich; Matrixspiele Unendlich; kontinuierliche Spiele

9 Überblick über Spielformen
Auszahlungssumme Nullsummenspiele; die Auszahlungssumme für die Spieler ist konstant; was der eine gewinnt, muss der andere verlieren, d.h. die Summe der Gewinne und Verluste ist Null. Nicht-Nullsummenspiele; die Spieler können durch Kooperation gemeinsam eine bessere Situation erreichen (win-win-Situation). Anzahl der Lösungen Determinierte Spiele; es existiert genau eine Lösung Indeterminierte Spiele Informationen Perfekte Information; jeder kennt die Anzahl der Spieler, Strategien, die Auszahlungen und den Verlauf der bisherigen Partie. Imperfekte Information;

10 6.4 Zwei-Personen-Nullsummenspiele
Der Gewinn des ersten Spielers ist genau gleich dem Verlust des zweiten Spielers: u2 = -u1 Die Interessen der Spieler sind antagonistisch, eine Kooperation ist nicht sinnvoll. Spieler 2 Spieler 1 b b b3 Minimum ai a1 a2 a3 4/ / /-2 1/ / /0 4/ / /-3 1 3 Maximum bj

11 Zwei-Personen-Nullsummenspiel
Eine Möglichkeit zur Entscheidung ist die Maximin-Strategie. Spieler 1 schaut sich die Auszahlungen für seine 3 Strategien an und bestimmt jeweils das Zeilenminimum. Dann wählt er die Alternative mit dem maximalen Minimum, hier also a3. Diese Auszahlung, die der Spieler aus eigener Kraft garantieren kann, heißt unterer Spielwert.

12 Zwei-Personen-Nullsummenspiel
Spieler 2 schaut sich die Auszahlungen für seine 3 Strategien an und bestimmt die maximalen Verluste für die Strategien, also das Spaltenmaximum. Dann wählt er das Minimum der Maxima, hier also b3. Dieser Verlust, den der Spieler 2 maximal riskiert, heißt oberer Spielwert.

13 Zwei-Personen-Nullsummenspiel
Die aus dem Spiel resultierende Auszahlung liegt auf jeden Fall zwischen dem unteren und dem oberen Spielwert, im sog. Indeterminiertheitsintervall. Stimmen oberer und unterer Spielwert überein, dann ist die Lösung eindeutig, das Spiel ist determiniert.

14 Zwei-Personen-Nullsummenspiel
Im Beispiel ist die Lösung determiniert im Punkt a3/b3. Da beide Spieler in diesem Punkt ihre beste Strategie sehen, besteht dort ein sog. Gleichgewichtspunkt. Es handelt sich um eine wechselseitig beste Antwort und eine stabile Lösung, von der keiner abweicht.

15 Zwei-Personen-Nullsummenspiel
Wechselseitig beste Antworten heißt: Spieler 1 bestimmt zu jedem möglichen b seine beste Antwort. Wenn Spieler 2 b3 wählt, dann ist die beste Antwort a3 mit einer Auszahlung von 3. Spieler 2 bestimmt zu jedem möglichen a seine beste Antwort. Wenn Spieler 1 a3 wählt, dann ist b3 eine beste Antwort.

16 Zwei-Personen-Nullsummenspiel
Spieler 2 Spieler 1 b b2 Minimum ai a1 a2 a3 10/ /-1 0/ /-1000 2000/ /0 1 Maximum bj Spieler 1 wählt a1. Unterer Spielwert ist1. Spieler 2 wählt b2. Oberer Spielwert ist 1000. a1/b2 ist kein Gleichgewichtspunkt. Warum?

17 Zwei-Personen-Nullsummenspiel
Rechnet Spieler 1 mit der Maximinstrategie von Spieler 2 und dass dieser b2 wählt, dann würde er besser a2 wählen und einen Gewinn von 1000 einstreichen. Da Spieler 2 in diesem Fall einen Verlust von 1000 erleiden würde, legt er sich lieber nicht auf b2 fest. Allerdings darf er sich auch nicht auf b1 festlegen, denn dann würde Spieler 1wiederum a3 wählen und ihm sogar einen Verlust von 2000 zufügen. Es ist für Spieler 2 unmöglich, eine optimale Strategie festzulegen. Die Spieler gehen am besten zu sog. gemischten Strategien über.

18 Gemischte Strategien Von gemischten Strategien spricht man, wenn alle Strategien mit einer gewissen Wahrscheinlichkeit in Betracht kommen. Die Entscheidung wird einem Zufallsmechanismus überlassen, der die gewünschte Wahrscheinlichkeitsverteilung abbildet, bspw. Münzwurf bei zwei gleich wahrscheinlichen Strategien.

19 Unberechenbarkeit Der große Vorteil einer solchen Vorgehensweise ist die Unberechenbarkeit der Strategiewahl für den Gegner. Unberechenbarkeit ist immer dann von Vorteil, wenn der Gegner das Wissen um unsere Entscheidung ausnutzen könnte. Unberechenbarkeit ist bspw. sehr vorteilhaft bei Kontrollen. (Kontrolleur = Spieler 1, Kontrollierter = Spieler 2)

20 6.5 Gefangenendilemma Eines der bekanntesten Zwei-Personen-Spiele in der BWL. Unkooperatives Zwei-Personen Matrixspiel, aber kein Nullsummenspiel. Kooperation kann nützlich sein. Es gibt Interessenharmonien und –konflikte gleichzeitig.

21 6.5.1 Allgemeine Auszahlungsmatrix beim Gefangenendilemma
Spieler 2 Spieler 1 b b2 a1 a2 b,b c,a a,c d,d a = bestes Ergebnis b = zweitbestes Ergebnis c = schlechtestes Ergebnis d = drittbestes Ergebnis

22 Beispiel Spieler 2 Spieler 1 nicht gestehen gestehen nicht gestehen gestehen 2, ,0 0, ,6 Zwei des schweren Raubes Verdächtige werden getrennt verhört. Beide haben zwei Strategien: nicht gestehen (a1,b1) oder gestehen (a2,b2). a1,b1 sind kooperative Strategien, a2,b2 defektive Strategien.

23 Beispiel Spieler 2 Spieler 1 nicht gestehen gestehen nicht gestehen gestehen 2, ,0 0, ,6 Halten beide dicht, bekommen sie nur wegen unerlaubten Waffenbesitzes je 2 Jahre. Gestehen beide, bekommen sie beide 6 Jahre. Gesteht nur einer, dann kommt dieser als Kronzeuge ungestraft davon, während der andere 10 Jahre bekommt.

24 Gleichgewichtspunkt Spieler 1 überlegt: Wenn ich nicht gestehe (a1) und der andere gesteht (b2), dann bekomme ich 10 Jahre und der Verräter geht nach Hause. Also gestehe ich besser (a2). Wenn der andere nicht gesteht (b1) und ich gestehe (a2), dann komme ich ungestraft davon. Also gestehe ich besser. Es ist für ihn die dominante Strategie zu gestehen. Spieler 2 stellt genau die gleichen Überlegungen an, so dass bei a2,b2 ein Gleichgewichtspunkt liegt. Man spricht auch von einem Nash-Gleichgewicht.

25 Das Dilemma Das Dilemma besteht darin, dass beide durch ihre individuell beste Strategie eine Situation herbeiführen, die für beide schlechter ist als die Kooperation. Diese Überlegung trifft auf viele Situationen zu: - zwei Unternehmen im Dyopol, die versuchen, sich durch Preissenkungen Marktanteile abzujagen, erzeugen gemeinsam einen ruinösen Wettbewerb. - Fischer, die versuchen durch engmaschige Netze einen größeren Fang zu erzielen, erzeugen gemeinsam die Vernichtung ihrer Existenzgrundlage. - zwei Nationen, die durch Aufrüstung versuchen der anderen Nation militärisch überlegen zu werden, erzeugen gemeinsam ein teures Wettrüsten. - usw.

26 Das Dilemma Manchmal ist ein Gefangenendilemma erwünscht, nämlich bspw. als Wettbewerbsanreiz im Dyopol, zur Destabilisierung von Kartellen. Meistens führt die Situation aber dazu, dass die kollektiv rationale Lösung gerade dadurch verhindert wird, dass alle Spieler ihren individuellen Nutzen maximieren.

27 Wege aus dem Dilemma Eigentlich sind beide Spieler daran interessiert, den schlechten Gleichgewichtspunkt zu verlassen. Allerdings nur, wenn der andere auch (zuverlässig) kooperiert. Was könnte man tun? - einfache Absprachen - persönlichkeitsbestimmte Lösung - Defektieren entdecken und bestrafen - Selbstbindung an kooperative Strategie

28 Absprachen Einfache Absprachen ohne zusätzliche Sicherungsinstrumente gelten als nicht sehr zuverlässig, da bei jedem der Anreiz zum Defektieren groß bleibt.

29 Persönlichkeitsbestimmte Lösung
Damit ist gemeint, dass die Spieler sich gegenseitig gut kennen und deshalb das Verhalten des anderen gut einschätzen können. Vertrauen sie einander, bspw. weil sie langjährige Freunde sind, dann kommen sie eher zu einer kooperativen Lösung. Auch wer den anderen als besonders rachsüchtige Person kennt, könnte deshalb auf ein Defektieren verzichten, aus Angst vor Strafe.

30 Garantierte Bestrafung
Man kann versuchen, den Gegenspieler zu kooperativem Verhalten zu zwingen, indem man jedes Defektieren garantiert bestraft. Beispiel: Eine Niedrigpreisgarantie an die eigenen Kunden zu geben führt bei jeder Preissenkung der Konkurrenz unweigerlich zu einem Preiskrieg, der auch dem anderen schadet. Das stabilisiert die Preise auf einem höheren Niveau.

31 Selbstbindung Kooperation kann auch erleichtert werden, indem man sich selbst auf kooperatives Verhalten unwiderruflich verpflichtet. Beispiel: Man schließt einen Vertrag ab mit Garantien und Vertragsstrafen für den Fall der Nichteinhaltung. Damit verschwindet sozusagen der Vorteil aus dem Defektieren. Man kann auch noch einen Dritten mit der Vertragsüberwachung beauftragen.

32 6.5.2 Wiederholtes Gefangenendilemma
Das Entdecken und Bestrafen von unkooperativem Verhalten wird leichter bei wiederholten Partien zwischen den gleichen Spielern. Auch eine glaubwürdige Selbstbindung wird leichter, weil man mit fortdauernder Kooperation eine Reputation aufbaut, die man nicht verlieren möchte.

33 Wiederholtes Gefangenendilemma
Ist die Anzahl der Spielrunden ex ante bekannt, dann ist das Nash-Gleichgewicht allerdings wieder der gegenseitige Verrat. In der letzten Runde wird auf jeden Falle defektiert, weil keine Bestrafung mehr folgen kann. Dann wird aber auch in der vorletzten Runde defektiert, weil kein Spieler sich ausbeuten lassen will. Dann wird auch in vorvorletzten Runde defektiert usw. Es findet keine Kooperation mehr statt.

34 Wiederholtes Gefangenendilemma
Bei einem von Robert Axelrod durchgeführten Turnier mit verschiedenen Strategien bei zufällig oft wiederholten Spielen, schnitt im Durchschnitt die Strategie „tit-for-tat“ am besten ab. Der Spieler kooperiert in der ersten Runde und spielt danach immer so, wie der Gegner in der Vorrunde gespielt hat, also kooperativ, wenn der Gegner kooperativ war und defektiv, wenn der Gegner defektiert hat.

35 Stärken von „tit-for-tat“
Die Strategie ist klar und einfach. Sie ist „nett“, weil sie mit Kooperation startet. Sie ist „provozierbar“, d.h. sie bestraft das Defektieren des anderen sofort. Sie ist „nachsichtig“, denn wenn der andere wieder kooperiert, dann ist man auch wieder zur Kooperation bereit.

36 Schwächen von „tit-for-tat“
Man muss einseitig mit Kooperation in „Vorleistung“ gehen. Spielen beide Spieler nach dieser Strategie, dann bricht durch ein einziges Missverständnis die ganze Kooperation zusammen, weil man dann nie mehr zu kooperativem Verhalten zurückfindet. (Echos) Die Strategie ist im Durchschnitt die beste, weil sie fast immer zumindest ein Unentschieden erreicht, aber sie gewinnt so gut wie nie im direkten Paarvergleich mit anderen Strategien.

37 Weitere Strategien Immer defektieren Immer kooperieren
zufällig defektieren oder kooperieren mit Kooperation beginnen, aber nach einer Defektion des anderen nie mehr kooperieren. Tit-for-tat, aber in 10% der Fälle defektieren nach einer Kooperation des anderen Tit-for-n-tat, erst wenn der andere n-mal defektiert, reagiert man auch mit Defektion

38 Beste Strategie? Es gibt keine beste Strategie, da es immer auf die Strategie des Gegners ankommt. Das Zusammenspiel ist entscheidend! Insgesamt schneiden die „freundlichen“ Strategien besser ab, die zunächst mal mit Kooperation beginnen und die auf Defektion begrenzt nachsichtig reagieren. Die Strategie, immer zu kooperieren, ist dann besonders erfolgreich, wenn der andere auch diese Strategie hat. Gegen ausbeuterische Strategien verliert sie.

39 Empfehlungen für das Spielverhalten
Sei nicht neidisch! Beachte, dass es nicht um ein Nullsummenspiel geht, bei dem du um jeden Preis gewinnen willst. Versuche, gemeinsam Erfolg zu haben. Defektiere nie als erster! Das erzeugt nur Vergeltung und schadet beiden. Erwidere sowohl Kooperation als auch Defektion! Sei nicht zu rachsüchtig und kehre zur Kooperation zurück, wenn der andere es auch tut. Lasse dich aber auch nicht endlos ausnutzen. Sei nicht zu raffiniert! Erlaube dem anderen, deine Strategie zu durchschauen, damit er sich darauf einstellen kann.

40 6.5.3 Beispiel für eine betriebswirtschaftliche Anwendung
Bei der Weitergabe von Wissen an die Kollegen in einem Betrieb kann ein Gefangenendilemma auftreten. Für alle zusammen wäre es das beste, wenn jeder sein Wissen weitergibt. Für den Einzelnen kann es noch attraktiver sein, das eigene Wissen zu behalten, zugleich aber vom Wissen der anderen zu profitieren. Wenn jeder versucht, die Trittbrettfahrerposition einzunehmen, landet man bei der unkooperativen Lösung, die für alle schlechter ist. (Wissensweitergabe als spieltheoretisches Problem, in Zeitschrift für Personalforschung, 2003, Heft 1, S )

41 Maßnahmen zur Förderung der Wissensweitergabe
Defektieren bestrafen bzw. kooperieren belohnen; schon im Arbeitsvertrag die Wissensweitergabe verpflichtend machen und Strafen androhen bzw. Belohnungen versprechen. Problem: Wissensweitergabe beobachten und messen, insbesondere auch die Qualität des Wissens. Längere Spiele in Aussicht stellen, bspw. durch langfristige Beschäftigungsverhältnisse und interne Arbeitsmärkte. Eher kleinere Gruppen bilden, damit die Mitarbeiter sich besser kennen und wechselseitig kontrollieren und Vertrauen aufbauen. Den Mitarbeitern viele Gelegenheiten zum Austausch geben, bspw. in Qualitätszirkeln. Sorgfältige Mitarbeiterauswahl, Pflege einer offenen Unternehmenskultur, Schulung der Führungskräfte.


Herunterladen ppt "Präskriptive Entscheidungstheorie"

Ähnliche Präsentationen


Google-Anzeigen