ENTSCHEIDUNGSTHEORIE Teil 3c Prof. Dr. Steffen Fleßa Lst ENTSCHEIDUNGSTHEORIE Teil 3c Prof. Dr. Steffen Fleßa Lst. für Allgemeine Betriebswirtschaftslehre und Gesundheitsmanagement Universität Greifswald
Gliederung 3 Konzepte der Entscheidungstheorie 3.4 Nutzentheorie 3.1 Grundmodell der Entscheidungstheorie 3.2 Entscheidung bei eindimensionalen Zielsystemen 3.3 Mehrdimensionale Zielsysteme 3.4 Nutzentheorie 3.4.1 Grundlagen 3.4.2 Ausgewählte Verfahren 3.4.3 Bernoulli-Prinzip
3.4.1 Grundlagen Prinzip: Bislang gingen wir davon aus, dass das Ergebnis einer Alternative i bei Umweltzustand j und Ziel h maßgeblich für die Entscheidung sei. In der Realität entscheiden wir jedoch nicht auf Grundlage des Ergebnisses, sondern auf Grundlage des Nutzens, den dieses Ergebnis liefert.
Alternativen Nutzen ist eine lineare Funktion des Ergebnisses durch den Ursprung: Ergebnis ist ein gutes Surrogat für den Nutzen Nutzen ist eine monotone Funktion des Ergebnisses: Ergebnis ist kein vollständiges Surrogat für den Nutzen, jedoch ein Anhaltspunkt Nutzen ist keine monotone Funktion des Ergebnisses: Ergebnis darf in keinem Fall als Surrogat für den Nutzen verwendet werden
Beispiel: Urlaubsplanung
Formales Vorgehen
Nutzentheorie Nutzenfunktion (= Präferenzfunktion): Nutzentheorie: Lehre von der Entwicklung von Nutzenfunktionen
Varianten: Unsicherheit, Ziele Sicherheit und ein Ziel Sicherheit und mehrere Ziele Unsicherheit und mehrere Ziele
Präferenzarten Höhenpräferenz Abbildung des Nutzens in Abhängigkeit von der Ergebnishöhe Artenpräferenz Gewichtung von Zielen Risikopräferenz Abbildung der Risikoeinstellung des Entscheiders Zeitpräferenz Abbildung der Gegenwartsorientierung des Entscheiders
Beispiel: Partnerwahl Artenpräferenz Ziele Ziel 1: Reichtum Ziel 2: Schönheit Ziel 3: Nettigkeit Wie wichtig sind mir diese Ziele im Verhältnis zueinander? λ1=0,2 λ2=0,3 λ3=0,5
Beispiel: Partnerwahl Höhenpräferenz Für jedes Ziel: wie viel nützt mir ein bestimmtes Niveau?
Beispiel: Partnerwahl Zeitpräferenz Reichtum, Schönheit und Nettigkeit verändern sich im Zeitablauf, z. B. Schönheit: Beschreibung Alter = 25 Alter = 50 Alter = 75 Person 1 sehr hübsch 100 Punkte 50 Punkte 20 Punkte Person 2 geht schon 80 Punkte 45 Punkte 19 Punkte Person 3 zeitlos 60 Punkte 30 Punkte Person 4 ?!?!?!?
Beispiel: Partnerwahl Hohe Zeitpräferenz: wähle Person 1 Niedrige Zeitpräferenz: Wähle Person 3 Zeitpräferenz Reichtum, Schönheit und Nettigkeit verändern sich im Zeitablauf Beschreibung Alter = 25 Alter = 50 Alter = 75 Person 1 sehr hübsch 100 Punkte 50 Punkte 20 Punkte Person 2 geht schon 80 Punkte 45 Punkte 19 Punkte Person 3 zeitlos 60 Punkte 30 Punkte Person 4 ?!?!?!?
Beispiel: Partnerwahl Risikopräferenz für alle Ziele müssen die möglichen Umweltzustände bewertet werden, z. B. Lebenseinkommen und -vermögen Beschrei-bung Früher Tod Inflation Branchen-niedergang Person 1 gutes Sparbuch 500.000 € 50.000 € Person 2 reiche Eltern 0 € 1.000.000 € Person 3 tolle Ausbildung Person 4 gute Firma 2.000.000 € -500.000 €
Beispiel: Partnerwahl Angsthase: Person 1 (da hat man auf jeden Fall etwas!) Bungee-Springer: Person 4 Risikopräferenz für alle Ziele müssen die möglichen Umweltzustände bewertet werden, z. B. Lebenseinkommen und -vermögen Beschrei-bung Früher Tod Inflation Branchen-niedergang Person 1 gutes Sparbuch 500.000 € 50.000 € Person 2 reiche Eltern 0 € 1.000.000 € Person 3 tolle Ausbildung Person 4 gute Firma 2.000.000 € -500.000 €
Terminologie Grundsatz: nicht einheitlich Eisenführ und Weber Wertfunktion: Abbildung der Höhenpräferenz bei einer Entscheidung unter Sicherheit Nutzenfunktion: Abbildung der Höhenpräferenz bei einer Entscheidung unter Unsicherheit Klein und Scholl: Nutzenfunktion = Wertfunktion
Voraussetzungen zur Ermittlung einer Nutzenfunktion Vollständige Präferenzordnung Eine Präferenzordnung ist vollständig, wenn der Entscheider für jedes Paar möglicher Ergebnisse eines gegenüber dem anderen strikt präferiert oder beide als gleichwertig erachtet. ei » ej : Ergebnis i ist besser als Ergebnis j ei ~ ej : Ergebnis i ist gleichwertig mit Ergebnis j
Voraussetzungen zur Ermittlung einer Nutzenfunktion (Forts.) Transitive Präferenzordnung Falls ein Entscheider ein Ergebnis ei gegenüber Ergebnis ej präferiert und Ergebnis ej gegenüber Ergebnis ek, so muss er auch Ergebnis ei gegenüber Ergebnis ek präferieren Falls ei » ej und ej » ek ei » ek Gegenteil: Inkonsistenz
Ordinale Nutzenfunktion Vollständige und transitive Präferenzordnungen erlauben die Entwicklung einer ordinalen Nutzenfunktion ei » ej : u(ei) > u(ej) ei ~ ej : u(ei) = u(ej)
Umgang mit Zielkonflikten Dominanzmodelle Absolute Dominanz von Alternativen Outranking-Modelle Kompromissmodelle Synonym: Multicriteria decision making; Multiobjective decision making) Bespiele: Lexikographische Ordnung Zielgewichtung Goal Programming Multiattributive Methoden Synonym: Multiattributive decision making; Multiattributive utility theory (MAUT) Inhalt: Ermittlung einer Gesamtnutzenfunktion
Entscheidungsvorbereitung bei Multiattributive Utility Theory Ermittlung der Einzelnutzenfunktionen Höhenpräferenz Ermittlung der Gesamtnutzenfunktion bei Zielkonflikt Artenpräferenz Ermittlung der Risikonutzenfunktion bei Unsicherheit Risikopräferenz Ermittlung der Zeitnutzenfunktion bei mehrperiodigen Entscheidungen Zeitpräferenz
Methoden zur Ermittlung der Höhenpräferenz: Überblick Inhalt: Entwicklung einer Einzelnutzenfunktion (für jedes Ziel) Verfahren Direct Rating Kategoriebasierte Ansätze (z. B. Schulnoten) Halbierungsmethode Methode gleicher Wertdifferenzen Analytic Hierarchy Process (AHP)
Methoden zur Ermittlung der Artenpräferenz: Überblick Inhalt: Entwicklung einer multiattributiven Gesamtnutzenfunktion Verfahren Direct Rating AHP Trade-Off-Verfahren Swing-Verfahren
Probleme der Nutzenermittlung Sachlich inkonsistente Aussagen (fehlende Transitivität) Unscharfe Aussagen (Fuzzy logic) Zeitlich inkonsistente Aussagen (heute so, morgen so) Laborsituationen („Würden Sie das kaufen?“)
3.4.2 Ausgewählte Verfahren 3.4.2.1 Outranking-Methoden 3.4.2.2 Direct Rating 3.4.2.3 Halbierungsmethode 3.4.2.4 Methode gleicher Wertdifferenzen 3.4.2.5 AHP
3.4.2.1 Outranking-Methoden Wort: Im Rang überragen (z. B. Militär) Einordnung: Es wird keine „echte“ Nutzenfunktion ermittelt. Wenn der Abstand zwischen zwei Alternativen einen bestimmten Grenzwert übersteigt, wird die Alternative als absolut besser gewertet Beispiele: ELECTRE; PROMETHEE
3.4.2.2 Direct Rating Inhalt: Verfahren zur Ermittlung einer Nutzenfunktion durch direkte Zuweisung von Nutzwerten; Grundsätzlich zur Bestimmung von Einzelnutzenfunktionen und Zielgewichten geeignet Sehr (zu?) einfach Vorgehen: Bewerte beste und schlechteste Handlungsalternative mit 100 bzw. 0 Punkten Ordne allen Ergebnissen dazwischen direkt einen Wert zwischen 0 und 100 zu [0,1]-Brandbreitennormierung: Wert / 100
Direct Rating: Schokoladenkonsum keine Schoko: 0 Punkte eine Tafel: 100 Punkte 1 Rippe: 25 Punkte 2 Rippen: 45 Punkte 3 Rippen: 65 Punkte 4 Rippen: 80 Punkte 5 Rippen: 90 Punkte 6 Rippen: 100 Punkte 7 Rippen: 70 Punkte („Mir ist schlecht!“)
Direct Rating: Schokoladenkonsum
3.4.2.3 Halbierungsmethode Syn.: Medianmethode Einordnung: Methode zur Bestimmung der Einzelnutzenfunktion Vorgehen: Schlechteste Ausprägung des betrachteten Zieles = 0 Beste Ausprägung = 1 Schätzung des Nutzenmedians, d.h. des Wertes, bei dem der Nutzen die Hälfte des Gesamtnutzens ist
Halbierungsmethode (Forts.) Vorgehen (Forts.) für jedes Teilintervall (0-0,5; 0,5-1) wiederum Angabe des entsprechenden Medians Weitere Aufteilung, bis ausreichende Genauigkeit erreicht ist
Halbierungsmethode: Schokoladenkonsum Frage 1: Bei welchem Schokoladenkonsum fühlst du dich am besten? Frage 2: Bei welchem Schokoladenkonsum fühlst du Dich am schlechtesten?
Halbierungsmethode: Schokoladenkonsum Frage 3: Bei welchem Schokoladenkonsum hast Du genau halb so viel Freude wie im Maximum? 2,5 Rippen
Halbierungsmethode: Schokoladenkonsum Frage 5: Welcher Schokoladenkonsum teilt den Nutzenzuwachs von 2,5 auf 6 Rippen Schokolade genau in der Hälfte? 4,5 Rippen Frage 4: Bei welchem Schokoladenkonsum hast Du genau halb so viel Freude wie bei der Hälfte? 1 Rippe u. 1 Stück
3.4.2.4 Methode gleicher Wertdifferenzen Einordnung: Methode zur Bestimmung der Einzelnutzenfunktion Vorgehen: Bestimmung der schlechtesten Ausprägung. Nutzen = 0 Erhöhe das Ergebnis um einen bestimmten Betrag (z. B. zwei zusätzliche Urlaubstage). Der Nutzen hiervon sei als eins definiert. Der Entscheider muss angeben, bei welchem Wert er eine Nutzenverdoppelung annimmt, d.h. gesucht ist x3, so dass U(x3) = 2; Suche weitere xi, so dass jeweils gilt: U(xi) = i Führe eine Bandbreitennormierung auf [0,1] durch
Gleiche Wertdifferenzen: Schokoladenkonsum Frage 1: Bei welchem Schokoladenkonsum fühlst du Dich am schlechtesten?
Gleiche Wertdifferenzen: Schokoladenkonsum Annahme: Zwei Rippen bringt Dir einen Nutzen von 1. Frage 2: Wie viele Rippen musst Du essen, um diesen Nutzen zu verdoppeln? 4,5 Rippen
Gleiche Wertdifferenzen: Schokoladenkonsum Frage 3: Wie viele Rippen musst Du essen, um denselben Nutzenzuwachs zu erzielen? 8 Rippen
3.4.2.5 AHP Besonderheiten Berücksichtigung der kompletten Zielhierarchie durch paarweisen Vergleich aller Ziele und Alternativen Ermittlung von Arten- und Höhenpräferenz in einem Schritt Inkonsistenzen des Entscheiders können berücksichtigt werden und „stören“ das Verfahren nicht
Paarweiser Vergleich Für jedes Paar von Alternativen bzw. Zielen wird eine Frage gestellt, z. B. Wie beurteilen Sie das Verhältnis von Prestige und Benzinverbrauch? gleichwichtig: 1 Punkt etwas wichtiger: 3 Punkte; etwas unwichtiger: 1/3 Punkte wichtiger: 5 Punkte; unwichtiger: 1/5 Punkte viel wichtiger: 7 Punkte; viel unwichtiger: 1/7 Punkte extrem wichtiger: 9 Punkte; extrem unwichtiger: 1/9 Punkte
Vergleichsmatrizen A1 A2 A3 1 3 ½ 1/3 1/9 2 9 Z1 Z2 Z3 1 5 3 1/5 2 1/3 1/2 Hier: keine Inkonsistenzen, d.h. aij=1/aji; Inkonsistenzen können mathematisch beseitigt werden
Einfachste Berechnung der Nutzen und Gewichte 1 3 ½ 1/3 1/9 2 9 Z1 Z2 Z3 1 5 3 1/5 2 1/3 1/2 λ1=0,64; λ2=0,23; λ3=0,13; Zeilensummen: A1: 4,5; A2: 1,44; A3: 12; Normierung: U(A1)= 4,5/(4,5+1,44+12)=0,25; U(A2)=1,44/(4,5+1,44+12)=0,08; U(A3)= 12/(4,5+1,44+12)=0,67
Klassisches Beispiel Saaty (1977): Abstände zwischen Städten Befragung von Amerikanern bzgl. des relativen Abstandes zwischen Städten, z. B. Die Strecke New York – Washington ist gleich weit wie die Strecke New York – Boston etwas weiter als die Strecke New York – Boston deutlich weiter als die Strecke New York – Boston viel weiter als die Strecke New York – Boston sehr viel weiter als die Strecke New York – Boston Für viele Städte und Strecken Auswertung über AHP führte tatsächlich zu annähernd richtigen Entfernungen
Bewertung AHP Zeilensumme ist unbefriedigend; bessere Verfahren existieren, insb. über Eigenwerte der Matrizen Sehr aufwendige Befragungen Grundsätzlich für wissenschaftliche Untersuchungen relevant, kaum für betriebswirtschaftliche Praxis
Abgrenzung AHP – Conjoint Analysis Hinweis: Conjoint Analysis findet sich kaum in Entscheidungslehrbüchern, jedoch in der Marketingliteratur AHP: vollständiger paarweiser Vergleich Conjoint: Ranking von ganzen Eigenschaftsbündeln
Beispiel: zwei Farben, zwei Größen AHP: Farbe: rot ist gleich schön wie blau rot ist etwas schöner als blau rot ist deutlich schöner als blau rot ist viel schöner als blau rot ist sehr viel schöner als blau Größe: groß ist gleich gut wie klein groß ist etwas besser als klein groß ist deutlich besser als klein groß ist viel besser als klein groß ist sehr viel besser als klein Conjoint: Bringe in eine Reihenfolge: Kleines, rotes Auto Kleines, blaues Auto Großes, rotes Auto Großes, blaues Auto
Bewertung Nutzentheorie Anwendung: Finanzierungstheorie (Risikoneigung; optimales Wertpapierportfolio) Marktforschung Gesundheitsökonomik Praxis des kommerziellen Betriebes: kaum
Multi-Attributive-Decision-Support Entwicklung: jüngere Entscheidungstheorie Präferenzen sind nicht bekannt Präferenzen sind nicht stabil Anwender entscheidet Vorgehen: Entscheidungstheoretiker entwickeln Menge der Pareto-optimalen Lösungen (Ausschluss dominierter Lösungen) Entscheider erhält interaktives Werkzeug zur intuitiven Auswahl der Entscheidungsalternative Beispiel: Radiotherapieplanung
Radiotherapieplanung Ziele Maximale Bestrahlung des Krebses Minimale Bestrahlung des umliegenden Gewebes Minimale Bestrahlungsdauer Zielkonflikt: Aus physikalischen Gründen ist keine alle Ziele gleichermaßen befriedigende Lösung möglich Alternativen: Verschiedene Einstrahlwinkel Verschiedene Bestrahlungsdauern Verschiedene Bestrahlungsstärken
Radiotherapieplanung
Radiotherapieplanung: was muss geplant werden? medizinische Parameter Kurativdosis, Toleranzdosen Dosisfraktionierung physikalische Parameter Einstrahlgeometrie Intensitätsprofile
Radiotherapieplanung: traditionelles Vorgehen Radiologe „überlegte“ sich ein Bestrahlungsregime Problem: oftmals ineffiziente Lösungen formal: Verdichtung auf eine gewichtete Wertungsfunktion Abweichung von homogener Dosisverteilung im Zielvolumen
Radiotherapieplanung: traditionelles Vorgehen Radiologe „überlegte“ sich ein Bestrahlungsregime Problem: oftmals ineffiziente Lösungen formal: Verdichtung auf eine gewichtete Wertungsfunktion Abweichung von idealer kurativer Dosis
Radiotherapieplanung: traditionelles Vorgehen Radiologe „überlegte“ sich ein Bestrahlungsregime Problem: oftmals ineffiziente Lösungen formal: Verdichtung auf eine gewichtete Wertungsfunktion Risiken, Abweichung von idealen Toleranzen
Radiotherapieplanung: traditionelles Vorgehen Problem: Unnatürliche Gewichte wi müssen durch eine zeitaufwändige Suche- und Verwerfe-Strategie gefunden werden erlauben keine dynamische Planung erlauben nicht die Diskussion von Trade-offs zwischen den einzelnen Zielfunktionen Fi
Radiotherapieplanung: neuer Ansatz Definition: F = (FU , FL, F1 , F2 , ... , FK) heißt Pareto-optimal oder effizient, falls es keine Verbesserung eines F - Eintrags gibt ohne mindestens einen anderen zu verschlechtern
Radiotherapieplanung: Vorgehen Schritt 1: Ermittlung der effizienten Lösungen durch mathematische Optimierung
Radiotherapieplanung: Vorgehen Schritt 2: Speicherung der effizienten Lösungen in Datenbank
Radiotherapieplanung: Vorgehen Schritt 3: Interaktive Auswahl der Lösung aus der Menge der effizienten Lösungen, die dem Radiologen intuitiv am meisten zusagt
Radiotherapieplanung: Vorgehen Schritt 4: Ausgabe der technischen Werte (Einstrahlwinkel, Bestrahlungsdauer, Bestrahlungsstärken) der gewählten Lösung
Werkzeug Ausgangsbasis: maximale Krebsbestrahlung ist nur unter maximaler Bestrahlungsdauer und maximaler Umgebungsbestrahlung zu erreichen
Werkzeug Schritt 1: Radiologe fragt sich, auf wie viel Krebsbestrahlung er verzichten muss, wenn er die Umgebungs-bestrahlung auf 50 % reduziert.
Werkzeug
Schritt 2: Radiologe möchte Dauer noch etwas reduzieren. Werkzeug Schritt 2: Radiologe möchte Dauer noch etwas reduzieren.
Werkzeug
Werkzeug
Schritt 3: Krebsbestrahlung ist unverhältnismäßig gesunken. Erhöhung! Werkzeug Schritt 3: Krebsbestrahlung ist unverhältnismäßig gesunken. Erhöhung!
Werkzeug Krebsbestrahlung = 50; Umgebungsbestr. = 10; Dauer = 40; Radiologe ist zufrieden
Werkzeug Krebsbestrahlung = 50; Umgebungsbestr. = 10; Dauer = 40; Radiologe ist zufrieden
Simulation Datei: Radio-Therapy-Planning Folie 33 ff
3.4.3 Erwartungsnutzentheorie 3.4.3.1 Bernoulli-Prinzip Prinzip: Ein rationaler Entscheider orientiert sich am erwarteten Nutzen Beispiel: St. Petersburg Spiel Daniel Bernoulli (1738) Ein Spieler muss einen Einsatz A zahlen. Es wird eine Münze geworfen. Falls beim ersten Wurf „Zahl“ oben liegt, erhält er zwei Euro. Sonst geht das Spiel weiter Falls beim zweiten Wurf „Zahl“ oben liegt, erhält er vier Euro, sonst geht das Spiel weiter. … falls beim j-ten Wurf „Zahl“ oben liegt, erhält er 2j Euro, sonst geht das Spiel weiter. FRAGE: Wie viel ist ein Spieler bereit zu setzen?
St. Peterburg Spiel "Runden" Auszahlung Wahrschein- lichkeit p*e Kumuliert 1 2 0,5 4 0,25 3 8 0,125 16 0,0625 5 32 0,03125 6 64 0,015625 7 128 0,0078125 256 0,00390625 9 512 0,00195313 10 1024 0,00097656 j 2j 0,5j
St. Petersburg Paradoxon Der Erwartungswert des Gewinnes bei dem Spiel ist unendlich, d.h. man müsste einen sehr hohen Einsatz erwarten. Tatsächlich zeigt es sich, dass fast niemand bereit ist, mehr als 10 Euro zu setzen Folge: Nutzen unter Berücksichtigung des Verlustrisikos ist deutlich geringer als der erwartete Gewinn Erwartungsnutzen
Erwartungsnutzen Die Erwartungsnutzentheorie zieht den erwarteten Risikonutzen (kombinierte Höhen- und Risikopräferenz) zur Alternativenbeurteilung heran. Dies wird auch als Bernoulli-Prinzip bezeichnet
Erwartungsnutzen (Forts.) Definition des Erwartungsnutzens (parallel zum Ergebniserwartungswert):
3.4.3.2 Axiome und Relevanz Axiome vollständige Ordnung Stetigkeitsaxiom Unabhängigkeitsaxiom
Relevanz Das Bernoulli-Prinzip (sowie die gesamte Nutzentheorie) bildete eine theoretische Grundlage der betriebswirtschaftlichen Theorie Seine praktische Relevanz ist gering
Bounded Rationality Beobachtetes Verhalten weicht signifikant und systematisch von den Voraussagen der Erwartungsnutzentheorie ab In vielen Fällen behalten Personen ihr Verhalten auch dann noch bei, wenn man sie auf die Annahmenverletzung hinweist Beschränkte Rationalität berücksichtigt kognitive und emotionale Beschränkungen des Entscheidungsträgers (Herbert Simon) Bedeutung: Behavioral Finance
Entscheidungsanomalien Individuen sind nicht in der Lage, kleine Wahrscheinlichkeiten realistisch einzuschätzen Individuen gewichten sichere Gewinne weit höher als hohe Wahrscheinlichkeiten Individuen können Wahrscheinlichkeiten und Unsicherheit schlecht einschätzen Die Darstellung des Problems ist für die Handlungen relevant etc.
Dynamische Inkonsistenzen Grundmodell: exponentielle Diskontierung mit konstanter Zeitpräferenzrate impliziert Zeitkonsistenz Ct+1 U2 U1 Ct
Dynamische Inkonsistenzen Grundmodell: exponentielle Diskontierung mit konstanter Zeitpräferenzrate impliziert Zeitkonsistenz C(t+1)
Dynamische Inkonsistenzen Empirie: Menschen verhalten sich häufig zeitinkonsistent Präferenzwechsel in Abhängigkeit von der zeitlichen Distanz der Ereignisse Beispiel: impulsives Verhalten versus langfristige Pläne („Adam und Eva“) Formal: Annahme einer hyperbolischen Diskontierungsfunktion zeitabhängige Diskontierung