Freie Universität Berlin Institut für Informatik

Slides:

Advertisements

Ähnliche Präsentationen

Advertisements

Tipps & Tricks zu benutzerdefinierten Animationspfaden

Graphen- und spieltheoretische Untersuchung sowie ökonomische Experimente zum Verhalten von Verkehrsteilnehmern von Gerd Meinhold Betreuer: Prof. Dr. Bernd.

Seminar über Algorithmen

Andreas Kalender Institut für Informatik FU Berlin Seminar über Algorithmen Durchschnittsverzögerung.

Prinzipal-Agenten Beziehungen

HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik Algorithmische Probleme in Funknetzwerken IX Christian Schindelhauer

HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik Algorithmische Probleme in Funknetzwerken X Christian Schindelhauer

Anwendung und Visual Basic

FH-Hof Deadlocks Richard Göbel. FH-Hof Deadlock - Definition Menge von Prozessen ist an einem Deadlock beteiligt: wenn jeder Prozess in dieser Menge auf.

von Reaktionen und chemischen Suppen

Lernende Agenten Seminar Softwareagenten Wintersemester 2001/2002 Norman Neuhaus.

Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 16 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät.

Kapitel 5 Stetigkeit.

Projektgruppe SEROSE AG-Monien Selfish Routing in Sokoban Environments

Algorithmen des Internets 2005 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität 1 Materialien zu Übung 9 Bälle in Körbe Ranged.

+++ Abholzungsrate am Amazonas angestiegen +++

Situationen Verteilte Anwendungen Wintersemester 06/07 © Wolfgang Schönfeld.

Was sind Histogramme? (1)

Die Funktionsgleichung

Analyse eines Handballspielzuges

Folien zur Veranstaltung Einführung in die Systemwissenschaften Wichtig: Die Folien dienen nur zur Präsentation, sie enthalten nicht die vollständige Veranstaltung!

Prof. Dr. Gerhard Schmidt pres. by H.-J. Steffens Software Engineering SS 2009Folie 1 Objektmodellierung Objekte und Klassen Ein Objekt ist ein Exemplar.

Datenverteilung in Ad-hoc Netzen 1/24 Adaptive Datenverteilung in mobilen Ad-hoc Netzen unter Verwendung des Area Graph basierten Bewegungsmodells S. Bittner,

Klassische Entscheidungstheorie:

Endliche Automaten Informatik JgSt. 13, Abitur 2009

Effiziente Algorithmen

Chaos und Fraktale M. Bostelmann Michael Bostelmann.

Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.

Theorien, Methoden, Modelle und Praxis

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Spieltheorie O. Morgenstern J. von Neumann

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen

Hartmut Klauck Universität Frankfurt SS

Information und Kommunikation

Information und Kommunikation Hartmut Klauck Universität Frankfurt SS

Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/

Projektvortrag von Andreas Hapek

Christian Scheideler Institut für Informatik Universität Paderborn

Institut für Theoretische Informatik

Spieltheorie Mária Némethy.

Petrinetze 1. Einführung Informatik : wesentlich Modellierung von

Das Traveling Salesman Problem (TSP)

Lernmodelle und Experimentelle Untersuchungen

Vom graphischen Differenzieren

HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik Algorithmische Probleme in Funknetzwerken VIII Christian Schindelhauer

1 Slawa Belousow, Seminar über Algorithmen Load Balancing Slawa Belousow Freie Universität Berlin, Institut für Informatik.

1.1 Einführung und institutionelle Grundlagen  Wagenhofer/Ewert Alle Rechte.

Using Reflexive Behaviors of the Medicinal Leech to Study Information Processing William B. Kristan Jr., Sawn R. Lockery und John E. Lewis.

Der Wiener Prozess und seltene Ereignisse

Einführung Die nachfolgende Präsentation dient dem besseren Verständnis der taktischen Grundlagen bei Integration eines Läufersystem in den Spielablauf.

07b Mathematik Lösungen ZAP 2007.

09 Mathematik Lösungen ZAP 2007a.

Einige Elemente der Spieltheorie

MIKROSOZIOLOGISCHE THEORIEN SPIELTHEORIE

Vorlesung im Rahmen des Deutsch-Französischen Dozenten-Austauschprogramms „Minerve“ Dr. Matthias Hanauske Institut für Wirtschaftsinformatik Goethe-Universität.

Vorlesung im Rahmen des Deutsch-Französischen Dozenten-Austauschprogramms „Minerve“ Dr. Matthias Hanauske Institut für Wirtschaftsinformatik Goethe-Universität.

Verhandlungstechnik und alternative Streiterledigung, FS 2012 Dr. iur. Peter Liatowitsch Büttel Deborah, Giacometti Lorette, Herzog Julian, Hochstrasser.

C3: Strategische Interaktion und Anreize für nachhaltiges ökonomisches Handeln Page 1  Ziel: Untersuchung von Anreizproblemen, die nachhaltige Wertschöpfungsnetze.

Vorlesung im Rahmen des Deutsch-Französischen Dozenten-Austauschprogramms „Minerve“ Dr. Matthias Hanauske Institut für Wirtschaftsinformatik Goethe-Universität.

Physik der sozio-ökonomischen Systeme mit dem Computer

Präsentation transkript:

Freie Universität Berlin Institut für Informatik 26 August 2003 Seminar über Algorithmen Einführung in die Spieltheorie Wieland Rhenau Freie Universität Berlin, Institut für Informatik SS 2006 Wieland Rhenau, rhenau@inf.fu-berlin.de 1 prechelt@inf.fu-berlin.de

Inhalt Motivation der Spieltheorie Geschichtlicher Hintergrund Das „Nash Gleichgewicht“ Spiele, Strategien und Lösungen Spieltypen und Eigenschaften Ausblick Quellen Wieland Rhenau, rhenau@inf.fu-berlin.de 2

Motivation der Spieltheorie I Spieltheorie ist Teilgebiet der Mathematik Beschäftigt sich mit Gesellschafts-/Strategiespielen und Strategien der Spieler und Lösungen Allgemein: Interaktionssysteme mit mehreren Akteuren deren Strategien wirken sich auf andere Akteure aus Die Spieltheorie ist: Keine einzelne Theorie an sich Sammlung von Analysewerkzeugen (Algorithmen) Anwendungsgebiete: Informatik, Wirtschafts- und Sozialwissenschaften, Psychologie Wieland Rhenau, rhenau@inf.fu-berlin.de 3

Motivation der Spieltheorie II Relevant für die Informatik: Algorithmische Spieltheorie Interaktive Systeme wie Internet/dezentrale Netzwerke Akteure teilen sich Ressourcen Bsp: Netzwerkentwurf, Routing, Load Balancing… Ziel: Finden von Gleichgewicht(en) und dominanten Strategien Entwickeln von Strategien Optimale Lösung für alle Akteure Stauvermeidung Ressourcen sparen Wieland Rhenau, rhenau@inf.fu-berlin.de 4

Geschichtlicher Hintergrund Ursprung der Spieltheorie: John von Neumann 1928 Analyse von Gesellschaftsspielen  allgemeine Theorie zuvor von Anderen nur einzelne Aspekte betrachtet „Theory of Games and Economic Behavior” 1944 - Neumann und Oskar Morgenstern Beginn der modernen Spieltheorie Anfänglich auf wirtschaftliche Fragestellungen angewendet von Neumann [2] Morgenstern [3] Wieland Rhenau, rhenau@inf.fu-berlin.de 5

Das „Nash Gleichgewicht“ I John Forbes Nash Jr. Mathematiker, der Theorie von Morgenstern und Neumann erweiterte Resultat: Nash Equilibrium 1949 Nash Gleichgewicht (Equilibrium) Beschreibt Zustand, in dem kein Spieler einen Vorteil gegenüber den anderen erreicht, wenn er alleine seine Strategie ändert Nash hat dieses Gleichgewicht definiert und den Existenzbeweis erbracht Nash [4] Wieland Rhenau, rhenau@inf.fu-berlin.de 6

Das „Nash Gleichgewicht“ II Mathematische Darstellung eines Spiels in Normalform Ist Tripel G aus Menge von Spielern I wobei Σi ist Strategiemenge des Spielers i Strategieprofil Strategie des Spielers i ist beste Antwort auf Strategien aller Gegenspieler Und Auszahlungsfunktion Hi für jeden Spieler i, abhängig von seiner gewählten Strategie und der Strategie der anderen Spieler Es existiert kein Strategieprofil, welches eine höhere Auszahlung liefert Wieland Rhenau, rhenau@inf.fu-berlin.de 7

Das „Nash Gleichgewicht“ III Finden von Nash Gleichgewichten Einfacher Fall: 2 Spieler, Normalform(simultan) Matrix Darstellung möglich Algorithmus: Für alle Spieler i=1,…n werden die Auszahlungen resultierend aus der Strategie und der möglichen Strategien der anderen Spieler als Tupel dargestellt Das Auszahlungsoptimum wird für i=1,..n Spieler markiert Alle Felder, in denen alle Werte der Tupel markiert sind, sind „Nash Gleichgewichte“! Wieland Rhenau, rhenau@inf.fu-berlin.de 8

Spiele, Strategien und Lösungen I Spieltheorie schafft ein Modell für Interaktionssysteme System wird als Spiel betrachtet Spielt ist definiert durch: Wer sind Spieler (Entscheidungsträger)? Welche Strategien sind wählbar (Σi für alle i)? Welche Reihenfolge haben die Spielzüge? Was sind die Konsequenzen jeder Kombination an Entscheidungen aller Spieler (Hi für alle i)? Komplexe Spiele: Welche Informationen hat jeder Spieler über die Anderen? Welche Annahmen trifft jeder über die anderen? Ziel eines Spielers: Optimierung des Wertes der Auszahlungsfunktion Wieland Rhenau, rhenau@inf.fu-berlin.de 9

Spiele, Strategien Lösungen II Lösungskonzepte: Nach Definition des Spiels Ermittlung optimaler Strategien Berechnung: Ergebnis bei Verfolgung dieser Strategien durch alle Spieler Aktion==Handlung in bestimmter Situation Strategie== Funktion die Spielsituation eine Aktion zuweist Reine vs. Gemixte Strategien Reine Strategie Funktion die jeder Situation im Spiel genau eine Aktion zuteilt Gemixte Strategie Wahrscheinlichkeitsverteilung über gesamte Aktionsmenge, danach wird zufällig eine Aktion vom Spieler gewählt (Beispiel später) Wieland Rhenau, rhenau@inf.fu-berlin.de 10

Spiele, Strategien, Lösungen III Darstellungen eines Spiels Zwei Arten: Normalform und extensive Form Grundsätzlich alle Spiele in beiden darstellbar Normalform für einstufige Spiele Darstellung in Matrix mit Werten der Auszahlungsfunktion Spieler1 Zeilen – Spieler2 Spalten Wieland Rhenau, rhenau@inf.fu-berlin.de 11

Spiele, Strategien, Lösungen IV Extensive Form Sequenzielle Spiele Also mehrstufig (über mehrere Runden) Darstellung durch gerichtete Graphen Jeder Knoten ist Situation von dem Spieler ein Aktion durchführen, Pfeile sind Aktionen Jede Aktion führt zu neuer Spielsituation Letzter Knoten bedeutet Spielende „Spielbaum“ Wieland Rhenau, rhenau@inf.fu-berlin.de 12

Spiele, Strategien, Lösungen V Einmalige vs. Wiederholte Spiele Einmaliges Spiel „one-shot-game“ Eine Durchführung Danach Auszahlung Wiederholte Spiele Durchführung mehrmals hintereinander Auszahlungen werden summiert Strategisch relevant: Spieler kennen Rundenzahl? Ist Wiederholung unendlich  „Superspiel“ Wieland Rhenau, rhenau@inf.fu-berlin.de 13

Spiele, Strategien, Lösungen VI „kooperative“ vs. „nicht-kooperative“ Spieltheorie „kooperative Spieltheorie“ Spieler können (bindende) Verträge abschließen Handeln demnach nicht 100%-ig egoistisch „nicht-kooperative“ Spieltheorie Jeder Spieler sieht nur seinen eigenen Vorteil Bezogen auf Einsatz und Forschung relevanter Reale Probleme bieten oft keine Kooperation der Konkurrenten Wieland Rhenau, rhenau@inf.fu-berlin.de 14

Eigenschaften von Spielen Nullsummen-Eigenschaft Die Summe aller Auszahlungen ergibt 0 Was einer gewinnt, verliert der andere Perfekte Information Jedem Spieler ist in Entscheidungssituation bisheriger Spielablauf (Entscheidungen der Mitspieler) bekannt Beispiel: Schach Perfektes Erinnerungsvermögen Information aus vorherigen Entscheidungssituationen sind weiterhin bekannt Beispiel: Skat aus bereits gespielten Karten kann man Wahrscheinlichkeiten oder sichere Information gewinnen Wieland Rhenau, rhenau@inf.fu-berlin.de 15

Spieltypen I Einfaches Beispiel: „Goal-Kick“ -2x2 Matrix Ein Schütze, ein Torwart Vereinfacht: nach links/rechts schießen links/rechts springen Es existiert kein Nash-Gleichgewicht Der Verlierer kann immer Strategie ändern und damit gewinnen! Wieland Rhenau, rhenau@inf.fu-berlin.de 16

Spieltypen II Coordination Game (oder Kampf der Geschlechter,…) Zwei Personen wollen zusammen spielen Möglichkeiten: Fußball oder Tennis Beide wollen zusammen spielen Jeweils aber das andere Spiel Zwei Gleichgewichte entstehen, jedoch keines dominant Dominanz ein Gleichwicht bringt höhere Auszahlungswerte als ein anderes Wieland Rhenau, rhenau@inf.fu-berlin.de 17

Spieltypen III Spiel mit dem Untergang Zwei Autos fahren aufeinander zu Wer ausweicht ist der „Angsthase“ Zwei Nash Gleichgewichte in reiner Strategie: Fahrer1 ausweichen/Fahrer2 weiterfahren und Fahrer1 weiterfahren/Fahrer2 ausweichen Ein Nash Gleichgewicht in gemixten Strategien ausweichen/ausweichen Weil: beide weichen mit Wahrscheinlichkeit von ½ aus Wieland Rhenau, rhenau@inf.fu-berlin.de 18

Spieltypen IV Gefangenen Dilemma Zwei Gefangene werden verhört Haben keine Absprachemöglichkeit Ausgangspunkt ist rationales Verhalten beider Gestehen ist individuell immer besser Wenn ich gestehe komme ich frei wenn der andere schweigt Wenn ich gestehe 4 Jahre und nicht 5 wenn er gesteht Individuell: Gestehen immer besser jedoch nicht kollektiv  Nashgleichgewicht ist pareto-ineffizient Wieland Rhenau, rhenau@inf.fu-berlin.de 19

Preis der Anarchie Wiederholtes Spiel konvergiert gegen Nash-Gleichgewicht falls Akteure egoistisch falls selbe Rahmenbedingungen gelten Nash-Gleichgewicht nicht zwangsweise Optimum! jeder Spieler optimiert nur seine Auszahlung Es könnte auch uU. jeder einzelne besser sein wenn sie nicht im Nash-Gleichgewicht sind Gefangenen Dilemma als Beispiel Preis der Anarchie: Quotient aus der besten Lösung (Optimum) und dem Nash-Gleichgewicht Wieland Rhenau, rhenau@inf.fu-berlin.de 20

Braess Paradoxon I Braess Paradoxon (nach Dietrich Braess) Zusätzliche Handlungsalternative kann bei rationalem Verhalten Verschlechterung für alle bedeuten Ursprung in der Verkehrsplanung 1968 von Braess entwickelt Vier Städte sind durch Autobahnen/Landstraßen verbunden Auf Autobahnen ist man schneller als auf Landstraßen trotz kürzeren Strecken Alle wollen optimale Fahrzeit T= Fahrtzeit in min P= Verkehrsfluss (1000 Fahrzeuge pro Stunde) Gesamtmenge 6000 (Rechenbeispiel [2]) Wieland Rhenau, rhenau@inf.fu-berlin.de 21

Braess Paradoxon II T(Autobahn)= (50+P)min T(Landstraße)=(0+10P)min Mit Verkehrsdichte steigt die Fahrtdauer Jeder Fahrer (Pendler) fährt daher konstant Optimale Verteilung: jeweils die Hälfte der 6000 Fährt Route ABD und die anderen 3000 fahren ACD Fahrzeit für alle Fahrer von: (50+3)min+(0+30)min= 83min Damit ist die Strecken optimal ausgelastet und die Fahrzeit ist für alle im Gleichgewicht Wieland Rhenau, rhenau@inf.fu-berlin.de 22

Braess Paradoxon III Bau einer Verbindungsstraße Überwindet Hindernis Sehr kurze Strecke mit T(10+P)min Gleichgewicht aller Fahrtdauern: 2.000 Fahrer wählen die Strecke ABD 2.000 Fahrer wählen die Strecke ACD 2.000 Fahrer wählen die Strecke ABCD Dauer für alle: 92min! Landstraßen werden mehr genutzt höhere Fahrtdauer auf AB und CD Wieland Rhenau, rhenau@inf.fu-berlin.de 23

Braess Paradoxon IV Fahrtdauern im Nash Gleichgewicht  ändert ein Fahrer die Route, braucht er selbst länger Fahrer seiner alten Route weniger Zeit nicht das Ziel eines einzelnen Beispiel für Änderungen: 3.000 Fahrer ABD=93min 2.000 Fahrer ACD=82min 1.000 Fahrer ABCD=81min Fahrt dauert 1min länger Würde kein Fahrer machen FAZIT: egoistisches Handeln des Einzelnen ergibt insgesamt ein suboptimales Gleichgewicht für alle Streckenneubau nutzlos! Wieland Rhenau, rhenau@inf.fu-berlin.de 24

Diskretes (atomares) Load Balancing Game I n Benutzer wollen Jobs durchführen m Rechner stehen zur Verfügung Jeder Benutzer möchte einen Job dauerhaft von einer Maschine durchführen lassen (also nicht Round Robin) pi ist die „Jobgröße“ vom Benutzer i Menge der Rechner A ist die Zuweisung eines Jobs pi auf einen Rechner j L ist die Gesamtlast eines Rechners j Wieland Rhenau, rhenau@inf.fu-berlin.de 25

Diskretes (atomares) Load Balancing Game II Da jeder Nutzer egoistisch ist, kann die Spieltheorie eingesetzt werden Beispiel: 4 Benutzer und 3 Rechner Antwortzeit ist rj(L) die Jobgrößen seien (pi =1 für i=1,2,3,4) Lasten: Rechner1=2, Rechner2=1 Rechner3=1 ri(L) = iL Antwortzeiten sind: Rechner1+Rechner2 = 2 Rechner3 = 3 Wieland Rhenau, rhenau@inf.fu-berlin.de 26

Diskretes (atomares) Load Balancing Game III Formulierung des Nash Gleichgewichts Eine ausführbare Zuweisung A ist ein Nash Gleichgewicht, wenn kein Benutzer i das einseitige Bedürfnis hat, seinen Job auf einem anderen Rechner zuzuweisen. und für alle Einfaches Beispiel mit 2 Benutzern und 2 Rechnern p1 = p2 =1 und S1 = S2 = {1,2} Beide Jobs gleich groß und beide Benutzer können auf beide Maschinen zugreifen r1(L) =2 und r2(L) =L Rechner1 hat konstante Antwortzeit Rechner2 hat Antwortzeit = linear zur Last Wieland Rhenau, rhenau@inf.fu-berlin.de 27

Diskretes (atomares) Load Balancing Game IV 4 mögliche Zuweisungen {(1,1),(2,1)} ist nicht im Gleichgewicht Die anderen 3 Möglichkeiten stellen alle ein Nash Gleichgewicht dar Wieland Rhenau, rhenau@inf.fu-berlin.de 28

Diskretes (atomares) Load Balancing Game V Jedes diskrete Load Balancing Game hat ein Nash Gleichgewicht Man beginnt mit irgendeiner Zuweisung Alle Spieler wechseln gleichzeitig die Rechner, wenn sie unzufrieden sind Findet man eine Funktion, (Zuweisung ist Argument) deren Wert sich verringert mit jedem Wechsel, wird der Vorgang des Wechselns irgendwann terminieren, weil kein Spieler mehr in eine für ihn bessere Situation kommen kann. Wieland Rhenau, rhenau@inf.fu-berlin.de 29

By the Way Es gibt keinen Nobelpreis für Mathematik Bisher 6 Wirtschaftsnobelpreise für spieltheoretische Arbeiten: 1994 an John Forbes Nash Jr., John Harsanyi und Reinhard Selten 1996 an William Vickrey 2005 an Robert Aumann und Thomas Schelling Wieland Rhenau, rhenau@inf.fu-berlin.de 30

Ausblick Anwendungen Informatik: Anwendungen Wirtschaft: Entwicklung von Routingverfahren in dezentralen Netzwerken/ ad hoc Netzwerken (Sensornetze) Lösungen für Load Balancing bei knappen Ressourcen Anwendungen Wirtschaft: u.a. Konzeptionen von Versteigerungen, z.B. von Rundfunk- und Mobilfunklizenzen Duopolisten teilen Marktsegmente Spieltheorie im Alltag: Filme: „A beautiful Mind“ (angelehnt an Nash), Π, Memento… Tools zum „Finden“ von Gleichgewichten und dominanten Strategien bei http://www.gametheory.net Wieland Rhenau, rhenau@inf.fu-berlin.de 31

Quellen [1] http://www.cs.cornell.edu/courses/cs684/2005fa/ [2] http://de.wikipedia.org/wiki/John_von_Neumann [3] http://www.gametheory.net/dictionary/People/OskarMorgenstern.html [4] http://nobelprize.org/economics/laureates/1994/nash-autobio.html [5] http://www.gametheorie.net [5] http://de.wikipedia.org/wiki/Spieltheorie [6] Osborne & Rubenstein „A Course in Game Theory“, 1994 [7] Garing, Lücking, Monien, Tieman „Nash Equilibria, the Price of Anarchy and the Fully Mixed Nash equilibrium Conjecture“ University of Paderborn Wieland Rhenau, rhenau@inf.fu-berlin.de 32

Danke!!! Fragen?!?! Wieland Rhenau, rhenau@inf.fu-berlin.de 33