Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Künstliche Gesellschaften und individuelles Sozialverhalten

Ähnliche Präsentationen


Präsentation zum Thema: "Künstliche Gesellschaften und individuelles Sozialverhalten"—  Präsentation transkript:

1 Künstliche Gesellschaften und individuelles Sozialverhalten
Soziale Simulationen Künstliche Gesellschaften und individuelles Sozialverhalten Matthias Schmitt

2 Was sind soziale Simulationen?
Sozialwissenschaft Informatik Soziale Simulationen & künstliche Gesellschaften Ökonomie Psychologie Man sieht: wir betrachten jetzt die höchsten Organisationsformen des Lebens; hier wird etwas qualitativ etwas ganz Neues erforscht (allerdings mit ganz ähnlichen Methoden); ansonsten tauchen im Seminar hauptsächlich primitive Lebensformen auf.

3 Interessante Fragestellungen
Gesellschaften Computer Warum entsteht soziales Verhalten in Gruppen? Was ist die Voraussetzung dafür? Wie wirken bestehende Normen? soziale Simulationen Individuen Zunächst wollen wir uns dem linken Teil zuwenden und verschiedene Aspekte des Sozialen untersuchen. Das iterierte Gefangenendilemma und Axelrod‘s spieltheoretische Ansätze geben uns Aufschluss über die rechte Seite: das Verhältnis Mensch-Maschine und Strategiesimulationen Danach und zuletzt: PSI, ein durch Emotionen lernfähiger Roboter, der einen völlig anderen Ansatz als die üblichen Agenten (Neuro-Netz, KI, Klassen-Regel-basiert) zur Handlungssteuerung benutzt (nicht direkt Themenbezogen, daher optional) Menschen Warum ist der einzelne sozial? Wie entsteht Kooperation?

4 Interessante Fragen II
Entstehung und Verbreitung von Normen, Allianzen, Kooperationen, Gruppenbildung und –dynamik Kommunikation und Sprache, soziale Interaktion, Kultur Institutionen und Politik, Ökonomische Fragestellungen Die linke Seite: das Soziale

5 Übersicht Soziale Simulationen mit zellulären Automaten
Untersuchung von Normen unter diversen Aspekten Soziales Lernen Spielstrategien und –theorie Emotionale Agenten Worum soll es konkret gehen? Vorstellung eines Simulationsprinzips/einer Simulationsmethode an verschiedenen Beispielen Vorstellung eines sozialen/soziologischen Begriffs unter diversen Aspekten Vorstellung des sozialen Lernens als explizites Beispiel für Emergenz von Kommunikation; Untersuchung der Rolle der Umwelt für den Prozess der Interagentenkommunikation

6 Soziale Simulationen und zelluläre Automaten
Segregation als makroskopischer Effekt bei mikroskopischer Veränderung Migration, Kultur, Krieg, Handel Entstehung und Wirkung von Normen Weil das Thema also offenbar zu umfangreich ist, habe ich folgende konkrete Schwerpunkte gesetzt...

7 Die Schelling-Simulation
Primitiver zellulärer Automat Fragestellung: Entstehung von Segregation in nicht-rassistischen Gesellschaften Manche Segregation ist organisiert, andere entsteht nur aus individuellen Präferenzen und daraus resultierenden Aktivitäten. Schelling hat 1971 mit Hilfe eines Zellularautomaten untersucht, wie solche Vorlieben zu Segregation führen können. Beispiel: Ansammlung von College-Professoren in Bosten zeigt, dass Segregation häufig eher Kongregation ist, obwohl das Ergebnis nicht von negativen Intentionen unterschieden werden kann.

8 Modell Zwei antagonistische Typen von Agenten können sich bewegen
Eine Gefühlsregel implementiert eine lokal begrenzte Fitness-Funktion, die dem Agenten eine Präferenz für die nächste Bewegung eingibt.

9 Regeln Ist ein Bürger unglücklich aufgrund seiner Nachbarn, so wandert er auf ein angrenzendes Feld mit besseren Bedingungen Wie empfindlich ein Bürger auf die „falschen“ Nachbarn reagiert, kann als Parameter e gewählt werden Die falschen Nachbarn können durch „gute“ wieder ausgeglichen werden; e ergibt sich also aus dem Verhältnis der Anzahlen auf den angrenzenden Feldern

10 Fragen Wie hängt die Empfindlichkeit eines Bürgers von der Neigung des Systems zur Clusterbildung ab?

11 Ergebnisse Das makroskopische Ergebnis (Segregation) ist in den überwiegenden Fällen unabhängig von der Empfindlichkeit der Bürger obwohl Bürger auch durch „komplexe“ Musterbildung zufriedengestellt werden könnten, bilden sich grosse, simple Anhäufungen von gleichartigen Individuen Dabei ist zu beobachten, dass beispielsweise bei einer Präferenz von 55% in den resultierenden Clustern eine Majorität von ca. 80% besteht (linearer 1D-Automat), wenn die Gruppen genau gleich stark sind. Extrem primitiver Automat zeigt emergentes Verhalten, das auf reale Situationen bezogen werden kann (Bsp.: erste Einwanderer in Amerika) 55% bedeutet, dieser Prozentsatz muss mir ähneln, um mich nicht zu vertreiben. Allerdings nimmt mit kleiner werdender Anzahl einer Gruppe (also ungleich verteilten Gewichten) die Grösse der Cluster der Majorität automatisch (!) zu. Die Anzahl der Cluster der Minorität nimmt überproportional ab, da die Wahrscheinlichkeit, die richtigen Nachbarn zu finden überproportional fällt.

12 Das Sugarscape-Modell
Vielfältig einsetzbarer zellulärer Automat Simulation einer Population in einer künstlichen Umwelt, die durch Regelwerk repräsentiert wird Primitive, regelbasierte Agentenreaktionen erzeugen komplexe Strukturen (Emergenz) Fragestellungen: Migration Fortpflanzung Kultur Aggression Eigentumsnorm Handel Krankheit

13 Modell Agenten bewegen sich in einer Landschaft, die eine oder mehrere begrenzte, nachwachsende Ressource(n) bereitstellt Agenten sind ausgezeichnet durch ihre Sichtweite und ihren Verdauungszyklus Untereinander können sie Verhaltensregeln („Meme“) oder Ressourcen austauschen

14 Leben in Sugarscape Landschaft: Torus von 50 x 50 Feldern (periodic boundary) mit Von-Neumann-Nachbarschaft Verschiedenen Regionen mit unterschiedlicher Zuckermenge Standardregel - G a (G für growth): in jeder Stelle regeneriert sich der Zucker mit einer Rate a pro Zeiteinheit bis zur maximalen lokalen Menge Agenten sind am Anfang mit Zucker „ausgestattet“ Zucker der nicht gegessen wurde, wird als Vermögen bezeichnet (bei Vermögen gibt es keine Begrenzung und wird von der Zeit nicht beeinflusst) Wenn ein Agent kein Zucker mehr besitzt, stirbt er und wird von Sugarscape entfernt Die Agenten haben ein endliches Dasein und ihnen ist ein Geschlecht zugewiesen Tragfähigkeit: Die Umwelt kann nicht beliebig viele Agenten ernähren

15 Beispiel-Simulationszyklus
Bewegungsregel (M) Fortpflanzungsregel (S) Kulturübertragungs- regel (K) Kampfregeln (Ca) Handelsregeln (T) Jahreszeitenregeln (Se) ... Wachstumsregel (G)

16 Grundlegende Regel-Beispiele
(M) Schau dich soweit wie möglich um und finde die nächste leere Zelle mit max. Zucker. Gehe dorthin. Nimm allen Zucker. (S) Falls im fruchtbaren Alter und beide Partner genügend Zucker besitzen, wird ein Nachkomme erzeugt. Als Partner dienen alle Nachbarn, die den Bedingungen genügen. Erbschaftsregeln können (K) Im Gegensatz zur genetischen Ausprägung können die Kulturtags während der Lebensspanne des Agenten geändert werden: Für jeden Nachbarn wird zufällig ein Kulturtag ausgewählt und angeglichen. Man kann die Population in Völker einteilen, indem man bestimmte Übereinstimmungen in der Kultur zusammenfasst. Eltern vererben ihre kulturellen Traditionen; bei unterschiedlicher „Meinung“ entscheidet der Zufall. (G) Regenerationsregel, die den Zucker wachsen lässt. Im „Winter“ wächst der Zucker langsamer als im Sommer, die Jahreszeiten lassen sich auch lokal auf der Sugarscape-Welt einstellen, wodurch Migrationsverhalten erzeugt werden kann. Dies sind nur die wichtigsten Regeln, man kann sich nahezu beliebige Regelwerke ausdenken.

17 Exkurs: Meme (Dawkins)
„emanzipierte“ Informationseinheiten Gedanke oder „Idee“, Verhalten, Kulturtechniken => „Kulturtags“ Mutation während der Fortpflanzung möglich

18 Fragen Wie wirken sich Beweglichkeit, Zuckerverteilung, verschiedene Metabolismen oder Jahreszeiten aus? (Migration) Wie wirken sich verschiedene Kulturübertragungsregeln aus? (Kultur) Wie wirken sich Handelsbeziehungen aus? (Handel) Unter welchen Umweltbedingungen entsteht eine Eigentumsnorm? (Sozialverhalten)

19 Migration in Sugarscape
Agenten konzentrieren sich auf die Orte höchster Zuckerkonzentration Durch Jahreszeiten kann ein Zugvogelverhalten oder ein „Winterschlaf“ erzeugt werden Besonders günstig: natürlich niedriger Metabolismus und hoher Sichtradius

20 Kultur in Sugarscape Führt man eine kulturelle Zugehörigkeit ein, so nehmen entweder langfristig alle die gleiche Kultur an, oder es entstehen „Stämme“ Dieser Zustand ist dann ein Gleichgewichtszustand Je länger der kulturelle Code ist, desto länger dauert es bis zum equilibrierten System

21 Handel auf Sugarscape Es wird eine zweite Ressource eingefügt, z.B. Gewürz und jeder Agent erhält ein Bedürfnis (Metabolismusraten SZ und SG) nach dieser Ressource Dieses Bedürfnis hat je nach seiner Wichtigkeit Auswirkung auf das Verhalten des Agenten: Relative Wichtigkeit, G zu finden: Hier kommt jetzt ein primitiver ökonomischer Aspekt ins Spiel: neoklassische Wirtschaftstheorie vom Marktgleichgewicht kann untersucht werden.

22 Handel auf Sugarscape II
Neue Bewegungsregel: schaue dich soweit wie möglich um und bestimme das Feld, das den meisten Profit verspricht. Gehe dorthin und sammle die entsprechende Ressource. Ergebnis: Pendelbewegung zwischen den Bergen und Erschöpfungstod

23 Handel auf Sugarscape III
„... We can imagine consumers wandering around a large market square with all their possessions on their backs. They have chance meeting each other, and when two consumers meet, they examine what each has to offer to see if they can arrange a mutually agreeable trade...“ (Kreps, 1990, zitiert nach Ernst) Wann und mit wem werden die Agenten handeln? Wie wird der Preis bestimmt? Wie groß wird das Handelsvolumen sein?

24 Handelsregeln Bedürfnis w: Mangel an Zucker:
Treffen zwei Agenten aufeinander, berechnen sie ihr w wahrheitsgemäß und die folgende Tabelle gibt Aufschluss über ihre Handelsverhalten (wA = wB => kein Handel): Mit jedem Handel nähern sich beide w an; der Wohlstand steigt. Handel wird auch stattfinden, wenn es beiden Akteuren an derselben Ressource mangelt; der Agent mit dem relativ geringeren Mangel wird durch Bestpreise belohnt wA > wB wA < wB Aktion A B Kaufen Zucker Gewürz Verkaufen

25 Preisbestimmung Damit beide profitieren, muss der Preis im Intervall wA ... wB liegen. Um Zucker zu erhalten, ist A also nicht zu jeden Preis bereit; der max. Preis ist wA. Alle Preise in diesem Intervall wären akzeptabel, aber je näher der Preis an einem Ende liegt, desto unfairer der Handel. Preis: p > 1: p Einheiten G pro Einheit Z p < 1: 1/p Einheiten Z pro Einheit G

26 Handel: Forschungsfragen
Entwicklung der Preise und des Handelsvolumens? Individueller Profit und gesellschaftlicher Profit? Was passiert bei Auflockerung der neoklassischen Annahmen von ewigem Leben konstanten Präferenzen und vollständiger Information Treten die Marktergebnisse der klassischen Theorie ein? Stellt sich eine pareto-optimale Verteilung ein? Erreichen Markt und Preis allg. Gleichgewicht? Pareto-optimal: kein weiterer Handel kann stattfinden, ohne einen Akteur schlechter zu stellen

27 Ergebnisse bei klassischen Agenten
Anfängliche Preisvarianz nimmt ab; der Preis konvergiert Große Schwankungen im Handelsvolumen Bevölkerungskapazität des Systems wird verbessert Ein wirtschaftliches Gleichgewicht entsteht „from bottom up“ Aber: das theoretische Handelsvolumen wird nie erreicht und das Gleichgewicht ist nur bzgl. der nächsten Nachbarn optimal. Ausserdem: Das zu erreichende Gleichgewicht wird durch die Aktivität der Agenten ständig verändert.

28 Handel unter dem Gesetz R(60,100)
Ein Agent hat keine konstanten Präferenzen mehr, scheidet nach einer festgelegten Zeit aus und wird durch einen randomisierten Akteur ersetzt Folge: Entfernung von jeglichem Gleichgewicht Weitere Variante: Hinzunahme von S und evolutionäre Änderung von Sichtweite und Metabolismus Folge: wie in R(60,100) Was ist R(60,100)? => Agent wird zwischen 60 und 100 „Jahre“ alt.

29 Handel und Kultur Änderung von Präferenzen durch den Kontakt mit anderen Akteuren – Durch jeden Kontakt mit einem anderen Akteure kann sich der Bedarf (=Stoffwechsel) an Z und G verschieben. Folge: Eine enorme Preisschwankung und eine konstant hohe Standardabweichung Wohlstandsverteilung – Handel verschärft das Wohlstandsgefälle. Im Gegensatz zu einem allgemeinen Gleichgewicht resultiert dieses nicht allein aus den Unterschieden der ursprünglichen Ausstattung, sondern auch aus der lokalen Preisheterogenität Veränderung des neoklassischen Modells zugunsten einer realitätsnäheren Simulation zeigen eine dramatische Entfernung der Lehrbuchmeinung über allgemeines Marktverhalten

30 Normemergenz auf Sugarscape
Einführung eines „Eigentums-Mems“, welches das Agentenverhalten beeinflusst. Ist es im kulturellen Code aktiv, so Wird der Agent Felder, auf die er kommt, als sein Eigentum markieren Keinen fremden Zucker aus anderweitig markierten Zellen nehmen Optional (nicht in Originalarbeit): der Agent wird eine leichte Präferenz für eigene Felder haben Der Nachwuchs erhält die Mem-Ausstattung der Eltern Einführung eines „Sanktionierungs-Mems“, dass den Agenten dazu veranlasst, alle eventuellen Diebstähle (auch die bei fremdem Eigentum) innerhalb seiner Sichtweite unter Einsatz einer gewissen Zuckermenge seines eigenen Vorrats zu bestrafen. Wir wenden uns von der Ökonomie ab und konzentrieren uns nun auf einen zentralen soziologischen Begriff. Die Entstehung und Wirkung von Normen soll jetzt zunächst am Bsp. Sugarscape, später auch am Beispiel von anderen Modellen und Algorithmen untersucht werden.

31 Normemergenz auf Sugarscape II
Startbedingung: Ohne Sanktionierungsmöglichkeit 50% der Bevölkerung hat Eigentums-Mem Mem-Übertragungswahrscheinlichkeit 1/11 Ergebnis: die Populationen sterben aus, sobald das Mem verschwunden ist: Agenten ohne Mem sind zu arm, um sich zu paaren. Populationen mit Mem am Start leben etwas länger als solche völlig ohne Mem D.h. der Grund des Aussterbens ist die Unfähigkeit des Mems, sich durchzusetzen

32 Normemergenz auf Sugarscape III
Startbedingung: Sanktionierungsmöglichkeit 50% der Bevölkerung hat Eigentums-Mem Sanktionierung kostet den Strafenden Ergebnis: das Eigentums-Mem hat weiterhin Schwierigkeiten, sich zu etablieren Grund: es besteht ein Trittbrettfahrerproblem; das Sanktionierungsmem erweist sich als Nachteil und stirbt aus

33 Normemergenz auf Sugarscape IV
Startbedingung: Kostenfreie Sanktionierungsmöglichkeit 50% der Bevölkerung hat Eigentums-Mem Ergebnis: das Eigentums-Mem bleibt erhalten und sorgt für ein dauerhaftes Überleben der Population auch bei hohen Verdauungsraten

34 Normemergenz auf Sugarscape V
Ergebnisse: Die Durchsetzung einer Norm erfordert „billige“ Sanktionierungsmöglichkeiten Andernfalls besteht das Trittbrettfahrerproblem, dass Normemergenz verhindert. Populationen ohne Eigentumsnorm sterben aus, wenn ihre Umweltbedingungen und ihre Metabolismen nicht optimal sind. Adam Smith: Das glück des einzelnen ist das glück aller (falsch?)

35 Normen: Entstehen und Wirkung
Zusammenfassung: Normen können als emergentes Verhalten in Sugarscape simuliert werden. Zellularautomaten sind mächtige Werkzeuge zur Untersuchung von Artificial Societies Jetzt: Normen als Regelsysteme Andere Normerzeugungsmechanismen in verschiedenen Simulationssystemen und Modellen Wir haben gesehen, wie auf Sugarscape durch Regelwerke Normen als emergentes Verhalten auftreten können. Nun untersuchen wir den Begriff der Norm und untersuchen, wie sich eine gegebene Norm auf eine Gesellschaft auswirkt. Nachdem wir also ein Simulationsparadigma mit verschiedenen soziologischen Begriffen konfrontiert haben, untersuchen wir jetzt einen Begriff bei der Anwendung auf verschiedene Simulationsalgorithmen und Modelle.

36 Vorgegebene Normen Castelfranchi et al.: Norm zur Aggressionskontrolle in einem zellulären Automat, dessen Agenten Stärke besitzen, die abhängig von ihrer Nahrungsaufnahme ist und die bestimmte Felder als Eigentum markieren können. Die Nahrung erscheint zufällig auf den Feldern Blind, Strategisch, oder Nonaggression als Agentenverhalten implementiert. Attacken kosten den Angreifer und den Verteidiger gleichermaßen Stärke. Die Nahrungsaufnahme benötigt mehrere Taktzyklen, in dieser Zeit kann der essende Agent in den ersten beiden Fällen angegriffen werden; der Stärkere gewinnt, reisst dem schwachen das Futter weg und kann selbst den Essvorgang beginnen. Nonaggression bedeutet, dass kein Angriff gegen einen Agenten erfolgen darf, der auf seinem eigenen Feld isst.

37 Vorgegebene Normen II Ergebnis: Normen können Aggression beschränken
Normen haben einen positiven Effekt auf die durchschnittliche Stärke eines Agenten, mindestens genauso effektiv ist wie strategische Aggression Bei strategischer Aggression erleiden die schwachen Agenten einen Nachteil, weil sie die Hauptlast der Aggressionskontrolle tragen (die Starken werden ja nie attackiert) Normen haben Auswirkungen auf den Anteil des Agenten am gesamten Nahrungsvorkommen, weil sowohl vorteilhafte wie unvorteilhafte Attacken unterbunden werden und so die Kosten für die Aggressionskontrolle gleichmäßiger verteilt werden

38 Normentstehung in anderen Modellen
Können egoistische Agenten Normen erlernen? Antwort Flentge: „Ja, solange billige Sanktionsmöglichkeiten bestehen“ Antwort Dawkin: „Ja, solange sie die gleichen Gene haben“ Antwort Axelrod: „Ja, wenn die gleichen Agenten mehrfach aufeinander stossen“ Antwort Ito: „Ja, wenn das Wissen über das Verhalten des Einzelnen jedem zugänglich ist“ Antwort Dörner: „Ja, wenn sie ein emotionales Bedürfnis danach haben“ „How do selfish agents learn to cooperate“? Dawkin: hier nicht weiter erwähnt Axelrod: Gefangenendilemma Flentge: cellular automaton Ito: Gefangenendilemma

39 Normverbreitung in anderen Algorithmen
Die Durchsetzung einer Norm hängt in der Realität stark von der Interaktion zwischen den Spielern ab, die bisher vernachlässigt wurde. Interaktion bzw. Kommunikation wird in drei Formen modelliert: Zellularautomat Netzwerk mit power-law Verhalten Zufallsgraph mit poissonverteilten Verbindungen Fragestellung: MDT, Einfluss der Lernalgorithmen, Einfluss der Konnektivität Hier kommt der Lernaspekt ins Spiel, den wir im Bereich „Soziales Lernen“ ausbauen. Wir schlagen also den Bogen vom soziologischen Begriff Norm zum Lernbegriff, der unter einer völlig anderen Methode (Neuronales Netz) untersucht werden soll. MDT = „Mean Dominance Time“

40 Power-law-Netzwerk Eine kleine Anzahl Agenten hat eine weit überdurchschnittliche Anzahl von Sozialkontakten Ausgehend von einer kleinen Anzahl Kontakte werden in jedem Zeitschritt weitere Verbindungen geschaffen, wobei Andockstellen bevorzugt werden, die bereits von vielen Verbindungen angelaufen werden. Normkodierung wie bisher (Bitmuster)

41 Zufallsgraph Jeder Agent hat eine fixe Anzahl Verbindungen, die Verbindungen sind poissonverteilt. Bei kleiner mittlerer Verbindungszahl existieren isolierte Agenten. Bei beiden Modellen interagiert jeweils ein zufällig gewählter Akteur via einer seiner Verbindungen wie folgt: Imitation: mit einer gewissen Wahrscheinlichkeit wird das Gegenüber die Normcodierung übernehmen (oder umgekehrt), wobei die Wahrscheinlichkeit dafür von der Hamming-Distanz der Normen abhängen kann. Individuell: ein Agent kann mit einer gewissen Wahrscheinlicheit seine eigene Meinung bilden (zufällig).

42 Ergebnis Ohne individuelles Lernen setzt sich in allen Interaktionsmodellen eine Norm durch Individuelles Lernen fördert die Koexistenz zweier verschiedener Normen Die MDT für den Zufallsgraphen ist im allgemeinen deutlich größer als für das PL-Netz (Spezialfall: durchschnittliche Konnektivität ist 1); Grund: Die Pfadlänge ist im PL-Netz kürzer. Nähert sich die Konnektivität einem kritischen Bereich, so konvergieren Randomnet und Powernet gegen eine gemeinsame MDT. Die MDT hat ein Minimum zwischen den Bereichen extrem weniger und extrem starker Interaktion. Ergebnis: die Verbreitung von Normen ist nahezu unabhängig vom Aufbau des Netzwerks (Sonderfälle ausgenommen, siehe Publikation), lediglich die Zeit, die eine Norm zu ihrer Durchsetzung benötigt, hängt vom Aufbau ab. Weiterhin ermöglicht das „selbstständige Denken“, d.h. in diesem Falle die zufällige Mutation des kulturellen Codes eine Koexistenz, ohne diese setzt sich stets eine Norm durch.

43 Soziales Lernen Biologische Evolution, individuelles Lernen und kulturelle Evolution sind Wege, das gleiche Problem zu lösen: Koordination zwischen Agenteninterner und der Umweltstruktur zu erreichen. Sie sind allerdings unterschiedlich schnell. Gibt man einer Population die Möglichkeit der Umweltveränderung, so können auch komplexe Prozesse, die vom Individuum innerhalb seiner Lebensspanne nicht gelernt werden können, von der Gesellschaft adaptiert werden. Kultur involviert die Fähigkeit, Repräsentationen der Umwelt zu erschaffen und so Informationen schneller und sicherer weiterzugeben. Fragestellung: Erlernen einer Mondphasenvorhersage in einer Gesellschaft Wir benutzen jetzt die vorangegangene Methodenanalyse, um das Problem des Lernens in künstlichen Gesellschaften anzugehen; im folgenden ist ein Agent ein neuronales Netz Indianer an der Küste Kaliforniens: wann sollte der ganze Stamm zum Meer gehen (Flut) und wann sollte man im Landesinneren jagen (Ebbe)

44 Relation zwischen den Strukturen und ihre Möglichkeiten
Umweltstruktur 1. Direktes Lernen durch Umweltbeobachtung 2. Erlernen einer Sprache, um die Relation zwischen Umwelt- und Kulturstruktur zu beschreiben Interne Struktur Kulturelle Struktur 3. Vermitteltes Lernen durch Betrachtung der kulturellen Struktur

45 Simulation: Agenten Die Bewohner sind durch neuronale Netze repräsentiert, deren Input sowohl künstliche als auch natürliche Muster sein können Ein Zyklus: jeder lernt so gut er kann (aus allen Bereichen: Umwelt und Kultur), erzeugt ein Artefakt, erzeugt einen Nachkommen und stirbt. Es findet keine „genetische“ Informationsübertragung statt. Jeder Nachkomme bekommt ein randomisiertes Startnetz. Welches Artefakt als Studienobjekt benutzt wird, kann parametrisiert werden (auf „Erfolgsbasis“ der letzten Generation oder per Zufall)

46 Simulation II: Umwelt Die zu erlernende Regel ist ein simples XOR. Ein perfektes Artefakt sähe daher so aus: Jede Ziffer kann mit reellen Zahlen von 0..1 belegt sein; die Tabellen sind prototypisch Mondstatus Tidenstatus Neumond 1000 01 Erstes Viertel 0100 10 Vollmond 0010 Drittes Viertel 0001 Mond Tide N 00 E 10 1 V 11 D 01 Symbolische Repräsentation (Agenten-Intern) Physikalische Repräsentation

47 Aufbau eines Agenten Mond-Beschreibungsnetz Tiden-Beschreibungsnetz
Symbolisch Symbolisch Input des Artefakts, Mond-Anteil Input des Artefakts, Tiden-Anteil Aktuator Input durch Beobachtung, Mond-Anteil Erfahrung Erfahrung Input durch Erfahrung, Tiden-Anteil Artefakt Die Beschreibungs- oder „Sprachnetze“ ermöglichen ein Mapping zwischen Symbolischer Repräsentation und physikalischer Wirklichkeit. Durch Verknüpfung der beiden Informationsanteile kann das Sprachnetz nach dem Training Eine symbolische Repräsentanz erzeugen (aus Erfahrung eines Ereignisses) Eine Erfahrung des Ereignisses durch symbolische Repräsentanten erzeugen. „Pattern completion“ Jeder Agent besitzt daher 2 Sprachnetze zur Kodierung der Mondphasen und der zugehörigen Tiden.

48 Der Lernprozess Die Agentennetze werden in einem bestimmten Verhältnis von direkter und vermittelter Beobachtung trainiert. Das Lernen von Artefakten wird bevorzugt, weil die natürliche Beobachtung sehr lange dauert. Was im Modell fehlt: Umwelt-Noise. Noise wird nur durch die Language und die Artefakte selbst erzeugt.

49 Ergebnis Der Lernprozess verläuft sehr langsam, falls keine Präferenz der Nachkommen für die Nutzung von Artefakten „kompetenter“ Eltern besteht Mit einer solchen Vorliebe lernt die Gesellschaft in einer absehbaren Anzahl von Generationen, sehr gute Artefakte herzustellen und die durchschnittliche Kompetenz steigt stark an, obgleich die Lernfähigkeit nicht zugenommen hat. Gesellschaften, die kulturelle Artefakte herstellen, profitieren von diesen und helfen bei der Anpassung an die Umwelt; die genetische Ausstattung ist nicht die einzige Quelle solcher Anpassungen.

50 Spieltheoretische Ansätze
Spiele eignen sich besonders, um bei Menschen (und Maschinen) Verhaltensweisen zu erkennen; sie erzeugen eine Abstraktion, die eine leichtere Mustererkennung möglich macht. Entstehung und Stabilisierung von Kooperation am Beispiel des iterierten Gefangenendilemmas Fragestellung: Welche Strategien sind in diesem Spiel besonders erfolgreich? Zweiter Teil der Themenanalyse: nach dem Verhältnis Individuum-Gesellschaft nun ein Ansatz, der uns Mensch und Maschine vergleichen lässt und uns Auskunft über optimale Strategien in bestimmten Umweltsystemen gibt; immerhin haben wir bisher den Agenten die Strategie vorgegeben (implizit oder explizit). Beachte: Punkt zwei bewusst doppeldeutig: Welche Strategie setzt sich besonders leicht durch (die Strategie ist erfolgreich)? Welche Strategie ist für das sie vertretende Individuum besonders vorteilhaft?

51 Das iterierte Gefangenendilemma
N Spieler treffen mehrfach eine Entscheidung: zu kooperieren (C) oder zu defektieren (D). Das Spiel endet nach jedem Zug mit der Beendigungswahrscheinlichkeit p = 1-w w nennt man Diskontparameter; er ist ein Maß für die Wichtigkeit des nächsten Zuges Defektionsverhalten wird klar belohnt, falls das Gegenüber kooperiert. C D 3 / 3 0 / 5 5 / 0 1 / 1 Typische Pay-off-Matrix P

52 Strategien für das Gefangenendilemma
TFT: „Wie du mir, so ich dir“ TRANQUILIZER: „Bilde eine Kooperationsphase, dann defektiere gelegentlich“ TESTER: „Defektiere, dann spiele in Abhängigkeit von der Reaktion TFT (nach D) oder spiele CC; defektiere danach bei jedem zweiten Zug (nach C)“ Trivial: immer D, immer C, Random Ebenfalls mögl: stochastische Strategien (wie ist die Gesellschaft/das Individuum im Schnitt charakterlich beschaffen?) KI-Methoden (LOOK AHEAD)

53 Vergleich der Strategien
TFT ist die „erfolgreichste“ Strategie, da sie Robust Nachsichtig Durchsichtig ... ist. Sie ist diejenige Strategie, die am schwierigsten auszubeuten ist. Der Vergleich der Strategien ist schwierig, weil es von der Zusammensetzung der Population abhängt, wie erfolgreich eine Strategie ist.

54 Strategiegruppen Eindringen einer Strategie: eine Regel erzielt in einer homogenen Regelpopulation höhere Punktzahlen als die Population. Kollektive Stabilität: Zustand, in dem keine Regel eindringen kann Kollektiv stabile Populationen können als einzige langfristig das Auftreten von Mutanten verkraften

55 Axelrod´s Theoreme Wenn w groß genug ist, gibt es keine beste Strategie unabhängig von der Strategie des anderen Spielers TFT ist genau dann kollektiv stabil, wenn das Spiel lange genug dauert (dabei ist w ist abhängig von P) Jede Strategie, die mit p > ½ im ersten Zug C spielt, kann nur kollektiv stabil sein, wenn w hinreichend groß ist Eine freundliche Strategie ist nur dann kollektiv stabil, wenn sie durch eine erste Defektion des anderen Spielers provoziert wird Immer-D ist stabil Diejenigen Strategien, die in Immer-D als Gruppe eindringen können, sind maximal diskriminierend, wie z.B. TFT Wenn ein einzelnes Individuum nicht in eine freundliche Gruppe eindringen kann, kann auch keine Gruppe eindringen. W < ½ => DEFECT ist erfolgreicher als eine TFT-Population Diskriminierung: Unterscheiden zwischen sich selbst und immer-d erfolgt zuverlässig Max. Diskriminierung:

56 Schlussfolgerungen Sei nicht neidisch Defektiere nicht als erster
Erwidere alle Verhaltensmuster Sei nicht zu raffiniert [1], S. 99ff.

57 Das Nachbarschaftsbegrenzungsmodell
Segregation kann mit dem alternativen Modell der „bounded neighbourhoods“ untersucht werden. Die Begriffe, die für Strategiegruppen eingeführt wurden, können aber hier interessanterweise analog genutzt werden.

58 Theoretische Psychologie: PSI
Nach den Fragen zu normkonformem Verhalten, der Rolle der Agenteninteraktion bei dessen Entstehen und der Untersuchung des sozialen Lernens sollen nun die Motivationen untersucht werden, die ein Individuum besitzt, sozial zu werden. Offenbar ist der Mensch kein vollständig rationale Subjekt, also kann auch seine Motivation bei der Emergenz sozialen Verhaltens nicht nur auf rational-egoistische Motive zurückgeführt werden. Die theoretische Motivationspsychologie führt einen emotionalen Aspekt in die Handlungssteuerung der Agenten ein und sorgt so für realistischere Modelle.

59 PSI: Modellvorstellung
Ein Roboter lebt auf einer Insel und benötigt zum Überleben Wasser als auch diverse weitere Ressourcen. Sein Handlungsrepertoire umfasst verschiedene Aktivitäten, die er auf Objekte seiner Umwelt anwenden kann. Der Roboter vermag durch korrekte Handlungen, seine Bedürfnisse zu befriedigen.

60 PSI: Interner Aufbau

61 PSI: Funktionsweise PSI basiert auf einer Bedürfnisorientierten Motivationsstruktur Emotionale, materielle und informationelle Bedürfnisse erzeugen Motivationen, die um die Kontrolle über die Steuerung des Organismus konkurrieren (Subsumption); die Handlungen hängen also vom gerade dominierenden Motiv ab. Da die „Sensoren“ von PSI nicht perfekt sind, kommt es zu ungenauer Umweltwahrnehmung. Mit Hilfe eines Protokolls vermag PSI, seine Handlungen zu reflektieren und so zu optimieren („Lernen“).

62 PSI: Emotionen als Quelle normativen Verhaltens
Setzt man mehrere PSI-Agenten auf die Insel und gibt ihnen ein Affiliationsbedürfnis, so das andere PSIs durch Aussendung eines Legitimitätssignalen (L-Signalen) dieses Bedürfnis befriedigen können, so können Normen entstehen. Dies geschieht, weil PSIs lernen, L-Signale geschickt einzusetzen, d.h. solche Signale hauptsächlich nur zu senden, wenn das Gegenüber sich erkenntlich zeigt, indem es andere Bedürfnisse des Senders befriedigt. Es entstehen Kooperation und Hilfsbereitschaft. Gegebenfalls muss ein PSI ein supplikatives Signal aussenden, also ein Ankündigungssignal für ein potentielles L-Signal. Es entsteht ein „Handel“, der z.B. Hilfe bei der Durstbefriedigung gegen die Aussendung von L-Signalen tauscht. Das Erlernen von Zielen im Zusammenhang mit Affiliationsbedürfnis führt zu engen Beziehungen, „Liebe“ zwischen den PSIs, da durch häufigen Austausch von L-Signalen das Gegenüber zur Quelle derselben wird. Bsp.: L-Signal: Lächeln, Streicheln usw. aber auch Uniformierung der Kleidung (man ist in der Gruppe willkommen)

63 Zusammenfassung Eine Vielzahl sozialwissenschaftlicher Situationen lässt sich relativ gut simulieren. Inwieweit diese Simulationen reale Tatsachen wiederspiegeln, kann nicht abschliessend geklärt werden; Simulationen können also Hilfe und Ideengeneratoren sein, niemals aber die Erhebung realer Daten ersetzen. Simulationen machen Vorschläge zur Interpretation dieser Daten. Der für AL-Forschung interessante Blickwinkel ist die Emergenz komplexen Verhaltens bei minimaler Ausstattung der Agenten. Für die Sozialwissenschaften ist die Modellierung realer Systeme und die Möglichkeit der Thesengenerierung von Bedeutung Philosophische Hinsicht?

64 Quellen [1] Axelrod, R.: „Die Evolution der Kooperation“, 1984
[2] Flentge et al.: „Modelling the Emergence of Possession Norms using Memes“, in: JASS Vol. 4 (2001) [3] Schelling, T.S.: „Dynamic Models of Segregation“ ; Journal of Mathematical Sociology 1971 Vol. 1 S [4] Epstein, Axtell: „Growing artificial societies“ 1996 [5] Dawkins, R.: „The selfish gene“, 1989 [6] Ito, A.: „How do selfish agents learn to cooperate?“ in Artificial Life V, hrsgg. von Adami et al. [7] Conti, R. und Castelfranchi, C.: „Understanding the function of norms in social groups through simulation“ in „Simulating social phenomena“ 1997 [8] Nakamaru et al.: „Spread of two linked social norms on complex interaction networks“ in JOTB 230 (2004) S. 57ff. [9] Hutchins, E. und Hazlehurst, B.: „Learning in the cultural process“ in Artificial Life I, 1990 [10] Levy, S.: „Künstliches Leben aus dem Computer“, 1996 [11] Dörner, D.: „Bauplan für eine Seele“, 1996 [12] Albert, R. und Barabasi, A.: „Statistical mechanics of complex networks“ in Review of modern Physics, Vol. 74 (2002) S. 47ff. [13] Detje, F.: „PSI: erste Schritte in Richtung sozialen Verhaltens“, Memo 41 des Instituts für th. Psych. Der Uni Bamberg (2001)


Herunterladen ppt "Künstliche Gesellschaften und individuelles Sozialverhalten"

Ähnliche Präsentationen


Google-Anzeigen