Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Layered Learning Kapitel 4. Voraussetzungen 1. Komplexe Domain realtime noisy limited communications viele bewegt Objekte (Ball, Mitspieler, Gegner) direktes.

Ähnliche Präsentationen


Präsentation zum Thema: "Layered Learning Kapitel 4. Voraussetzungen 1. Komplexe Domain realtime noisy limited communications viele bewegt Objekte (Ball, Mitspieler, Gegner) direktes."—  Präsentation transkript:

1 Layered Learning Kapitel 4

2 Voraussetzungen 1. Komplexe Domain realtime noisy limited communications viele bewegt Objekte (Ball, Mitspieler, Gegner) direktes mapping ( Input Output ) nicht erlernbar 2. Modularisierung möglich (task decomposition) ergibt eine hierarchische Struktur

3 Beispiel für hierarchische task decomposition LayerStrategic levelBehavoir typeExample L1L1 robot-ballindividualball interception L2L2 one-to-one playermultiagentpass evaluation L3L3 one-to-many playerteampass selection L4L4 team formationteamstrategic positioning L5L5 team-to-opponentadversarialstrategic adaptation

4 Formale Definition eines Layers L i = (F i, O i, T i, M i, h i ) Input Output Trainingsdaten ML-Algorithmus resultierende Funktion h i : F i O i h i : 1. erzeugt F k i+1 2. erzeugt T i+1 3. schränkt die möglichen O i+1 ein

5 Implementation Ball Interception low-level skill, offine, neuronal network Pass Evaluation wird ein bestimmter Pass ankommen? Kenntnisse aus ball interception werden verwendet (offline, C4.5 decision tree) Pass Selection pass evaluation reduziert den riesigen Inputspace: nur die möglichen Pässe zu Mitspielern werden betrachtet (TPOT-RL)

6 Online Offline Wenn möglich, offline: fixe Situationen treten immer wieder auf während des Spiels (online) bekommt man nicht genügend ähnliche Trainingsmöglichkeiten gelernte skills können auf andere player übertragen werden Wenn notwendig, online: gelerntes Wissen kann nur teilweise weitergegeben werden Schwierigkeiten:exploration exploitation escalating arms race problem

7 Einbettung von Layered Learning in die Team Member Agent Architecture (Kap. 3) external behaviors:ball interception pass selection internal behaviors:pass evaluation strategic positioning strategic adaptation

8 Error Propagation Welcher Layer ist verantwortlich für Erfolg / Misserfolg ?


Herunterladen ppt "Layered Learning Kapitel 4. Voraussetzungen 1. Komplexe Domain realtime noisy limited communications viele bewegt Objekte (Ball, Mitspieler, Gegner) direktes."

Ähnliche Präsentationen


Google-Anzeigen