Layered Learning Kapitel 4. Voraussetzungen 1. Komplexe Domain realtime noisy limited communications viele bewegt Objekte (Ball, Mitspieler, Gegner) direktes.

Slides:



Advertisements
Ähnliche Präsentationen
Spielen “to play” Was spielst du?.
Advertisements

Persistente Domänenmodelle mit JPA 2.0 und Bean Validation
Präsentiert von Torben Pastuch
Pop Jazz C B A Jazz C A Lehrstuhl für Künstliche Intelligenz
Internationale Vereinbarungen II
What Computers still cant do A Critique of Artificial Reason Hubert L. Dreyfus.
Prof. Dr. W. Conen 15. November 2004
BPM Standards – Aktueller Stand und Ausblick Prof. Dr
Grundzüge der Mikroökonomie (Mikro I) Kapitel 8 P-R Kap. 7
Vom Anfänger zum Könner -
Koordination von Fußballrobotern
Prinzipal-Agenten Beziehungen
1/21 UNIVERSITY OF PADERBORN Projektgruppe KIMAS – Reinforcement Learning in MAS Projektgruppe KIMAS Reinforcement Learning in MAS Marc Pannenberg.
Christian Schindelhauer
Zurück zur ersten Seite n Style Sheets sind im Prinzip Formatvorlagen für HTML-Dokumente n Über Style Sheets lassen sich zentrale Layout-Vorgaben für eine.
Architektur, Design oder Implementation? Ulrich Schulz, Sebastian Ordyniak.
On a Buzzword: Hierachical Structure David Parnas.
Lernende Agenten Seminar Softwareagenten Wintersemester 2001/2002 Norman Neuhaus.
Entscheidungsunterstützungssysteme IWI Frankfurt 2003
Reinforcement Learning
Martin zur Nedden, HU Berlin 1 Physik an Hadron-Collidern, WS 2006/2007 Kap. 3: Jets Jet-Definition Jet-Rekonstruktion Di-Jet Ereignisse Multi-Jet Ereignisse.
Universität Bonn, Seminar Softwaretechnologie WS 2003/2004, Bastian Demuth 1 Seminar "Component and Aspect Engineering" Thema dieses Vortrages: Composition.
Die Entwicklung von Konzepten
1 Inhalt Diverse redaktionelle Änderungen Kleinere Änderungen/Klarstellungen Große Änderungen.
Uebung 03 Netzdateien.
Wismar Business School
Wissen ist des Menschen Maß Humatics: Zum mathematisch-naturwissenschaftlichen Hintergrund VisionPatents AG 6.13 hbit Wissensmenge in hbit = Human Bit.
Wird Mario betrogen? Ein Informatikprojekt des Elsa-Brändström-Gymnasiums Oberhausen Wahlpflichtkurs Jahrgang 8 Lehrer: Hr. Fileccia April 2010.
Machine Learning KNN und andere (Kap. 8).
Maschinelles Lernen und automatische Textklassifikation
3 Rahmenkonzept Lernumgebungen
BSP Binary Space Partitioning
Deutsch als Tertiärsprache in Taiwan - unter besonderer Berücksichtigung des Chinesischen als L1 und des Englischen als erster Fremdsprache Chen, Yinghui.
Machine Learning & Spiele: Probleme und Ideen von Samuel bis heute Giuliana Sabbatini
Was ihr schon immer über den Strafstoß wissen wolltet,
Mein Thema über 2 mal 3 Stunden lautet: Das Rezidiv! In diesen Vortrag möchte auch zeigen das eine bessere Behandlungsplanung mit Hilfe 3 D Technologie.
Übungsblatt 08 Lehrstuhl für Kommunal- und Umweltökonomie
Automatic composition of UI mashups Vortrag zum Seminar Webengineering 2011 Michael Reißner.
Was muss ich wissen um Handball als Sport betreiben zu können?
RFS Roboter Fussball Simulation. Projektdaten Warum gibt es dieses Projekt: Jahr der Informatik Anfrage des Fördervereins Fussballweltmeisterschaft in.
Jette von Holst-Pedersen, Oktober, 2013
Worin zeigt sich kompetenzorientierter Religionsunterricht?
Was ist Spiel? Erfahrung Bedeutung Vergnügung Narration Simulation Sozial Jonas Zimmer Softwaretechnologie II (Teil 2) Prof. Dr. Thaller.
Regel 13 Freistöße.
Die Ausbildung zum Schiedsrichter - Ausgabe 2013 / 2014
Die Ausbildung zum Schiedsrichter - Ausgabe 2013 / 2014 Bernd Domurat - DFB-Kompetenzteam.
Analyse von Arbeitsaufträgen „Durch Geschichte zur Gegenwart 2“
Spielverständnis.
Blended Learning.
Formale Sprachen Grammatiken und die Chomsky-Hierarchie
Herzlich Willkommen! Ortskernentleerung Die Potentiale und Gefahren erkennen.
Brüche-Quartett Klasse 6-8 Spieler 4-6. Brüche-Quartett A1 Brüche-Quartett A2 Brüche-Quartett A3 Brüche-Quartett A4 Brüche-Quartett B1 Brüche-Quartett.
DER BALL DER IMMER GRÖSSER WURDE !
Informatik III Christian Schindelhauer Wintersemester 2006/07
Auswertung des Fragebogens für Videobeobachter/innen
Seite 1 Autor: bb-project Firmenpräsentation ■ März 2008 Referenzen Interim Management Carve Out EAM Architektur- Manage- ment M&A Referenz Globale Daten-
Kulturworkshop in Sachen Fussball
P3_2005/06 konzept Positionierung von Wien und Bratislava: Potentiale und Visionen des Stadtmarketing und der Kooperation Kooperation der TU Wien mit der.
SS 2009Maschinelles Lernen und Neural Computation 133 Kapitel 7: Ensemble Methoden.
Elektronisch unterstütztes Lernen durch digitale Medien
Game Loop & Update Method Robert Nystrom – Game Programming Patterns Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung SS.
Übungen Ziele Struktur Besonderheiten Trainer Aspekte Methodische Aspekte ABC´s Quellen Übertrag Workshop.
The PageRank Axioms Johannes Zaunschirm. Überblick / Outline  Alon Altman and Moshe Tennenholtz. “Ranking Systems: The PageRank Axioms”., 2005  Basisstruktur.
1 Patientenrechte - Bürgerrechte Evangelische Akademie Tutzing Arbeitskultur: Umgang mit Fehlern in der Medizin.
Emanuel Mistretta Lukas Schönbächler
Bildverarbeitung Digitales Bild

Spielen “to play” Was spielst du?.
Die Suche nach dem Stop-Quark
Beziehungen Perspektiven Systemgrenzen
 Präsentation transkript:

Layered Learning Kapitel 4

Voraussetzungen 1. Komplexe Domain realtime noisy limited communications viele bewegt Objekte (Ball, Mitspieler, Gegner) direktes mapping ( Input Output ) nicht erlernbar 2. Modularisierung möglich (task decomposition) ergibt eine hierarchische Struktur

Beispiel für hierarchische task decomposition LayerStrategic levelBehavoir typeExample L1L1 robot-ballindividualball interception L2L2 one-to-one playermultiagentpass evaluation L3L3 one-to-many playerteampass selection L4L4 team formationteamstrategic positioning L5L5 team-to-opponentadversarialstrategic adaptation

Formale Definition eines Layers L i = (F i, O i, T i, M i, h i ) Input Output Trainingsdaten ML-Algorithmus resultierende Funktion h i : F i O i h i : 1. erzeugt F k i+1 2. erzeugt T i+1 3. schränkt die möglichen O i+1 ein

Implementation Ball Interception low-level skill, offine, neuronal network Pass Evaluation wird ein bestimmter Pass ankommen? Kenntnisse aus ball interception werden verwendet (offline, C4.5 decision tree) Pass Selection pass evaluation reduziert den riesigen Inputspace: nur die möglichen Pässe zu Mitspielern werden betrachtet (TPOT-RL)

Online Offline Wenn möglich, offline: fixe Situationen treten immer wieder auf während des Spiels (online) bekommt man nicht genügend ähnliche Trainingsmöglichkeiten gelernte skills können auf andere player übertragen werden Wenn notwendig, online: gelerntes Wissen kann nur teilweise weitergegeben werden Schwierigkeiten:exploration exploitation escalating arms race problem

Einbettung von Layered Learning in die Team Member Agent Architecture (Kap. 3) external behaviors:ball interception pass selection internal behaviors:pass evaluation strategic positioning strategic adaptation

Error Propagation Welcher Layer ist verantwortlich für Erfolg / Misserfolg ?