Publikation von Studierenden der FH OÖ Monte Carlo Tree Search für Optimierung Alexander Balleitner.

Slides:



Advertisements
Ähnliche Präsentationen
Simulationsansätze in der BWL: Erstellung eines eigenen Projekts
Advertisements

So erstellen Sie bei komplexen Animationen Übersichten Ihrer Animationseffekte Herbert Manthei
Schnelle Matrizenoperationen von Christian Büttner
Claudio Moraga; Gisbert Dittrich
Das LCA – Problem in Suffixbäumen
Algorithmische Anwendung
FH-Hof Der B-Baum Richard Göbel. FH-Hof Wahl des Verzweigungsgrad Verzweigungsgrad kann größer als 2 sein v Nachfolger für einen Knoten v-1 Werte in einem.
Lineare Suche Divide-and-Conquer-Suche Kombinationssuche
Wasserfall-Ansätze zur Bildsegmentierung
The Dynamic Single File Allocation Problem
Algorithmen und Komplexität
Einführung Übersicht Einsatz der Zielwertsuche Einsatz des Solvers
Genetische Algorithmen
Sortieren mit Binären Bäumen
Suchbäume Richard Göbel.
FH-Hof Künstliche Intelligenz - Suchbäume Richard Göbel.
FH-Hof Optimierungsverfahren für kombinatorische Probleme Richard Göbel.
Effizienz: Indexstrukturen
Heuristiken Automatic Problem Solving Institut für Informatik
WS Algorithmentheorie 08 – Dynamische Programmierung (2) Matrixkettenprodukt Prof. Dr. Th. Ottmann.
Union-Find-Strukturen
Genetische Algorithmen
Kurzanleitung: Gleichungen lösen
Planarisierung von Cluster Graphen
Algorithmen und Komplexität
1 Teil 4 Übung: Uhr. 2 Zielsetzung Ziel ist es, mit Hilfe objektorientierter Modellierung ein System zu entwickeln, mit dem eine einfache Uhr simuliert.
Rekursion Richard Göbel.
Spatial Decision Support Systems (SDSS)
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Für U2 an der FH in Bingen von Dipl. Inform. (FH) Heidi HannaH Daudistel.
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Splay Trees Von Projdakov Benjamin.
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Didaktische Programminterpreter
Jamshid Azizi: Folie Isomorphietest Jamshid Azizi
A. Gebert / A. Henke Ant colony simulation.
Christian Schindelhauer Wintersemester 2006/07 6. Vorlesung
Das Traveling Salesman Problem (TSP)
Methodische Grundlagen und Graphen
Das Springerproblem.
Stefan Nolting Andreas Goebels Larissa Timajev
WS03/041 Dynamische Programmierung (3) Konstruktion optimaler Suchbäume Prof. Dr. S. Albers Prof. Dr. Th. Ottmann.
Radikaler Konstruktivismus
Forschendes Lernen Wie sehen forschungsorientierte Aufgabenstellungen in der Mathematik aus? Modul IE-2: Offene und geschlossene Aufgaben (Problemstellungen)
Focusing Search in Multiobjective Evolutionary Optimization through Preference Learning from User Feedback Thomas FoberWeiwei ChengEyke Hüllermeier AG.
Organisationsweite Kommunikation und Kooperation
Lernprogramm Bedienung: mit Pfeiltasten RECHTS = vorwärts / LINKS = rückwärts.
Planung Analyse Erläuterung Umsetzung Abschluss.
Das Problem des Handlungsreisenden
Daniel Radeloff AMEISEN- ALGORITHMEN.
Vorlesung AVL-Bäume/Algorithmen-
Algorithmen und Datenstrukturen
Vorlesung AVL-Bäume/Algorithmen-
Laufzeitverhalten beim Sortieren
verkettete Strukturen
Wiederholung TexPoint fonts used in EMF.
MindManager für alle Peter Schnoor
Institut für Operations Research und Ökonometrie, WU Bratislava
2. Die rekursive Datenstruktur Baum 2.3 Baum und Kompositum
Lösung von Optimierungsaufgaben in der Unternehmensplanung
TOP5: Planungs- und Betriebsgrundsätze
 Präsentation transkript:

Publikation von Studierenden der FH OÖ Monte Carlo Tree Search für Optimierung Alexander Balleitner

Thema und Aufgaben Stand der Technik von MCTS für Optimierungsaufgaben erarbeiten Welche Algorithmenvarianten gibt es? Für welche Optimierungsaufgaben wurden diese erfolgreich eingesetzt? Es sollen Optimierungsaufgaben, deren Lösungsraum aus einer Grammatik besteht, betrachtet werden Implementieren und ausführliches Testen des MCTS-Algorithmus für grammatikbasierte Optimierungsaufgaben Seite 2 von 19

Monte Carlo Tree Search Einleitung Heuristischer Algorithmus für Entscheidungsprobleme Wurde 2006 entwickelt für Computer Go Erstmalige Kombination aus Baumsuch-Algorithmen und Monte Carlo-Methoden KI für Computer- und Brettspiele Seite 3 von 19

Monte Carlo Tree Search Algorithmus Lösungsraum wird als Baum dargestellt Jeder Knoten steht für einen Spielzug bzw. Entscheidung Baum wird in jeder Iteration erweitert Seite 4 von 19

Monte Carlo Tree Search Algorithmus Seite 5 von 19

Regelwerke des MCTS- Algorithmus Tree-Policy Selektion des „Start“-Knoten für eine Iteration Zuständig für: Diversifikation Intensifikation Default-Policy Zuständig für Simulationsprozess Einfachste Form basiert auf reiner Zufallssimulation Seite 6 von 19

Upper Confidence Bound (UCB) UCB1 Tree-Policy X j ist der durchschnittliche Qualitätswert n j ist die Anzahl an Selektionen X j beeinflusst Intensifikation n j beeinflusst Diversifikation Seite 7 von 19

Lösen einer Optimierungsaufgabe mit MCTS Optimierungsaufgabe als Grammatik darstellen Alle möglichen Sätze einer Grammatik können als Baumstruktur repräsentiert werden Dadurch ist ein Suchraum für MCTS gegeben Einfaches Beispiel (RoyalSymbol): Ziel ist es einen Satz zu generieren mit einer maximalen Anzahl an a‘s und einer maximalen Satzlänge k. G(S) : S → aS | bS | a | b. Seite 8 von 19

Lösungsansatz des MCTS- Algorithmus G(S) : S → aS | bS | a | b. Es werden baumartig Sätze erzeugt. Terminale Symbole werden als Knoten dargestellt. MCTS löst diese Aufgabe relativ simpel ohne domainspezifisches Wissen. Seite 9 von 19

Methodik Vergleich zur Genetischen Programmierung Lösungskandidaten werden ebenfalls als Baum dargestellt Zum Beispiel bei der Symbolischen Regression Optimierungsaufgaben mit MCTS und Genetischer Programmierung lösen Performanz und Qualität der Lösungen miteinander vergleichen Seite 10 von 19

MCTS - RoyalSymbol Seite 11 von 19

GP Standard - RoyalSymbol Seite 12 von 19

Santa Fe Trail - Problem Ziel ist es möglichst schnell die gesamte Nahrung aufzunehmen. Startposition ist festgelegt. Operationen der Ameise: Vorwärts Nach links drehen Nach rechts drehen Seite 13 von 19

MCTS – Santa Fe Trail Seite 14 von 19

GP Standard – Santa Fe Trail Seite 15 von 19

Symbolische Regression – Poly10 Problem mit 10 Variablen Ziel ist es die Beziehungen dieser 10 Variablen zu finden: x 1 x 2 + x 3 x 4 + x 5 x 6 + x 1 x 7 x 9 + x 3 x 6 x 10 Seite 16 von 19

GP Standard – Poly10 Seite 17 von 19

MCTS – Poly10 Seite 18 von 19

MCTS - Analyse Eignet sich sehr gut für Entscheidungsprobleme Baut die Lösung Schritt für Schritt auf Im Vergleich zu GP mehr Evaluierungen pro Sekunde Probleme (u.a. bei Optimierungsproblemen) Neigt dazu früh in lokale Optima zu fallen und dort „sitzen“ zu bleiben Verbesserungspotential Lernt nicht aus guten bzw. schlechten Entscheidungen Seite 19 von 19