Selbstorganisation und Lernen

Slides:



Advertisements
Ähnliche Präsentationen
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Advertisements

Einführung in die Informatik: Programmierung und Software-Entwicklung
LS 2 / Informatik Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Telefonnummer.
CPCP Institute of Clinical Pharmacology AGAH Annual Meeting, 29. Februar 2004, Berlin, Praktischer Umgang mit den Genehmigungsanträgen gemäß 12. AMG Novelle.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2012.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Workshop zur Medienarbeit der katholischen Kirche Aspekte des Religionsmonitors Berlin, 02. April 2008.
Neuronale Netze Von Kay-Patrick Wittbold.
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
= = = = 47 = 47 = 48 = =
-17 Konjunkturerwartung Europa September 2013 Indikator > +20 Indikator 0 a +20 Indikator 0 a -20 Indikator < -20 Europäische Union gesamt: +6 Indikator.
Scratch Der Einstieg in das Programmieren. Scatch: Entwicklungsumgebung Prof. Dr. Haftendorn, Leuphana Universität Lüneburg,
Neuronale Netze Inhalt des Vortrags:
Grundkurs Theoretische Informatik, Folie 2.1 © 2006 G. Vossen,K.-U. Witt Grundkurs Theoretische Informatik Kapitel 2 Gottfried Vossen Kurt-Ulrich Witt.
Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.
Entscheidungsunterstützungssysteme IWI Frankfurt 2003
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
PKJ 2005/1 Stefan Dissmann Rückblick auf 2005 Was zuletzt in 2005 vorgestellt wurde: Klassen mit Attributen, Methoden und Konstruktoren Referenzen auf.
PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher im Kurs erarbeitete Konzepte(1): Umgang mit einfachen Datentypen Umgang mit Feldern Umgang mit Referenzen.
PKJ 2005/1 Stefan Dissmann Zusammenfassung Vorwoche Methoden sind mit einem Namen versehene Programmabschnitte besitzen Rückgabetyp, Namen, Parameterliste.
Betreuerin: Kathleen Jerchel
Bewegte Bezugssysteme
Astronomisch, Physikalische und Mathematische Geodäsie II
AC Analyse.
Studienverlauf im Ausländerstudium
Schieferdeckarten Dach.ppt
Kennlinie Lichtregelung in JavaNNS Version 1.1
2. Biologische Neuronen Schematischer Aufbau einer Nervenzelle
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele
2 Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele.
1. 2 Schreibprojekt Zeitung 3 Überblick 1. Vorstellung ComputerLernWerkstatt 2. Schreibprojekt: Zeitung 2.1 Konzeption des Kurses 2.2 Projektverlauf.
Bild 1.1 Copyright © Alfred Mertins | Signaltheorie, 2. Auflage Vieweg+Teubner PLUS Zusatzmaterialien Vieweg+Teubner Verlag | Wiesbaden.
20:00.
„Küsse deine Freunde“ – FlexKom-App teilen
Zusatzfolien zu B-Bäumen
SK / , , in Hochkössen und der Wildschönau flow Ski- und Snowboardschule Intersport Menzel.
1 Fachtagung am Seniorenorientiertes Design und Marketing ThyssenKrupp Immobilien Design for all - Anpassungen im Wohnungsbestand 1.Demographie.
für Weihnachten oder als Tischdekoration für das ganze Jahr
TWS/Graph HORIZONT Produktionsüberwachung für “TWS for z/OS”
Der Test fängt mit dem nächsten Bild an!
NEU! 1 2. Wo kommt diese Art von Rezeptor im Körper vor?
1. Welcher Nerv innerviert diesen Muskel? NEU!
Analyse von Ablaufdiagrammen
Birdwatch Start Mit deinem Feldstecher entdeckst du auf einer Exkursion viele Vogelarten. Kennst du sie alle? Vogelquiz Birdwatch.
PROCAM Score Alter (Jahre)
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II
Symmetrische Blockchiffren DES – der Data Encryption Standard
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Großer Altersunterschied bei Paaren fällt nicht auf!
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Analyseprodukte numerischer Modelle
Pigmentierte Läsionen der Haut
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Vortrag von Rechtsanwältin Verena Nedden, Fachanwältin für Steuerrecht zur Veranstaltung Wege zum bedingungslosen Grundeinkommen der Piratenpartei Rhein-Hessen.
1 Mathematical Programming Nichtlineare Programmierung.
Technische Frage Technische Frage Bitte löse die folgende Gleichung:
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
SiLeBAT Sicherstellung der Futter- und Lebensmittelwarenkette bei bio- und agro-terroristischen (BAT)-Schadenslagen.
Bildergalerie PRESEASON CAMP Juni 2014 Romanshorn Get ready for the Season!
Es war einmal ein Haus
J-Team: Gymnasium Ulricianum Aurich und MTV Aurich Ein Projekt im Rahmen von UlricianumBewegt.de Euro haben wir schon…  8000 mal habt ihr bereits.
Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.
1 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt Wie.
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Monatsbericht Ausgleichsenergiemarkt Gas – Oktober
 Präsentation transkript:

Selbstorganisation und Lernen Carsten Keßler Seminar Robotfußball, SoSe 2003

Überblick Einleitung Künstliche neuronale Netze Das Modell Roboter mit Eigeninitiative Visuelle Sensoren Zusammenfassung Carsten Keßler: Selbstorganisation und Lernen

Überblick Einleitung Künstliche neuronale Netze Das Modell Roboter mit Eigeninitiative Visuelle Sensoren Zusammenfassung Carsten Keßler: Selbstorganisation und Lernen

Einleitung Anpassungs- / Lernfähigkeit ist ein Hauptaugenmerk bei autonomen Agenten Der Lernprozess besteht häufig aus einer indirekten Programmierung des Agenten („Reinforcement Learning“) Carsten Keßler: Selbstorganisation und Lernen

Einleitung Engere Definition von Selbständigkeit: Echte Selbständigkeit muss Eigeninitiative beinhalten Carsten Keßler: Selbstorganisation und Lernen

Einleitung – die „Vision“ Startzustand: Roboter, gesteuert durch ein neuronales Netz das neuronale Netz ist in einem „Tabula rasa“ Zustand der Roboter reagiert nicht auf seine Sensor-Messwerte Aktivitäten sind rein zufällig die Umgebung enthält statische und dynamische Objekte Carsten Keßler: Selbstorganisation und Lernen

Einleitung – die „Vision“ Die Aufgabe: komplett internes Ziel für den Roboter definieren, damit: er anfängt, sich zu bewegen während der Bewegung ein Bild von seiner Umgebung entwickelt dies sollte unabhängig von den Sensoren und der Fortbewegungsart des Roboters sein Carsten Keßler: Selbstorganisation und Lernen

Überblick Einleitung Künstliche neuronale Netze Das Modell Roboter mit Eigeninitiative Visuelle Sensoren Carsten Keßler: Selbstorganisation und Lernen

Künstliche neuronale Netze Die Nervenzelle als biologisches Vorbild Quelle: Prof. Lippe, Skript „Softcomputing“ Carsten Keßler: Selbstorganisation und Lernen

Künstliche neuronale Netze Schematische Darstellung eines künstlichen Neurons Quelle: Dan Patterson – Künstliche neuronale Netze Carsten Keßler: Selbstorganisation und Lernen

Künstliche Neuronale Netze Formal: Tupel, bestehend aus Eingabevektor Gewichtsvektor Aktivierungsfunktion Ausgabefunktion Carsten Keßler: Selbstorganisation und Lernen

Künstliche neuronale Netze Quelle: Prof. Lippe, Skript „Softcomputing“ Carsten Keßler: Selbstorganisation und Lernen

Künstliche neuronale Netze Quelle: Prof. Lippe, Skript „Softcomputing“ Carsten Keßler: Selbstorganisation und Lernen

Künstliche neuronale Netze Typen des Lernens Entwicklung neuer Verbindungen Löschen existierender Verbindungen Modifikation der Gewichte Modifikation des Schwellenwertes Modifikation der Aktivierungs- / Ausgabefunktion Entwickeln neuer Zellen Löschen bestehender Zellen Carsten Keßler: Selbstorganisation und Lernen

Künstliche neuronale Netze Lernstrategien überwacht (supervised learning) bestärkend (reinforcement learning) unüberwacht (unsupervised learning) Carsten Keßler: Selbstorganisation und Lernen

Künstliche neuronale Netze Anwendungen Diagnostik Vorhersage Mustererkennung Optimierung Risikoabschätzung Steuerung .......... Carsten Keßler: Selbstorganisation und Lernen

Überblick Einleitung Künstliche neuronale Netze Das Modell Roboter mit Eigeninitiative Visuelle Sensoren Zusammenfassung Carsten Keßler: Selbstorganisation und Lernen

Das Modell Der Ansatz: der Agent überwacht selbst seinen eigenen Lernprozess Carsten Keßler: Selbstorganisation und Lernen

Das Modell Problem: die Sensorwerte müssen mit einem Modell vorausberechenbar sein, um im nächsten Schritt die gemessenen mit den vorausberechneten Werten zu vergleichen Carsten Keßler: Selbstorganisation und Lernen

Das Modell Ausgabe des Controllers: xt є Rn: Vektor der Sensorwerte zum Zeitpunkt t c: Parameter Vektor Carsten Keßler: Selbstorganisation und Lernen

Das Modell Das adaptive Modell soll xt+1 berechnen: Carsten Keßler: Selbstorganisation und Lernen

Das Modell der Fehler dabei beträgt: Carsten Keßler: Selbstorganisation und Lernen

Das Modell Lernregeln: für das Modell: für den Controller: Carsten Keßler: Selbstorganisation und Lernen

Das Modell Der Khepera Roboter 8 IR-Sensoren 2 Motoren max. 1m/s erweiterbar Quelle: http://www.k-team.com Carsten Keßler: Selbstorganisation und Lernen

Das Modell Beispiel der Roboter bewegt sich mit konstanter Geschwindigkeit der Output des Controllers gibt nur die Drehgeschwindigkeit an Modellierung durch ein einzelnes Neuron: Carsten Keßler: Selbstorganisation und Lernen

Carsten Keßler: Selbstorganisation und Lernen Quelle: Der / Liebscher: True autonomy from self-organized adaptivity Carsten Keßler: Selbstorganisation und Lernen

Carsten Keßler: Selbstorganisation und Lernen Quelle: Der / Liebscher: True autonomy from self-organized adaptivity Carsten Keßler: Selbstorganisation und Lernen

Carsten Keßler: Selbstorganisation und Lernen Quelle: Der / Liebscher: True autonomy from self-organized adaptivity Carsten Keßler: Selbstorganisation und Lernen

Überblick Einleitung Künstliche neuronale Netze Das Modell Roboter mit Eigeninitiative Visuelle Sensoren Zusammenfassung Carsten Keßler: Selbstorganisation und Lernen

Roboter mit Eigeninitiative Das Problem: Bislang war die Geschwindigkeit gegeben Das Modell strebt möglichst konstant bleibende Sensorwerte an  Das ist gegeben, wenn der Roboter nichts tut Carsten Keßler: Selbstorganisation und Lernen

Roboter mit Eigeninitiative Die Lösung: Der Roboter bekommt einen Anreiz zur Aktivität Dazu wird im Vorhersagemodell „die Zeit umgedreht“ Carsten Keßler: Selbstorganisation und Lernen

Roboter mit Eigeninitiative Die Zeitschleife: Carsten Keßler: Selbstorganisation und Lernen

Roboter mit Eigeninitiative Dabei entsteht der Fehler mit  Der Fehler ist klein, wenn das aktuelle Verhalten des Roboters gut durch das Modell repräsentiert wird Carsten Keßler: Selbstorganisation und Lernen

Roboter mit Eigeninitiative Berücksichtigung der Dynamik, die nicht durch das Modell beschrieben ist (Störung, Messfehler, „Rauschen“): Carsten Keßler: Selbstorganisation und Lernen

Roboter mit Eigeninitiative Daraus folgt: Der Fehler durch das Rauschen pflanzt sich in der Zeit „rückwärts“ fort Der Modellfehler wird minimiert, wenn die Roboter-Sensormesswerte instabil sind  Anreiz zur Aktivität Carsten Keßler: Selbstorganisation und Lernen

Roboter mit Eigeninitiative Verhalten des Roboters: Der Roboter zeigt sofort Aktivität, wenn er im Tabula rasa Zustand gestartet wird Beim Aufprall auf Hindernisse wird der Messfehler sprunghaft so groß, dass der Roboter sofort umdreht Carsten Keßler: Selbstorganisation und Lernen

Überblick Einleitung Künstliche neuronale Netze Das Modell Roboter mit Eigeninitiative Visuelle Sensoren Zusammenfassung Carsten Keßler: Selbstorganisation und Lernen

Visuelle Sensoren Carsten Keßler: Selbstorganisation und Lernen Quelle: Der / Liebscher: True autonomy from self-organized adaptivity. Carsten Keßler: Selbstorganisation und Lernen

Visuelle Sensoren Eingabevektor: x=(vl, vr, s1,…sK) vl, vr: Geschwindigkeiten der Räder si: Pixelwerte der Kamera im R3 Carsten Keßler: Selbstorganisation und Lernen

Visuelle Sensoren Preprocessing: Binäre Klassifizierung der Pixel, ob sie der Farbe des Balles entsprechen oder nicht Herunterskalieren des Bildes auf 32 * 32 Pixel in Graustufen Erzeugen eines Bewegungsvektors im R2 für den Ball aus 2 aufeinander folgenden Bildern Carsten Keßler: Selbstorganisation und Lernen

Visuelle Sensoren Der Controller besteht aus 2 Neuronen Neuron 1 regelt die Geschwindigkeit gefüttert mit der Geschwindigkeit des Balles in Fahrtrichtung sowie den Sensormesswerten von den Rädern  Funktioniert wie eben gesehen Carsten Keßler: Selbstorganisation und Lernen

Visuelle Sensoren Der Controller besteht aus 2 Neuronen Neuron 2 regelt die Lenkung wird gefüttert mit den Pixelwerten aus dem vorher aufbereiteten Bild Annahme: die Komponente g2 des Bewegungsvektors g soll sich nicht ändern Carsten Keßler: Selbstorganisation und Lernen

Visuelle Sensoren Fehlerberechnung Carsten Keßler: Selbstorganisation und Lernen

Visuelle Sensoren Ausgabefunktionen Carsten Keßler: Selbstorganisation und Lernen

Visuelle Sensoren Lernregeln Carsten Keßler: Selbstorganisation und Lernen

Visuelle Sensoren Ergebnisse: Anpassung der Geschwindigkeit funktioniert beim Pioneer ähnlich gut wie beim Khepera Anpassung der Richtung aufgrund der Kameradaten bereitet noch Probleme, die allerdings technischer Natur sind Carsten Keßler: Selbstorganisation und Lernen

Überblick Einleitung Künstliche neuronale Netze Das Modell Roboter mit Eigeninitiative Visuelle Sensoren Zusammenfassung Carsten Keßler: Selbstorganisation und Lernen

Zusammenfassung Wir haben gesehen, wie: Roboter mit Hilfe von neuronalen Netzen lernen können Sie mit Hilfe von neuronalen Netzen dazu gebracht werden können, Aktivität zu entwickeln Wie die Verarbeitung von visuellen Informationen in dieses Modell integriert werden kann Carsten Keßler: Selbstorganisation und Lernen

Zusammenfassung Bezug zum Roboterfußball: Zur Zeit noch keine praktische Anwendung der hier vorgestellten Ergebnisse In der Anwendung dominiert noch die klassische KI Ergebnisse sind noch sehr frisch, daher wahrscheinlich in Zukunft auch relevant für die Praxis Carsten Keßler: Selbstorganisation und Lernen

Vielen Dank für die Aufmerksamkeit! Carsten Keßler: Selbstorganisation und Lernen