Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

Ähnliche Präsentationen


Präsentation zum Thema: "Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte."—  Präsentation transkript:

1 Konkurrentes Lernen AS-1

2 - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte Anforderungen bzw.Umgebung Bessere Reaktion bei veränderter Umgebung Bilden unspezifischer, generalisierter Mittelwertsreaktionen Keine neue Reaktion (Klasse) möglich bei stark veränd. Umgebung harte, inflexible, stabile Verbindungen einmal erlangte gute Reaktion bleibt erhalten trotz Ausreisser Bei schlechter Passung (Test!) Bildung neuer Klassen möglich keine Anpassung bei leicht veränderter Umgebung möglich Idee :Lernen + neue Klassen durch Konkurrenzsituation: der Bessere übernimmt und lernt die Klasse Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

3 Selbstorganisierende Karten Somatotopische Karten Anwendung Robotersteuerung Anwendung Sprachsynthese - 3 -

4 Vorbild Gehirn Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

5 Das Vorbild: Gehirnfunktionen Unterteilung des Gehirns in funktionale Bereiche Gehirn = 2-dim Tuch Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

6 - 6 - Somatotopie Beobachtung: Abbilder, Karten Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

7 - 7 - Lokale Wechselwirkungen Aktivität in kontinuierlichen Neuronenfeldern Eingabe für Neuron v Schwelle + laterale Kopplungen Cohen-Grossberg 1983: Aktivität stabil bei symm. Gewichten u ij, monoton wachs. y(.) und >0 Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

8 - 8 - Lokale Wechselwirkungen Training: Hebbsches Lernen 1, 2 >> Gewichte Schwelle Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

9 - 9 - Lokale Wechselwirkungen Training z i (t) – z i (t-1) = – z i (t-1) + j w ij (t) x j (t) + j u ij y j (t) Abklingen der Veränderung, diskrete Strukturen y i (t) = S( j w ij (t) x j (t) + j u ij y j (t) ) w ij (t) = w ij (t-1) + [x j y i -B(y i )w ij ] mit B(.) zum Vergessen Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

10 Lokale Wechselwirkungen Simulation der Aktivität: Populationskodierung hohe Schwelle niedrige Schwelle Abstraktion: Mittelpunkt einer Blase. Hier: B(y)=1 Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

11 Selbstorganisierende Karten Somatotopische Karten Anwendung Robotersteuerung Anwendung Sprachsynthese

12 Kohonennetze: Topologie Eingabedimension n = 3 Ausgabedimension d = 2 Def. Nachbarschaft von Neuronen X = ( ) Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

13 Lernalgorithmus Kohonenkarten 1.Suche Neuron (Gewichtsvektor) mit kleinstem Abstand zur Eingabe x winner selection 3.Adaptiere auch die nächsten Nachbarn w k (t+1) = w k (t) + ( t+1) h (t+1,c,k) [x - w k (t) ] z.B. mit 2.Adaptiere die Gewichte w k (t+1) = w k (t) + (t+1) [x - w k (t) ] Winner Take All Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

14 Nachbarschaftsfunktionen Binäre Funktion: zeitabhängig Glockenfunktion h(k,c,t)= exp(k-c, (t)) ck Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

15 Topologie-Entwicklung Eingabe: uniform-verteilte, 2-dim Zufallszahlen Zeichnung: Verbindungsline vom Gewichtsvektorendpkt zum Nachbarn t=0t=20t=100 t=10000 Zeichnung : Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

16 Topologie-Entwicklung BeispielFinger-Sensorikentwicklung Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

17 Topologie-Entwicklung BeispielFinger-Amputation Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

18 Topologie-Entwicklung Tendenz zur Selbstordnung Iteration für zwei Gewichtsvektoren w 1 und w 2 bei gleicher Eingabe: Abstand verringert sich (Rechnung) Kein Nachbar überholt den Gewinner (Rechnung) Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

19 Pseudocode für Kohonenkarten VAR x: ARRAY [1..n] OF REAL ; (* Muster*) w: ARRAY [1..m,1..m] OF ARRAY [1..n] OF REAL ; (* Gewichte*) vc: RECORD i,j : INTEGER END ; (* sel.Neuron *) BEGIN := max ; (* initial: max.Nachbarschaft *) FOR t:=1 TO t max DO Read(PatternFile,x) (* Muster erzeugen oder einlesen *) ( * Neuron selektieren * ) Min:= ABS(x-w [1,1] ); (* initialer Wert *) FOR i:=1 TO m DO (* In allen Spalten *) FOR j:= 1 TO m DO (*und Zeilen *) Abstand := ABS(x-w [i,j] ); (* suche Minimum *) IF Abstand < Min THEN Min := Abstand ; vc.i:=i; vc.j:=j; END ( * Gewichte adaptieren *) FOR i:= vc.i - TO vc.i + DO (* Evaluiere 2-dim. *) FOR j:= vc.j - TO vc.j + DO (* Nachbarschaft umc*) IF i>0 AND i<= m AND j>0 AND j<=m THEN (* Vorsicht am Rand *) w [i,j] = w [i,j] + 1.0/FLOAT( t)*( x - w [i,j] ) ENDIF END (*i*) GrafikAnzeige (t,w) ( * Visualisierung der Iteration *) upDate (,t) (* Verkleinerung des Nachbarschaftsradius *) END (*t*) Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

20 Überwachte adaptive Vektorquantisierung Klasse bekannt: Lerne die Klassengrenzen mit h( t,c,k) := w k (t+1) = w k (t) + (t+1) h(t,c,k)[x - w k (t) ] h( t,c,k) := 2. Nachbar c ebenfalls Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

21 Selbstorganisierende Karten Somatotopische Karten Anwendung Robotersteuerung Anwendung Sprachsynthese

22 Spracherkennung Beispiel: Neuronale Schreibmaschine x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8... x 15 Filter 1 Filter 6 Filter 7 Filter 8... Filter 15 Filter 2 Filter 3 Filter 4 Filter 5 x(t) Fouriertranformation 200 Hz-5KHz Merkmalsvektor x(t) 26 ms überlappende Intervalle, alle 10 ms Finnisch: 21 vokal. Phoneme, 50 Trainingsmuster pro Phonem. 3 Konsonant. /k/, /p/, /t/ extra! Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

23 Spracherkennung Erfolg: ähnliche Phoneme - ähnlicher Ort. z.B. Dynamik des Wortes >>humppila<< Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

24 Spracherkennung Implementierung:Hardware-Platine Training: 10min/100Worte pro Sprecher Erkennung: 250ms/Wort Leistung 92%-97% richtig erkannt Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

25 Spracherkennung Implementierung 96kB 64kB 512kB Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

26 Selbstorganisierende Karten Somatotopische Karten Anwendg Robotersteuerung Anwendg Sprachsynthese

27 Robotersteuerung vs. Muskelkontrolle Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

28 Robotersteuerung BeispielPuma-Roboter Probleme Kinematik Winkelkoord. Gelenke kartes. Koord. x Inverse Kinematik kartes. Koord. x Winkelkoord. Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

29 Robotersteuerung Kinematik durch homogene Koord.transformationen DrehungSkalierung Shift W = W shift W rot W scal = Inverse Kinematik Analytisch schwierig oder unmöglich! Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

30 Robotersteuerung Inverse Kinematik beim PUMA-Roboterarm Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

31 Robotersteuerung Inverse Kinematik beim PUMA-Roboterarm Besser: Lernen der inversen Kinematik! Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

32 Robotersteuerung Probleme der Positionskontrolle Änderungen der Armgeometrie sind nicht möglich, sonst Neu-Analyse und Reprogrammierung der Transformation nötig Mehr Gelenke als Freiheitsgrade nur Teilbewegungen möglich Analytische Transformation Kart. Koord Gelenk-Koord. langsam Echtzeitprobleme Keine bessere Auflösung an kritischen Stellen Keine automatische Bewegungsoptimierung (z.B. Energie) Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

33 Robotersteuerung Grobe Positionierung Suche Neuron mit Winner-take-all Assoziiert ist k = ( 1, 2, 3 ) Lernen von w k z.B. mit Kohonen-Netz, oder fest initialisiert | w k –x | = max i | w i –x | Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

34 Robotersteuerung Feine Positionierung Aktivität grobe Pos. feine Pos. (x) = c + = c + A c (x-w c ) = U c x Lernen U c (t+1) = U c (t) + h(.) (t+1)[U c * -U c (t)] SOM Lernregel Widrow-Hoff Lernregel für Schätzung U* Lehrervorgaben x I : beob. Position durch w c bzw. c x F : beob. finale Position c * = c + A c (x-x F ) A c * = A c + A c [ (x-w c ) – (x F -x I ) ] (x F -x I ) T / |(x F -x I )| 2 mit U c = (A c, c, ), x = (x-w c,1) Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

35 Robotersteuerung Konvergenzverhalten Feinbewegung A c Grobbewegung c t = 0t = 500t = Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

36 Robotersteuerung Vorteile Schnelle Kontrolle, da tabellierte Funktion SOMs steuern auch sehr unkonventioneller Architekturen (Vielgelenksarme, benutzer-definierte Geometrie) Verbesserte Auflösung (Neuronendichte) der topologie-erhaltenden Abbildung in oft benutzten Gebieten : bedarfsabhängige Auflösung! Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

37 Robotersteuerung Vorteile Nebenbedingungen sind einfacher zu integrieren (z.B. Energie) Lerngeschwindigkeit ist durch die Nachbarschaft deutlich beschleunigt (Fluch der Dimensionen gemildert!) Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

38 Robotersteuerung Nachteile Die erlernten Transformationstabellen sind fest Zeitsequenzen können nicht erlernt werden (Trajektorien) Es gibt keine Generalisierung oder Abstraktion einer Bewegung; Skalierung der Bewegung ist nicht möglich! Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009


Herunterladen ppt "Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte."

Ähnliche Präsentationen


Google-Anzeigen