Künstlich Neuronale Netze

Künstlich Neuronale Netze
Forschungsverbund Neuronale Fuzzy-Logik Künstlich Neuronale Netze Aufbau, Training, Test und Visualisierung des Backpropagation-Algorithmus auf der Stuttgarter Simulationsplattform SNNS v4.1 Martin Hardes, Ulrich Lehmann 1. Beispiel: 2-Bit Decoder mit Analogausgang

2-Bit Decoder Technologieschema
Validierungsdaten: Werden nicht für das Training, sondern für die Validierung des KNN während des Trainings nach jeder Epoche verwendet, um das Verhalten und den Fehler des KNN für unbekannte Datensätze während des Trainings zu validieren. Technologieschema Output Input 1 0,25 2 Z0 0,50 3 1 Z1 0,75 Z0 Z1 n 1 0,25 0,50 0,75 Testdaten: Werden nicht für das Training, sondern für den späteren Test des trainierten KNN verwendet, um das Verhalten und den Fehler des KNN für unbekannte Datensätze zu testen. Trainingsdaten Testdaten

Trainings-, Valid- und Testdaten werden in PATTERN-
Dateien abgelegt Decoder_train.pat SNNS pattern definition file V3.2 generated at Thu Jun 08 18:53: No. of patterns : 3 No. of input units : 2 No. of output units : 1 # Input 1: 0 0 # target 1: # Input 2: 0 1 # target 2: 0.25 # Input 3: 1 1 # target 3: 0.75 Trainingsdaten

Trainings-, Validierungs- und Testdaten werden in PATTERN-
Dateien abgelegt Decoder_valid.pat SNNS pattern definition file V3.2 generated at Thu Jun 08 18:53: No. of patterns : 1 No. of input units : 2 No. of output units : 1 # Input 1: 1 0 # target 1: 0.5 Validierungsdaten

Trainings-, Valid- und Testdaten werden in PATTERN-
Dateien abgelegt Decoder_test.pat SNNS pattern definition file V3.2 generated at Thu Jun 08 19:50: No. of patterns : 1 No. of input units : 2 # Input 1: 1 0 Testdaten

Erstellen eines Feedforward Netzes für das Decoder Beispiel
Bignet

Darstellung der Netzstrukturen mit DISPLAY
 Decoder.net Aktivierung des Neurons siehe nächste Folie

Aufbau des Neurons mit Aktivierungs- bzw. Ausgangsfunktion a = f (net)
3  bias 3 aj(t) = (1+e - ( net j (t) +  ) ) mit   bias x1 = a1= o1 w13 y3 = a3  = net3 a = f (net3 +Bias) netj (t) =  ( wij · oi ) Aktivierung:0,144 -4,952 1 2 3 Aktivierung:0,502 Bias:1,437 Ausgabewerte Neuronen 1 und 2 (linear): oi = ai = 0,144 Netzeingabe: net3 = (w13 * o1) + (w23 * o2) net3 = (-4,952*0,144)+(-4,952*0,144) = -1,426 Aktivierungsfunktion (sigmoid): aj = 1/(1+e-(netj + bias)) a3= 1/(1+e-(-1, ,437)) = 0,502 w23 x2 = a2 = o2 Neuron 3

Darstellung der Aktivierungs- bzw. Ausgangsfunktion
-4,952 1 2 3 Aktivierung:0,502 Bias:1,437 Ausgabefunktion (linear) : oi = ai = 0,144 Netzeingabe: net3 = (w13 * o1) + (w23 * o2) net3 = (-4,952*0,144)+(-4,952*0,144) = -1,426 Aktivierungsfunktion (sigmoid) : aj = 1/(1+e-(netj + bias)) a3= 1/(1+e-(-1, ,437)) = 0,502 3  bias 3 net3 (t) =  ( wij · oi )

NET-Dateien in Textformat
SNNS network definition file V1.4-3D generated at Thu Aug 12 16:15: network name : dec_testd_x source files : no. of units : 5 no. of connections : 6 no. of unit types : 0 no. of site types : 0 learning function : Rprop update function : Topological_Order unit default section : act | bias | st | subnet | layer | act func | out func | |----| | | | | | h | | | Act_Logistic | Out_Identity | |----| | | | unit definition section : no. | typeName | unitName | act | bias | st | position | act func | out func | ----| | | | |----| | | |- 1 | | in | | | i | 2,2,-4349 | | | 2 | | in | | | i | 2,3,-4349 | | | 3 | | h | | | h | 5,2,-4349 | | | 4 | | h | | | h | 5,3,-4349 | | | 5 | | out | | | o | 8,2,-4349 | | | connection definition section : target | site | source:weight |------| 3 | | 1: , 2: 4 | | 1: , 2: 5 | | 3: , 4: Decoder.net

Vorbereitung des Lernvorgangs des Decodernetzes
decoder.net und dec_XXX.pat laden

Durchführung des Lernvorgangs des Decodernetzes
Control-Panel und Graph-Panel öffnen und Lernparameter im Control-Panel einstellen

Modifiziertes BPG-Lernverfahren Resilient Propagation
Bestimmung des Betrags der Gewichtsveränderung Bestimmung Gewichtsveränderung ij (t-1)   falls S(t-1) S(t) > 0 ij (t-1)   falls S(t-1) S(t) < 0 ij (t-1) sonst Δij (t) -ij (t) falls S(t-1) S(t) > 0  S(t) > 0 ij (t) falls S(t-1) S(t) > 0  S(t) < 0 -wij (t-1) falls S(t-1) S(t) < 0 -sgn (S(t)) ij (t) sonst Δwij (t) η+ = 1,2 und η- =0,5 (bei SNNS voreingestellt) Δwij (t) Δwij (t-1) t+1 t t-1 Im Beispiel links: S(t-1) S(t) > 0  S(t) > 0 E wij wij (t+1) = wij (t) + Δwij (t)

Lernkurve, Gewichtsveränderung und Bias- im Decodernetz während des Lernvorgangs
50 Epochen 100 Epochen 225 Epochen 20 Epochen 10 Epochen 0 Epochen Lernkurve im Graph Aktivierung und Gewichte Bias und Gewichte

Beispiel zur Berechnung der Aktivierung mittels Aktivierungs- und Ausgangsfunktion
Ausgangssituation: Abschluß des Lernvorgangs nach 225 Epochen Eingangsfunktion (linear): netj (t) =  ( wij · oi ) Aktivierungsfunktion (sigmoid): aj(t) = (1+e - ( net j (t) +  ) ) mit   bias Berechnung der Aktivierung im Neuron 3: net3= (1.000 · ) + (0.000 · ) = a3= (1 + e-( ))-1 = 0.144 Berechnung der Aktivierung im Neuron 5 net5= (0.144 · ) + (0.144 · ) = a5= (1 + e-( ))-1 = 0.502 Aktivierung: 0,144 -4,952 Bias: 0,486 Aktivierung: 0,000 -1,552 Aktivierung: 1,000 -2,264 3 1 5 Aktivierung: 0,502 2 4 Bias: 0,000 Bias: 1,437 -1,552 2 4 Bias: 0,000 Bias: 0,486

Gewichtsverteilung im KNN nach dem Lernvorgang
Gewichtsverteilung im Decodernetz mit Ausgabe des Ausgangswertes bei Verwendung der Testdaten

Darstellung der Ergebnisse nach dem Lernvorgang
Tabelle mit vom KNN berechneten Ausgangswerten des Decoders Z0 Z1 Soll- Ausgangswert Ausgangswert nach [TEST] 0,000 0,009 1 0,250 0,500 0,502 0,750 0,749 Trainingsdaten Validierungsdaten Testdaten

Vor (+)- und Nachteile (-) von KNN
keine mathematischen Prozessmodelle erforderlich (besonders vorteilhaft, bei nichtlinearen oder unbekannten Zusammenhängen) Fähigkeit zur Generalisierung beispielbasiertes Lernen (wie bei den Kindern!!!) Selbstorganisation und Adaptionsfähigkeit massive Parallelität (pro Neuron ein Prozessor möglich) Echtzeitfähigkeit (in der Produktionsphase) Fehlertoleranz (ein bis zu 60% zerstörtes Netz bleibt funktionsfähig) Ergebnisse nicht nachvollziehbar je nach Problemstellung viele Lernmuster erforderlich ( 0,5 nm mit n-Eingängen und m-Datenmuster pro Eingang sowie 50% der Muster als Trainingsdaten) bei komplexen Aufgaben hohe Trainingszeiten (bis zu einigen Stunden auf High Performance PC) schlechte, nicht gesicherte Konvergenz des Trainingsergebnisses Abhängigkeit des Lernergebnisses von der Qualität der Merkmalextraktion Vielfalt von Modellen und KNN-Typen

Bewertung der Simulationsumgebung SNNS 4.1
SNNS wurde für Unix Workstations geschrieben und ist auf Windows Rechnern nur mit X-Windows (X-Server) lauffähig (X-Windows ist kostenlos nur als Testversion mit max. Laufzeit 2 h verfügbar). - Grafische Oberfläche von SNNS unter Windows schwer zu bedienen (ein Button muss mit der Maus genau fokussiert werden). - Mit SNNS sind umfangreiche Netztopologien und Parametrierungen der Netze möglich. + Unkomplizierter Einstieg mit Durchführungsbeispiel im Bedienerhandbuch. + Umfangreiche Beispieldatenbank mit vielen untrainierten und trainierten Netzen verschiedenster Struktur. +

Literaturverzeichnis und Quellen
Lehmann, Herold, Leupold: Digitale Regelungen / Prozessrechner. Vorlesungsskript, MFH Iserlohn 1991 Zell, A.: Simulation Neuronaler Netze, Addison-Wesley Verlag 1996 Zell, A. et. al.: SNNS-Manual (PDF). At2-Server des CAS.Lab (Computer Architecture & Systems) der FH SW Campus Iserlohn Lehmann, U.; Bongards, M.; Johannes, H.: Fortschritt-Bericht VDI: Neuronale Fuzzy-Logik. VDI Verlag GmbH Düsseldorf 2000 Ulrich Lehmann: Neuro-Fuzzy-Systeme, Vorlesung an der FH Südwestfalen Campus Iserlohn, Iserlohn 2000

Künstlich Neuronale Netze

Ähnliche Präsentationen

Präsentation zum Thema: "Künstlich Neuronale Netze"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback

Anmelden

Anmeldung über soziales Netzwerk:

Künstlich Neuronale Netze

Ähnliche Präsentationen

Präsentation zum Thema: "Künstlich Neuronale Netze"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback