PowerPoint-Folien zur 3. Vorlesung „Evolutionsstrategie I“ Ingo Rechenberg PowerPoint-Folien zur 3. Vorlesung „Evolutionsstrategie I“ Globale und lokale Optimumsuche Vier elementare Strategien auf dem Prüfstand
? Q x Qualitätsmessung Versuchsobjekt Verstellbarkeit opt 4 Strategien Strategie Qualitätsmessung Versuchsobjekt Verstellbarkeit 1. Globale deterministische Suche Experimentierkreis 2. Globale stochastische Suche 3. Lokale deterministische Suche 4. Lokale stochastische Suche
? Suche nach dem Optimum Bei schwach kausalem Weltverhalten Bei stark kausalem Weltverhalten Konstruktion einer additiven Einbahnstraße zum Berggipfel
1. Globale deterministische Suche Beispiel: 80 Variable mit je 10 diskreten Einstellstufen G = 1080 Zahl der Elementarteilchen im Weltall 1. Globale deterministische Suche Systematisches Scannen des Versuchsfeldes
2. Globale stochastische Suche Zielfindung mit 95% Wahrscheinlichkeit
Rechnung mit Wahrscheinlichkeitstheorie 1. Versuch Ziel getroffen: 1. Versuch Ziel nicht getroffen: 1. & 2. Versuch Ziel nicht getroffen: Für n Variable 1. & 2. & 3. Versuch Ziel nicht getroffen: 1. & 2. & 3…& G. Versuch Ziel nicht getroffen: G Versuche Ziel getroffen: Für Wz = 0.95 Text
1. Globale deterministische Suche 2. Globale stochastische Suche 3. Lokale deterministische Suche 4. Lokale stochastische Suche
j j = Zurückgelegter Weg bergan Zahl der Versuche Definition der Fortschrittsgeschwindigkeit Konstruktion einer additiven Einbahnstraße zum Berggipfel j j = Zurückgelegter Weg bergan Zahl der Versuche
Sichtbar gemachtes Normalverhalten der Welt Die Idee der Linearisierung Linearitätsradius
j = d = d Zurückgelegter Weg bergan Zahl der Versuche Man darf nur so weit gehen, wie die Annahme „Ebene“ gilt ! = d Fortschritt d Linearitätsradius 3. Lokale deterministische Suche Folgen des steilsten Anstiegs
Gradientenstrategie Arbeitsschritt der Länge d in Richtung des steilsten Anstiegs am Beispiel für 3 Dimensionen: Man bewegt sich proportional zu den jeweiligen Qualitätsänderungen in die x-, y-, und z-Richtung
Ebene symbolisiert die lineare Theorie
d 4. Lokale stochastische Suche 2. Nachkomme Elter 1. Nachkomme Linearitätsradius 4. Lokale stochastische Suche Zufallsdriften entlang des steilsten Anstiegs
+ − sr Bestimmung des linearen Fortschritts Plus-Nachkomme Schwerpunkt Minus-Nachkomme sr Elter + Linearitätsradius − Statistisches Mittel des Fortschritts Bestimmung des linearen Fortschritts
+ − s = j sr 2 ? Plus-Nachkomme Schwerpunkt Minus-Nachkomme Elter + Linearitätsradius Fortschrittsgeschwindigkeit: s 2 r = j ? − Statistisches Mittel des Fortschritts Weil die Hälfte der Kinder Misserfolge sind !
Schwerpunkt sr sr sr 2 Dim. 3 Dim. n Dim. ?
+ − sv Bestimmung des linearen Fortschritts Plus-Nachkomme Schwerpunkt Minus-Nachkomme sv Elter + Linearitätsradius − Statistisches Mittel des Fortschritts Bestimmung des linearen Fortschritts
+ − s = j sv 2 ? Plus-Nachkomme Schwerpunkt Minus-Nachkomme Elter + Linearitätsradius Fortschrittsgeschwindigkeit: ? s 2 v = j − Statistisches Mittel des Fortschritts Weil die Hälfte der Kinder Misserfolge sind !
Schwerpunkt r r sv sv sv 2 Dim. 3 Dim. n Dim. ?
Aufgabe: 1. Berechnung des Schwerpunkts einer n-dimensionalen Halbkugelschale 2. Berechnung des Schwerpunkts einer n-dimensionalen Vollhalbkugel Was ist eine n-dimensionale Kugel ― Hyperkugel ? Was ist ein n-dimensionaler Würfel ― Hyperwürfel ?
Hyperraum aus der Sicht eines Künstlers
Der Weg zum n-dimensionalen Würfel Strecke – Quadrat – Würfel – Tesserakt
Wenn Sie diese Figur räumlich sehen, dann sehen Sie die Projektion eines 4-dimensionalen Würfels in 3 Dimensionen
Was ist eine n-dimensionale Kugel ? Die Fortentwicklung einer konstruktiven mathematischen Idee Beispiel: Strecken-Flächen-Volumen-Element ∂a ∂a ∂a ∂a ∂a Hyperwürfel ∂a Genannt: Stecken- element Flächen-element Volumen-element Hypervolumen-element
Analoge Extrapolationsidee für die D Entfernung D zweier Punkte Die konstruktive Idee einer n-dimensionalen Kugeloberfläche: Alle Punkte P2, die von dem Punkt P1 die gleiche Entfernung R haben.
Zurück zur Aufgabe: 1. Berechnung des Schwerpunkts einer n-dimensionalen Halbkugelschale 2. Berechnung des Schwerpunkts einer n-dimensionalen Vollhalbkugel
Die 1. Guldinsche Regel Eine Kurve erzeugt durch Rotation um 360 Grad eine Rotationsfläche. Dann ist die Oberfläche der Rotationsfläche gleich der Länge der erzeugenden Kurve mal dem Weg des Schwerpunktes dieser Kurve. Paul Guldin (1577 – 1643)
U s O × p = 1 2 Die 1. Guldinsche Regel s Eine Kurve erzeugt durch Rotation um 360 Grad eine Rotationsfläche. Dann ist die Oberfläche der Rotationsfläche gleich der Länge der erzeugenden Kurve mal dem Weg des Schwerpunktes dieser Kurve. Paul Guldin (1577 – 1643) Beispiel: Ein Halbkreis erzeugt durch Rotation um 360° eine Kugel. Dann ist die Oberfläche der Kugel gleich der Länge des Halbkreislinie (p r ) mal dem Rotationsweg des Schwerpunkts des Halbkreislinie. Halbkreis mit dem Radius r s Halbkreislinienschwerpunkt Schwerpunktsweg Kreis Kugel 2 1 U s O × p =
Die 2. Guldinsche Regel Eine Fläche erzeugt durch Rotation um 360 Grad einen Rotationskörper. Dann ist das Volumen des Rotationskörpers gleich dem Inhalt der erzeugenden Fläche mal dem Weg des Schwerpunktes dieser Fläche. Paul Guldin (1577 – 1643)
F s V × p = 1 2 Die 2. Guldinsche Regel s Eine Fläche erzeugt durch Rotation um 360 Grad einen Rotationskörper. Dann ist das Volumen des Rotationskörpers gleich dem Inhalt der erzeugenden Fläche mal dem Weg des Schwerpunktes dieser Fläche. Paul Guldin (1577 – 1643) Beispiel: Ein Halbkreis erzeugt durch Rotation um 360° eine Kugel. Dann ist das Volumen der Kugel gleich dem Inhalt des Halbkreisfläche (1/2 p r 2) mal dem Rotati-onsweg des Schwerpunkts der Halbkreisfläche. Halbkreis mit dem Radius r s Halbkreisflächenschwerpunkt Schwerpunktsweg Kreis Kugel 2 1 F s V × p =
Guldin Guldin gedeutet als 1 Dimension 2 Dimensionen 3 Dimensionen
n-dimensionalen Kugel Oberfläche einer n-dimensionalen Kugel Volumen einer n-dimensionalen Kugel G(m) = (m – 1)! für ganzzahlige m G(x +1) = x G(x), G(1) = G(2) = 1, G(1/2) = Zur Gammafunktion (verallgemeinerte Fakultät)
für große n für n >> 1 Es gilt die asymptotische Formel: Randverteilte Zufallszahlen für n >> 1 Volumenverteilte Zufallszahlen für große n Text
Zur Geometrie der n-dimensionalen Kugel Text
Gradienten Strategie kontra Evolutionsstrategie Für n >> 1 Gradientenstrategie Evolutionsstrategie Text
Motto des Evolutionsstrategen Der Dumme, der einfach losgeht, kommt weiter als der Schlaue, der sitzen bleibt und sich vor lauter Nachdenken nicht entscheiden kann. Motto des Evolutionsstrategen
! ? Optimist Pessimist Der Streit um Darwin und um den Zufall in der Evolution
Ende www.bionik.tu-berlin.de
Wahrscheinlichkeitsrechnung, ganz einfach: Gesucht ist eine Gesamtwahrscheinlichkeit, die sich aus einzelnen bekannten Wahrscheinlichkeiten zusammensetzt. Werden bei der verbalen Formulierung der Aufgabe die einzelnen Wahrscheinlichkeiten durch „und“ verbunden, müssen rechnerisch die Wahrscheinlichkeiten multipliziert werden. Also die Wahrscheinlichkeit mit einem Würfel eine 6 zu würfeln und dann nochmals eine 6 zu würfeln ist 1/6 mal 1/6 = 1/36. Die Wahrscheinlichkeit 3 Mal hintereinander eine 6 zu würfeln ist 1/6 mal 1/6 mal 1/6 = 1/216. Werden bei der verbalen Formulierung der Aufgabe die einzelnen Wahrscheinlichkeiten durch „oder“ verbunden, müssen rechnerisch die Wahrscheinlichkeiten addiert werden. Also die Wahrscheinlichkeit mit einem Würfel 6 Augen oder 5 Augen zu würfeln ist dann 1/6 plus 1/6 = 2/6 = 1/3. Die Wahrscheinlichkeit, eine 6 oder ein 5 oder eine 4 oder eine 3 oder ein 2 oder eine1 zu würfeln ist dann 1/6 +1/6 +1/6 +1/6 +1/6 +1/6 = 1. Die Wahrscheinlichkeit, keine 4 zu würfeln, ist gleich der Wahrscheinlichkeit eine 1 oder eine 2 oder eine 3 oder eine 5 oder eine 6 zu würfeln, und das ist 1/6 +1/6 +1/6 +1/6 +1/6 = 5/6 = 1 -1/6. Die Wahrscheinlichkeit, keine 2 oder keine 3 zu würfeln, ist gleich der Wahrscheinlichkeit eine 1 oder eine 4 oder eine 5 oder eine 6 zu würfeln, und das ist 1/6 + 1/6 + 1/6 + 1/6 = 4/6 = 1 – (eine 2 oder eine 3 zu würfeln) = 1 – (1/6 +1/6) = 1 – 2/6.
Eine sehr wichtige Aussage der Theorie: Zwei völlig verschiedene Verteilungen der Mutationen (gleichmäßig am Kugelrand und gleichmäßig im Kugelvolumen) ergeben für viele Variable n das gleiche Ergebnis. Das heißt, es lohnt sich nicht, über Vor- und Nachteile verschiedener Mutationsverteilungen zu sinnieren.
Das Diagramm zeigt, dass in einer hochdimensionalen Hyperkugel sich das Volumen fast ausschließlich an der Oberfläche der Kugel konzentriert. Das Innere einer Hyperkugel hat nur sehr wenig Volumen. Ein gleichverteilter Zufalls-punkt wird sich deshalb mit großer Wahrscheinlichkeit immer am äußeren Rand der Hyperkugel befinden.
Die Theorie zeigt: Eine planvoll durchdachte Handlungsweise zum Folgen des Gra-dientenweges (Gradientenstrategie) muss nicht notwendigerweise effektiver sein als die Diffusion bergauf durch eine Reihe spontan ausgeführter kleiner Zufalls- schritte. Man muss den Gesamtaufwand sehen. Die Gradientenstrategie benötigt n Vorversuche (genau n+1), die zunächst noch keinen Fortschritt erbringen. Erst nachdem die Informationen gesammelt wurden folgt der eigentliche Arbeitsschritt, der nun allerdings den größtmöglichen Gewinn erbringt. Bei der Evolutionsstrategie ist es umgekehrt. Die Chance für eine großen Gewinn ist bei einem Zufallsschritt gering. Ein kleiner Gewinn tritt aber im Mittel jedes 2. Mal auf. Fazit: Die vielen Hilfsoperationen bei einen ausgeklügelten Strategie können zu einer größeren Verlangsamung des Fortschritts führen als die unvermeidlichen Abweichungen eines Zufallsschrittes (im linearen Fall ist ja jeder 2. Schritt im Mittel erfolgreich) von der optimalen Fortschrittsrichtung