Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Ein entscheidungstheoretischer Ansatz zu Planung, Wahrnehmung und Steuerung Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl4. Dezember 2002.

Ähnliche Präsentationen


Präsentation zum Thema: "Ein entscheidungstheoretischer Ansatz zu Planung, Wahrnehmung und Steuerung Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl4. Dezember 2002."—  Präsentation transkript:

1 Ein entscheidungstheoretischer Ansatz zu Planung, Wahrnehmung und Steuerung Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl4. Dezember 2002

2 Worum es geht... Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Was ist Entscheidungstheorie? Beschäftigt sich mit Entscheidungssituationen Normativ – deskriptiv Anwendungsbeispiel: Intelligente Steuerung Bietet einem Entscheider Hilfestellung, mit der er die Situation, in der er sich befindet, analysieren und zu einer möglichst optimalen Entscheidung kommen kann

3 Worum es geht... Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Intelligente Steuerung Einfache Handlungskette: 1.Messen 2.Auswerten 3.Reagieren Normale KI oft zu sehr eingeschränkt Lösung: reaktive bzw. adaptive Systeme Bayessche Netze

4 Worum es geht... Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Basye, Dean, Kirman und Lejter 1992: Auf Bayesschen Netzen basierendes System Steuerung eines Roboters Verfolgung eines beweglichen Ziels (MTL)

5 Überblick Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bayessche Netze MTL Modell Komplexitätsreduktion und Abstraktionen Ergebnisse Resümee

6 Grundlagen Bayesscher Netze Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bayessches Netz: Graph Knoten aus V: Wahrscheinlichkeitsknoten Kante aus E von A nach B: aus A folgt B Zustands-Wahrscheinlichkeits-Tabelle (CPT) Schattiert: Erkenntnisknoten Mengen der möglichen Zustände: Ω AB P(A=F)P(A=T) anot a AP(B=F)P(B=T) FTFT b1b2b1b2 not b 1 not b 2

7 Wolkig Gras nass RegenSprinkler Grundlagen Bayesscher Netze Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl P(W=F)P(W=T) 0,5 WP(S=F)P(S=T) FTFT 0,5 0,9 0,5 0,1 WP(R=F)P(R=T) FTFT 0,8 0,2 0,8 SRP(N=F)P(N=T) FTFTFTFT FFTTFFTT 1,0 0, ,0 0,9 0,99 Beispiel 1 Erkenntnisknoten N: Das Gras ist nass Abhängig von: Regen Rasensprenger

8 Wolkig Gras nass RegenSprinkler Grundlagen Bayesscher Netze Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl P(W=F)P(W=T) 0,5 WP(S=F)P(S=T) FTFT 0,5 0,9 0,5 0,1 WP(R=F)P(R=T) FTFT 0,8 0,2 0,8 SRP(N=F)P(N=T) FTFTFTFT FFTTFFTT 1,0 0, ,0 0,9 0,99 Beispiel 1 CPT von N: Wahrscheinlichkeit von das Gras ist nass, wenn der Rasensprenger an ist und es nicht regnet ist 0,9

9 Wolkig Gras nass RegenSprinkler Grundlagen Bayesscher Netze Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl P(W=F)P(W=T) 0,5 WP(S=F)P(S=T) FTFT 0,5 0,9 0,5 0,1 WP(R=F)P(R=T) FTFT 0,8 0,2 0,8 SRP(N=F)P(N=T) FTFTFTFT FFTTFFTT 1,0 0, ,0 0,9 0,99 Beispiel 1 Menge der möglichen Werte von N: N=T: das Gras ist nass N=F: das Gras ist trocken

10 Grundlagen Bayesscher Netze Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Beispiel 2 LRLR LTLT OTOT Ausschnitt aus MTL: L R : Standort des Roboters L T : Standort des Ziels O T : Beobachtungen des Roboters über das Ziel LRLR LTLT P(X=1) P(X=2) P(X=3) P(X=4) P(X=5)

11 Grundlagen Bayesscher Netze Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Beispiel 2 LRLR LTLT OTOT Ausschnitt aus MTL: Ω L R = Ω L T = Ω O T = {1,2,3,4,5} Interessante Zustände: L R =4 und L T =2 (Wahrscheinlichkeit 0.36) L R =5 und L T =4 (Wahrscheinlichkeit 0.08) 13 5 LRLR LTLT P(X=1) P(X=2) P(X=3) P(X=4) P(X=5)

12 Grundlagen Bayesscher Netze Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Beispiel 2 LRLR LTLT OTOT Ausschnitt aus MTL: Ω L R = Ω L T = Ω O T = {1,2,3,4,5} Interessante Zustände: L R =4 und L T =2 (Wahrscheinlichkeit 0.36) L R =5 und L T =4 (Wahrscheinlichkeit 0.08) P(O T =2 |L R =4, L T =2 ) = 0.5 P(O T =4 |L R =5, L T =4 ) =

13 Grundlagen Bayesscher Netze Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Beispiel 2 LRLR LTLT OTOT Ausschnitt aus MTL: Ω L R = Ω L T = Ω O T = {1,2,3,4,5} Interessante Zustände: L R =4 und L T =2 (Wahrscheinlichkeit 0.36) L R =5 und L T =4 (Wahrscheinlichkeit 0.08) P(O T =2 |L R =4, L T =2 ) = 0.5 P(O T =4 |L R =5, L T =4 ) =

14 Zeitliche Bayessche Netze Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Zeitliches Bayessches Netz: Diskrete Zeitpunkte Markovsche Eigenschaft LRLR LTLT OTOT T1T1 T2T2 T3T3

15 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Entwicklung eines Modells: Abwägung zwischen Genauigkeit und Effizienz Zuviel Information: System zu langsam Zuwenig Information: System wird zu ungenau Problemstellung: Errechnung des Standorts des Roboters Verfolgung eines beweglichen Ziels

16 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Wichtige Größen: Position des Roboters, des Ziels Sensordaten, die der Roboter bekommt Handlungsspielraum des Roboters LRLR LTLT OTOT OROR ARAR

17 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Knoten: L R : Lokalisation des Roboters auf interner Karte L T : Lokalisation des Ziels auf interner Karte O R : Beobachtungen über Position des Roboters O T : Beobachtungen über Position des Ziels A R : Nächste Aktion des Roboters LRLR LTLT OTOT OROR ARAR

18 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Knoten: Ω L R, Ω L T : Mögliche Lokalisationen (z.B. Kartenstücke) Ω O R : mögliche Sonarsensordaten Ω O T : mögliche visuelle Sensordaten Ω A R : Handlungsspielraum des Roboters (z.B. gehe geradeaus) LRLR LTLT OTOT OROR ARAR

19 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl T1T1 T2T2 T3T3 T4T4 Jetzt LRLR LTLT OTOT OROR ARAR Zeitliche Erweiterung

20 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl T1T1 T2T2 T3T3 T4T4 Jetzt LRLR LTLT O ARAR Vereinfacht Ω O = Ω O R x Ω O T

21 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Auswertung T1T1 T2T2 Jetzt LRLR LTLT O ARAR Auswertung des Netzes:

22 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Auswertung T1T1 T2T2 Jetzt LRLR LTLT O ARAR ?a ?? ?b Auswertung des Netzes: Zu Beginn werden die Knoten mit Randwerten gefüllt

23 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Auswertung T1T1 T2T2 Jetzt LRLR LTLT O ARAR ?a ?? ?b Auswertung des Netzes: 1.A R (1) ist mit der ausgewählten Aktion instantiiert.

24 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Auswertung T1T1 T2T2 Jetzt LRLR LTLT O ARAR ?a ?? ?b Auswertung des Netzes: 1.A R (1) ist mit der ausgewählten Aktion instantiiert. 2.Die Aktion wird ausgeführt und Sensordaten werden gesammelt.

25 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Auswertung T1T1 T2T2 Jetzt LRLR LTLT O ARAR ?a o? ?b Auswertung des Netzes: 1.A R (1) ist mit der ausgewählten Aktion instantiiert. 2.Die Aktion wird ausgeführt und Sensordaten werden gesammelt. 3.Die gesammelten Daten werden genutzt um O(1) zu instantiieren.

26 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Auswertung T1T1 T2T2 Jetzt LRLR LTLT O ARAR ?a o? ?b Auswertung des Netzes: 1.A R (1) ist mit der ausgewählten Aktion instantiiert. 2.Die Aktion wird ausgeführt und Sensordaten werden gesammelt. 3.Die gesammelten Daten werden genutzt um O(1) zu instantiieren. 4.Die Wahrscheinlichkeiten werden aktualisiert.

27 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Auswertung T1T1 T2T2 Jetzt LRLR LTLT O ARAR ca o? eb Auswertung des Netzes: 1.A R (1) ist mit der ausgewählten Aktion instantiiert. 2.Die Aktion wird ausgeführt und Sensordaten werden gesammelt. 3.Die gesammelten Daten werden genutzt um O(1) zu instantiieren. 4.Die Wahrscheinlichkeiten werden aktualisiert. 5.Die Nachfolger von L R (1) und L T (1) werden errechnet.

28 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Auswertung T2T2 T3T3 Jetzt LRLR LTLT O ARAR ?c ?? ?e Auswertung des Netzes: 1.A R (1) ist mit der ausgewählten Aktion instantiiert. 2.Die Aktion wird ausgeführt und Sensordaten werden gesammelt. 3.Die gesammelten Daten werden genutzt um O(1) zu instantiieren. 4.Die Wahrscheinlichkeiten werden aktualisiert. 5.Die Nachfolger von L R (1) und L T (1) werden errechnet. 6.Die Knoten werden in die Vergangenheit geschoben und der Prozess beginnt von vorne.

29 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bewertungsfunktion Funktion zur Bewertung einer Situation: Im Idealfall: 1. Handlungskette für Roboter vorgeben. 2. Reaktionen des Ziels überlegen. 3. Daraus Situation konstruieren und bewerten. Verhalten des Ziels kann nicht gemessen werden. Beobachtungen des Roboters werden verwendet. Situation wird anhand der Beobachtung und der Wahrscheinlichkeit sie zu machen bewertet.

30 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bewertungsfunktion Funktion zur Bewertung einer Situation: s ist eine Handlungskette u und v sind mögliche Positionen des Ziels t ist ein Zeitpunkt bedeutet, der Knoten X hat zur Zeit t den Wert x

31 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bewertungsfunktion Funktion zur Bewertung einer Situation: Abstand zwischen Position u und v s ist eine Handlungskette u und v sind mögliche Positionen des Ziels t ist ein Zeitpunkt bedeutet, der Knoten X hat zur Zeit t den Wert x

32 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bewertungsfunktion Funktion zur Bewertung einer Situation: Wahrscheinlichkeit, dass das Ziel auf Position v ist s ist eine Handlungskette u und v sind mögliche Positionen des Ziels t ist ein Zeitpunkt bedeutet, der Knoten X hat zur Zeit t den Wert x

33 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bewertungsfunktion Funktion zur Bewertung einer Situation: Wahrscheinlicher Fehler für eine Position u s ist eine Handlungskette u und v sind mögliche Positionen des Ziels t ist ein Zeitpunkt bedeutet, der Knoten X hat zur Zeit t den Wert x

34 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bewertungsfunktion Funktion zur Bewertung einer Situation: Ermittelt den minimalen Fehler s ist eine Handlungskette u und v sind mögliche Positionen des Ziels t ist ein Zeitpunkt bedeutet, der Knoten X hat zur Zeit t den Wert x

35 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bewertungsfunktion Funktion zur Bewertung einer Situation: Beschreibt den Wert gegebener Handlungsketten und Beobachtungen des Roboters.

36 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bewertungsfunktion II Funktion zur Bewertung einer Handlungskette: Misst den Wert einer Handlungskette, wenn sie für die nächsten n Zeitschritte ausgeführt wird, wobei n die Länge der Sequenz ist.

37 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Bewertungsfunktion III Gewichtete Bewertung einer Handlungskette: Die Funktion γ spezifiziert das Gewicht zukünftiger Werte. Dabei wird der Einfluss späterer Konsequenzen herabgesetzt.

38 Das MTL Modell Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Problem Wegen der hohen Komplexität sind die Funktionen nur für triviale Fälle anwendbar. Komplexitätsreduktion

39 Komplexitätsreduktion und Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Möglichkeiten für Komplexitätsreduktion: Diskretheit der Bewertungsfunktion erlaubt branch and bound Algorithmen und dynamische Programmierung. Dynamische Verkleinerung des Bereichs der räumlichen Variablen. Bibliotheken von Handlungssequenzen, dynamische Reduktion von Möglichkeiten für Aktionen. Anpassung der räumlichen Repräsentation an sensorische Fähigkeiten des Roboters. Berücksichtigung von indirekten Beobachtungen. Sinnvolle Abstraktionen.

40 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Abstraktion: Aufteilung eines Zustandsraums in eine diskrete Wertemenge. Abwägung: Zu geringe Genauigkeit => Keine Basis für vernünftige Entscheidung Zu große Wertemenge => zu hohe Berechnungskosten Abstraktionsmöglichkeiten: Lokalisationsabstraktion Sensorabstraktion Aktionsabstraktion

41 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Lokalisation: Repräsentation von nicht direkt messbaren, räumlichen Aspekten. Position des Roboters lässt sich aus Sensordaten und Abschätzungen über die alte Position herleiten. Lokalisationsknoten hängen von vorhergehenden Lokalisationsknoten, Sensorknoten und Aktionsknoten ab. Wichtigste Informationen kommen von Sensoren. Lokalisationsabstraktion

42 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Lokalisationsabstraktion Aufteilung der Gangfläche:

43 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Lokalisationsabstraktion Aufteilung der Gangfläche: Zu genaue Aufteilung: Hohe Berechnungskosten Genaue Positionierung durch die Sensoren nicht möglich

44 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Lokalisationsabstraktion Aufteilung der Gangfläche: Zu grobe Aufteilung: Verschwendung von Sensorinformationen. Daten über Position ungenügend.

45 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Lokalisationsabstraktion Aufteilung der Gangfläche: Vernünftige Aufteilung: Aufteilung in Gänge und Kreuzungen. Für Roboterlokalisation wird jede Region in vier Quadranten aufgeteilt.

46 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Sensoren: Sensorknoten sind Schnittstelle zwischen der äußeren Welt und dem Modell. Die rohen Sensordaten liegen normalerweise in einem zu großen Wertebereich. Die Sensordaten müssen auf den Beobachtungsraum abgebildet werden. Sensorabstraktion Sensoren im Modell: 8 Sonarsensoren, die Werte zwischen 30 und 5999 Millimetern liefern. Eine einfache Kamera zur für die Zielortung.

47 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Sensorabstraktion Abbildungsart der Messung auf den abstrakten Sensorraum: Deterministisch: Für einen Bereich von rohen Sensordaten wird ein abstrakter Wert gesetzt. Probabilistisch: Für gegebene Sensordaten wird eine Wahrscheinlichkeitsverteilung über den abstrakten Werten angegeben. Gemessene Werte bei Einfahrt in eine T-Verzweigung

48 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Sensorabstraktion Abbildungsmethode der Messung auf den abstrakten Sensorraum: Experimentell: Sensordaten werden in vielen Situationen gemessen und danach abstrakt beschrieben. Heuristisch: Wissen über Sensoren und Welt wird genutzt um die Abbildung direkt zu spezifizieren. Gemessene Werte bei Einfahrt in eine T-Verzweigung

49 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Aktionen: Anzahl der vom Roboter ausführbaren Aktionen ist |Ω A |. Kosten der Entscheidung über die nächste Handlungskette ist proportional zu |Ω A | h (h ist die Tiefe des Ereignishorizonts). Reduktion der Größe von Ω A bringt viel Kostenersparnis. Anzahl von Aktionen kann durch Einführung von komplexen Handlungen erreicht werden. Aktionsabstraktion

50 Abstraktionen Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Beispiel: Simple Handlungen: ein cm nach vorne ein Grad nach links Komplexere Handlungen: Gang entlang gehen nächste Kreuzung links Nachteil: Gehen nicht auf Einflüsse aus der Umwelt ein und werden so bei Veränderungen evtl. sinnlos. Aktionsabstraktion Im MTL Problem: Handlungen sind der räumliche Repräsentation angepasst. Aktionen: Gang entlang, in oder aus Kreuzung fahren. Unpassende Handlungen werden nicht in die Bewertung aufgenommen.

51 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Testlauf: Modell wurde in kleinen, mobilen Roboter gebaut.

52 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Testlauf: Modell wurde in kleinen, mobilen Roboter gebaut. Modellwelt besteht aus zwei T-Verzweigungen und Verbindungsgängen

53 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Testlauf: Grauschattierungen spiegeln die Annahmen des Roboters über den Aufenthaltsort des Ziels wieder Das Ziel ist mit Wahrscheinlichkeit in dieser Region hoherniedriger

54 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Der Roboter fängt ohne Informationen über die Position des Ziels an. Deshalb macht er zunächst nichts. Stehen bleiben Zeitschritt: 1

55 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Nach einem Zeitschritt sieht er das Ziel in einem Korridor. Da er sich durch Aktionen keinen Erkenntnisgewinn errechnet bleibt er weiter stehen. Stehen bleiben Zeitschritt: 2

56 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Das Ziel geht nach links, ist aber immer noch sichtbar. Stehen bleiben Zeitschritt: 3

57 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Das Ziel geht weiter, der Roboter kann es aber noch mit genügender Sicherheit orten. Stehen bleiben Zeitschritt: 4

58 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Der Sichtkontakt bricht ab, deshalb sieht sich der Roboter genötigt, dem Ziel zu folgen. Geradeaus gehen Zeitschritt: 5

59 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Er dreht sich in die Richtung, in der er das Ziel vermutet. Nach links drehen Zeitschritt: 6

60 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Er sieht das Ziel wieder. Um genauere Daten zu erhalten entscheidet er sich dafür, das Ziel zu verfolgen. Geradeaus gehen Zeitschritt: 7

61 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Er entscheidet sich dafür, möglichst nahe am Ziel zu bleiben, um es nicht zu verlieren. Geradeaus gehen Zeitschritt: 8

62 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Er verfolgt das Ziel weiter. Geradeaus gehen Zeitschritt: 9

63 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Er weis nicht in welche Richtung das Ziel gegangen ist und denkt zunächst, es ist an ihm vorbei zurück in den Gang geschlüpft. Umdrehen Zeitschritt: 10

64 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Nachdem er das Ziel im Gang nicht findet, überprüft er die beiden Abzweigungen. Nach links drehen Zeitschritt: 11

65 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Testlauf Mit sicher geortetem Ziel bleibt er wieder stehen. Stehen bleiben Zeitschritt: 12

66 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Unerwartetes Verhalten in entscheidungstheoretischen Modellen: Entwickler stellen nur Erwartungen, Aktionen und Dienstprogramme zur Verfügung. Verhalten resultiert aus Suche nach bester Lösung. Es treten unvorhergesehene Verhaltensweisen auf.

67 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Situation 1: Das Ziel steht an einer Verzweigung. Erwartetes Verhalten: Der Roboter versucht nahe am Ziel zu bleiben, um festzustellen, welche Abzweigung das Ziel nimmt.

68 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Situation 1: Das Ziel steht an einer Verzweigung. Erwartetes Verhalten: Der Roboter versucht nahe am Ziel zu bleiben, um festzustellen, welche Abzweigung das Ziel nimmt. Resultat: Der Roboter verhält sich wie erwartet.

69 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Situation 2: Das Ziel steht an einer abbiegenden Sackgasse. Erwartetes Verhalten: Der Roboter versucht nahe am Ziel zu bleiben, um zu sehen, ob es um die Ecke geht.

70 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Situation 2: Das Ziel steht an einer abbiegenden Sackgasse. Erwartetes Verhalten: Der Roboter versucht nahe am Ziel zu bleiben, um zu sehen, ob es um die Ecke geht. Resultat: Der Roboter hält einen großzügigen Abstand zum Ziel. ?

71 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter bleibt nahe am Ziel. Mögliches Verhalten des Ziels:

72 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter bleibt nahe am Ziel. Mögliches Verhalten des Ziels: 1.Es geht in die Sackgasse.

73 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter bleibt nahe am Ziel. Mögliches Verhalten des Ziels: 1.Es geht in die Sackgasse. 2.Es geht vorbei am Roboter in den Gang. Nicht gut!

74 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter hält Abstand vom Ziel. Mögliches Verhalten des Ziels:

75 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter hält Abstand vom Ziel. Mögliches Verhalten des Ziels: 1.Es geht in die Sackgasse.

76 Ergebnisse Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter hält Abstand vom Ziel. Mögliches Verhalten des Ziels: 1.Es geht in die Sackgasse. 2.Es geht in den Gang

77 Resümee Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Vorteile von Entscheidungstheorie und Bayesschen Netzen: Unsicherheit: Entscheidungstheorie und Bayessche Netze sind ein natürlicher Ansatz für KI Systeme. Eindeutigkeit: Die Annahmen, die in diesem Ansatz gemacht werden, um Wissen wiederzuspiegeln, sind explizit und klar. Entwicklung: Entscheidungstheorie und Wahrscheinlichkeitstheorie sind gut entwickelt. Einfachheit: Bayessche Netze sind einfach zu erstellen, benutzen und analysieren.

78 Resümee Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl Und jetzt? Ihre Vorteile haben zur Verbreitung von Entscheidungstheorie und Bayesschen Netzen beigetragen. Es existiert ein breites Anwendungsfeld. Kleines Beispiel: Der Microsoft Office Assistent stützt sich auf Bayessche Netze

79 Weitere Infos: Vielen Dank für Ihre Aufmerksamkeit Hauptseminar Echtzeitsysteme WS 2002/2003Tilmann Rabl


Herunterladen ppt "Ein entscheidungstheoretischer Ansatz zu Planung, Wahrnehmung und Steuerung Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl4. Dezember 2002."

Ähnliche Präsentationen


Google-Anzeigen