Hauptseminar Echtzeitsysteme WS 2002/2003

Slides:

Advertisements

Ähnliche Präsentationen

Vorgehensmodell & Wasserfallmodell in der Programmierung

Advertisements

Routing – Routing Protokolle

WR + WS ZEIGEN Neues aus der Mathematik.

Projektumfeld Gesellschaftliche Strömungen Strukturen/ Gliederung

R. Der - Vorlesung Algorithmen und Datenstrukturen (Magister)

Genetische Algorithmen für die Variogrammanpassung

Kapitel 4 Datenstrukturen

Algorithmen und Komplexität Teil 1: Grundlegende Algorithmen

Verifizieren versus Berechnen

Theorie psychometrischer Tests, III

Heuristiken und Kontexteinflüsse

Zeitliches probabilistisches Schließen

Lernende Agenten Seminar Softwareagenten Wintersemester 2001/2002 Norman Neuhaus.

Praktikum Mobile Roboter

Genetische Algorithmen

Reinforcement Learning

Erkennung von Gesichtsausdrücken anhand von Bildbewegungen (Irfan Essa & Alex Pentland) Hauptseminar Smart Environments Joachim Biggel

Algorithmen und Komplexität

Was sind Histogramme? (1)

Theorie soziotechnischer Systeme – 12 Thomas Herrmann Informatik und Gesellschaft FB Informatik Universität Dortmund iundg.cs.uni-dortmund.de.

Heute: Scherenzange zeichnen

Rationales Entscheiden

Computergrafik – Inhalt Achtung! Kapitel ist relevant für CG-2!

Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/

Lommy® SAFE Individuelles Überwachen von Fahrzeugen und Gütern.

EXCEL PROFESSIONAL KURS

Endliche Automaten Informatik JgSt. 13, Abitur 2009

Design and analysis of GUI test-case prioritization using weight-based methods Samra Khan.

Moin. Ich benutze PPT 2002 und möchte drei Bilder nacheinander 1

Tormann Lorenz Maierhofer Die Test-Umgebung Tor: 5x Roboter-Durchmesser Ball: Wird jeweils in Richtung einer zufälligen Position im Tor geschossen.

Abschlussvortrag zur Studienarbeit

Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie II (Teil I): Simulation und 3D Programmierung Prof.

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Effiziente Algorithmen

Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/ /23.1.

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS

Hartmut Klauck Universität Frankfurt SS

Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/

Information und Kommunikation Hartmut Klauck Universität Frankfurt SS

Dr. Rolf Haenni, University of KonstanzNovember 28, 2002 Page 1/15 Aspekte eine echten Informationstheorie 1.Einführung 2.Informationsalgebren 3.Unsicherheit.

Wie findet ein Roboter den Weg aus einem Labyrinth?

… oder wie finde ich den Weg

Elternwerkstatt 4. Abend

Grundlagen der Informatik - Prof. Slany 1 Grundlagen der Informatik Prof. Wolfgang SLANY.

Wie viele Beine hat dieser Elefant?

Wunsch Werkzeug Aufgabe & Modell Vorgehen Resultat Zukunft Machine Learning zur Steigerung der Usability Steigerung der Usability.

Die ersten Schritte bei der Entdeckung der Statistik

Berechenbares Chaos - unvorhersehbare Wirklichkeit

Das Traveling Salesman Problem (TSP)

Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation III Vorlesung 1 WS 2001/02 Punkt-in-Landkarte I (Streifenkarte)

Mehrbenutzerzugriff auf GIS-Daten

Grammatikalische Begriffe im Unterricht

HEINZ NIXDORF INSTITUT Universität Paderborn Fachbereich Mathematik/Informatik Algorithmische Probleme in Funknetzwerken VIII Christian Schindelhauer

Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie II (Teil I): Simulation und 3D Programmierung Prof.

Routenplanung querfeldein - Geometric Route Planning

Grundlagen der Positionsbestimmung mit Partikelfiltern

Wann ist eine Funktion (über den natürlichen Zahlen) berechenbar?

Gliederung der Vorlesung

Der Wiener Prozess und seltene Ereignisse

Geoinformationssysteme

Einführung Die nachfolgende Präsentation dient dem besseren Verständnis der taktischen Grundlagen bei Integration eines Läufersystem in den Spielablauf.

- ANALYSE DES PFLICHTSPIELS VC³ - AUSWERTUNG DER ERFAHRUNGSBERICHTE - NEUERUNGEN.

Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 3 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.

Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.

 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.

Rechen- und Kommunikationszentrum (RZ) Selektionsstrategien auf Graphstrukturen Sven Porsche Seminarvorträge Aachen.

Präsentation transkript:

Hauptseminar Echtzeitsysteme WS 2002/2003 Ein entscheidungstheoretischer Ansatz zu Planung, Wahrnehmung und Steuerung 4. Dezember 2002 Tilmann Rabl

Worum es geht... Was ist Entscheidungstheorie? Beschäftigt sich mit Entscheidungssituationen Normativ – deskriptiv Anwendungsbeispiel: Intelligente Steuerung „Bietet einem Entscheider Hilfestellung, mit der er die Situation, in der er sich befindet, analysieren und zu einer möglichst optimalen Entscheidung kommen kann“ Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Worum es geht... Bayessche Netze Intelligente Steuerung Einfache Handlungskette: Messen Auswerten Reagieren Normale KI oft zu sehr eingeschränkt Lösung: reaktive bzw. adaptive Systeme Bayessche Netze Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Worum es geht... Basye, Dean, Kirman und Lejter 1992: Auf Bayesschen Netzen basierendes System Steuerung eines Roboters Verfolgung eines beweglichen Ziels (MTL) Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Überblick Bayessche Netze MTL Modell Komplexitätsreduktion und Abstraktionen Ergebnisse Resümee Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Grundlagen Bayesscher Netze Bayessches Netz: Graph Knoten aus V: Wahrscheinlichkeitsknoten Kante aus E von A nach B: aus A folgt B Zustands-Wahrscheinlichkeits-Tabelle (CPT) Schattiert: Erkenntnisknoten Mengen der möglichen Zustände: Ω P(A=F) P(A=T) a not a A B A P(B=F) P(B=T) F T b1 b2 not b1 not b2 Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Grundlagen Bayesscher Netze Beispiel 1 P(W=F) P(W=T) 0,5 Wolkig W P(S=F) P(S=T) F T 0,5 0,9 0,1 W P(R=F) P(R=T) F T 0,8 0,2 Sprinkler Regen Erkenntnisknoten N: „Das Gras ist nass“ Abhängig von: Regen Rasensprenger Gras nass S R P(N=F) P(N=T) F T 1,0 0,1 0.01 0,0 0,9 0,99 Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Grundlagen Bayesscher Netze Beispiel 1 P(W=F) P(W=T) 0,5 Wolkig W P(S=F) P(S=T) F T 0,5 0,9 0,1 W P(R=F) P(R=T) F T 0,8 0,2 Sprinkler Regen CPT von N: Wahrscheinlichkeit von „das Gras ist nass, wenn der Rasensprenger an ist und es nicht regnet“ ist 0,9 Gras nass S R P(N=F) P(N=T) F T 1,0 0,1 0.01 0,0 0,9 0,99 Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Grundlagen Bayesscher Netze Beispiel 1 P(W=F) P(W=T) 0,5 Wolkig W P(S=F) P(S=T) F T 0,5 0,9 0,1 W P(R=F) P(R=T) F T 0,8 0,2 Sprinkler Regen Gras nass Menge der möglichen Werte von N: N=T: „das Gras ist nass“ N=F: „das Gras ist trocken“ S R P(N=F) P(N=T) F T 1,0 0,1 0.01 0,0 0,9 0,99 Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Grundlagen Bayesscher Netze Beispiel 2 Ausschnitt aus MTL: LR: Standort des Roboters LT: Standort des Ziels OT: Beobachtungen des Roboters über das Ziel LR LT 1 3 5 LR LT P(X=1) P(X=2) P(X=3) P(X=4) P(X=5) 0.6 0.4 0.1 0.2 OT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Grundlagen Bayesscher Netze Beispiel 2 Ausschnitt aus MTL: ΩLR= ΩLT= ΩOT = {1,2,3,4,5} Interessante Zustände: LR=4 und LT=2 (Wahrscheinlichkeit 0.36) LR=5 und LT=4 (Wahrscheinlichkeit 0.08) LR LT 1 3 5 LR LT P(X=1) P(X=2) P(X=3) P(X=4) P(X=5) 0.6 0.4 0.1 0.2 OT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Grundlagen Bayesscher Netze Beispiel 2 Ausschnitt aus MTL: ΩLR= ΩLT= ΩOT = {1,2,3,4,5} Interessante Zustände: LR=4 und LT=2 (Wahrscheinlichkeit 0.36) LR=5 und LT=4 (Wahrscheinlichkeit 0.08) LR LT 1 3 5 P(OT=2 |LR =4, LT =2 ) = 0.5 P(OT=4 |LR =5, LT =4 ) = 0.2 OT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Grundlagen Bayesscher Netze Beispiel 2 Ausschnitt aus MTL: ΩLR= ΩLT= ΩOT = {1,2,3,4,5} Interessante Zustände: LR=4 und LT=2 (Wahrscheinlichkeit 0.36) LR=5 und LT=4 (Wahrscheinlichkeit 0.08) LR LT 1 2 3 P(OT=2 |LR =4, LT =2 ) = 0.5 P(OT=4 |LR =5, LT =4 ) = 0.2 OT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Zeitliche Bayessche Netze Zeitliches Bayessches Netz: Diskrete Zeitpunkte Markovsche Eigenschaft T1 T2 T3 LR OT LT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Entwicklung eines Modells: Problemstellung: Abwägung zwischen Genauigkeit und Effizienz Zuviel Information: System zu langsam Zuwenig Information: System wird zu ungenau Problemstellung: Errechnung des Standorts des Roboters Verfolgung eines beweglichen Ziels Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Wichtige Größen: Position des Roboters, des Ziels Sensordaten, die der Roboter bekommt Handlungsspielraum des Roboters LR LT OT OR AR Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Knoten: LR : Lokalisation des Roboters auf interner Karte LT : Lokalisation des Ziels auf interner Karte OR : Beobachtungen über Position des Roboters OT : Beobachtungen über Position des Ziels AR : Nächste Aktion des Roboters LR LT OT OR AR Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Knoten: ΩLR, ΩLT : Mögliche Lokalisationen (z.B. Kartenstücke) ΩOR : mögliche Sonarsensordaten ΩOT : mögliche visuelle Sensordaten ΩAR : Handlungsspielraum des Roboters (z.B. „gehe geradeaus“) AR LR OR OT LT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Zeitliche Erweiterung Jetzt T1 T2 T3 T4 AR LR OR OT LT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Vereinfacht ΩO = ΩOR x ΩOT Jetzt T1 T2 T3 T4 AR LR O LT ΩO = ΩOR x ΩOT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Auswertung Auswertung des Netzes: Jetzt LR LT O AR Auswertung des Netzes: Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Auswertung Auswertung des Netzes: Jetzt T1 T2 Auswertung des Netzes: Zu Beginn werden die Knoten mit Randwerten gefüllt AR LR a ? O ? ? b ? LT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Auswertung Auswertung des Netzes: Jetzt T1 T2 Auswertung des Netzes: AR(1) ist mit der ausgewählten Aktion instantiiert. AR LR a ? O ? ? b ? LT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Auswertung Auswertung des Netzes: Jetzt T1 T2 Auswertung des Netzes: AR(1) ist mit der ausgewählten Aktion instantiiert. Die Aktion wird ausgeführt und Sensordaten werden gesammelt. AR LR a ? O ? ? b ? LT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Auswertung Auswertung des Netzes: Jetzt T1 T2 Auswertung des Netzes: AR(1) ist mit der ausgewählten Aktion instantiiert. Die Aktion wird ausgeführt und Sensordaten werden gesammelt. Die gesammelten Daten werden genutzt um O(1) zu instantiieren. AR LR a ? O o ? b ? LT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Auswertung Auswertung des Netzes: Jetzt T1 T2 Auswertung des Netzes: AR(1) ist mit der ausgewählten Aktion instantiiert. Die Aktion wird ausgeführt und Sensordaten werden gesammelt. Die gesammelten Daten werden genutzt um O(1) zu instantiieren. Die Wahrscheinlichkeiten werden aktualisiert. AR LR a‘ ? O o ? b‘ ? LT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Auswertung Auswertung des Netzes: Jetzt T1 T2 Auswertung des Netzes: AR(1) ist mit der ausgewählten Aktion instantiiert. Die Aktion wird ausgeführt und Sensordaten werden gesammelt. Die gesammelten Daten werden genutzt um O(1) zu instantiieren. Die Wahrscheinlichkeiten werden aktualisiert. Die Nachfolger von LR(1) und LT(1) werden errechnet. AR LR a‘ c O o ? b‘ e LT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Auswertung Auswertung des Netzes: Jetzt T2 T3 Auswertung des Netzes: AR(1) ist mit der ausgewählten Aktion instantiiert. Die Aktion wird ausgeführt und Sensordaten werden gesammelt. Die gesammelten Daten werden genutzt um O(1) zu instantiieren. Die Wahrscheinlichkeiten werden aktualisiert. Die Nachfolger von LR(1) und LT(1) werden errechnet. Die Knoten werden in die Vergangenheit geschoben und der Prozess beginnt von vorne. AR LR c ? O ? ? e ? LT Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Bewertungsfunktion Funktion zur Bewertung einer Situation: Im Idealfall: Handlungskette für Roboter vorgeben. Reaktionen des Ziels überlegen. Daraus Situation konstruieren und bewerten. Verhalten des Ziels kann nicht gemessen werden. Beobachtungen des Roboters werden verwendet. Situation wird anhand der Beobachtung und der Wahrscheinlichkeit sie zu machen bewertet. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Bewertungsfunktion Funktion zur Bewertung einer Situation: s ist eine Handlungskette u und v sind mögliche Positionen des Ziels t ist ein Zeitpunkt bedeutet, der Knoten X hat zur Zeit t den Wert x Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Bewertungsfunktion Funktion zur Bewertung einer Situation: Abstand zwischen Position u und v s ist eine Handlungskette u und v sind mögliche Positionen des Ziels t ist ein Zeitpunkt bedeutet, der Knoten X hat zur Zeit t den Wert x Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Wahrscheinlichkeit, dass das Das MTL Modell Bewertungsfunktion Funktion zur Bewertung einer Situation: Wahrscheinlichkeit, dass das Ziel auf Position v ist s ist eine Handlungskette u und v sind mögliche Positionen des Ziels t ist ein Zeitpunkt bedeutet, der Knoten X hat zur Zeit t den Wert x Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Wahrscheinlicher Fehler für eine Position u Das MTL Modell Bewertungsfunktion Funktion zur Bewertung einer Situation: Wahrscheinlicher Fehler für eine Position u s ist eine Handlungskette u und v sind mögliche Positionen des Ziels t ist ein Zeitpunkt bedeutet, der Knoten X hat zur Zeit t den Wert x Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Bewertungsfunktion Funktion zur Bewertung einer Situation: Ermittelt den minimalen Fehler s ist eine Handlungskette u und v sind mögliche Positionen des Ziels t ist ein Zeitpunkt bedeutet, der Knoten X hat zur Zeit t den Wert x Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Bewertungsfunktion Funktion zur Bewertung einer Situation: Beschreibt den Wert gegebener Handlungsketten und Beobachtungen des Roboters. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Bewertungsfunktion II Funktion zur Bewertung einer Handlungskette: Misst den Wert einer Handlungskette, wenn sie für die nächsten n Zeitschritte ausgeführt wird, wobei n die Länge der Sequenz ist. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das MTL Modell Bewertungsfunktion III Gewichtete Bewertung einer Handlungskette: Die Funktion γ spezifiziert das Gewicht zukünftiger Werte. Dabei wird der Einfluss späterer Konsequenzen herabgesetzt. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Komplexitätsreduktion Das MTL Modell Problem Wegen der hohen Komplexität sind die Funktionen nur für triviale Fälle anwendbar. Komplexitätsreduktion Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Komplexitätsreduktion und Abstraktionen Möglichkeiten für Komplexitätsreduktion: Diskretheit der Bewertungsfunktion erlaubt branch and bound Algorithmen und dynamische Programmierung. Dynamische Verkleinerung des Bereichs der räumlichen Variablen. Bibliotheken von Handlungssequenzen, dynamische Reduktion von Möglichkeiten für Aktionen. Anpassung der räumlichen Repräsentation an sensorische Fähigkeiten des Roboters. Berücksichtigung von indirekten Beobachtungen. Sinnvolle Abstraktionen. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Abstraktion: Abstraktionsmöglichkeiten: Aufteilung eines Zustandsraums in eine diskrete Wertemenge. Abwägung: Zu geringe Genauigkeit => Keine Basis für vernünftige Entscheidung Zu große Wertemenge => zu hohe Berechnungskosten Abstraktionsmöglichkeiten: Lokalisationsabstraktion Sensorabstraktion Aktionsabstraktion Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Lokalisationsabstraktion Lokalisation: Repräsentation von nicht direkt messbaren, räumlichen Aspekten. Position des Roboters lässt sich aus Sensordaten und Abschätzungen über die alte Position herleiten. Lokalisationsknoten hängen von vorhergehenden Lokalisationsknoten, Sensorknoten und Aktionsknoten ab. Wichtigste Informationen kommen von Sensoren. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Lokalisationsabstraktion Aufteilung der Gangfläche: Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Lokalisationsabstraktion Zu genaue Aufteilung: Aufteilung der Gangfläche: Zu genaue Aufteilung: Hohe Berechnungskosten Genaue Positionierung durch die Sensoren nicht möglich Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Lokalisationsabstraktion Zu grobe Aufteilung: Aufteilung der Gangfläche: Zu grobe Aufteilung: Verschwendung von Sensorinformationen. Daten über Position ungenügend. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Lokalisationsabstraktion Vernünftige Aufteilung: Aufteilung der Gangfläche: Vernünftige Aufteilung: Aufteilung in Gänge und Kreuzungen. Für Roboterlokalisation wird jede Region in vier Quadranten aufgeteilt. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Sensorabstraktion Sensoren: Sensoren im Modell: Sensorknoten sind Schnittstelle zwischen der äußeren Welt und dem Modell. Die rohen Sensordaten liegen normalerweise in einem zu großen Wertebereich. Die Sensordaten müssen auf den Beobachtungsraum abgebildet werden. Sensoren im Modell: 8 Sonarsensoren, die Werte zwischen 30 und 5999 Millimetern liefern. Eine einfache Kamera zur für die Zielortung. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Sensorabstraktion 523 531 Gemessene Werte bei Einfahrt in eine T-Verzweigung 5999 5999 227 233 5999 5999 Abbildungsart der Messung auf den abstrakten Sensorraum: Deterministisch: Für einen Bereich von rohen Sensordaten wird ein abstrakter Wert gesetzt. Probabilistisch: Für gegebene Sensordaten wird eine Wahrscheinlichkeitsverteilung über den abstrakten Werten angegeben. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Sensorabstraktion 523 531 Gemessene Werte bei Einfahrt in eine T-Verzweigung 5999 5999 227 233 5999 5999 Abbildungsmethode der Messung auf den abstrakten Sensorraum: Experimentell: Sensordaten werden in vielen Situationen gemessen und danach abstrakt beschrieben. Heuristisch: Wissen über Sensoren und Welt wird genutzt um die Abbildung direkt zu spezifizieren. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Aktionsabstraktion Aktionen: Anzahl der vom Roboter ausführbaren Aktionen ist |ΩA|. Kosten der Entscheidung über die nächste Handlungskette ist proportional zu |ΩA|h (h ist die Tiefe des Ereignishorizonts). Reduktion der Größe von ΩA bringt viel Kostenersparnis. Anzahl von Aktionen kann durch Einführung von komplexen Handlungen erreicht werden. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Abstraktionen Aktionsabstraktion Beispiel: Im MTL Problem: Simple Handlungen: „ein cm nach vorne“ „ein Grad nach links“ Komplexere Handlungen: „Gang entlang gehen“ „nächste Kreuzung links“ Nachteil: Gehen nicht auf Einflüsse aus der Umwelt ein und werden so bei Veränderungen evtl. sinnlos. Im MTL Problem: Handlungen sind der räumliche Repräsentation angepasst. Aktionen: Gang entlang, in oder aus Kreuzung fahren. Unpassende Handlungen werden nicht in die Bewertung aufgenommen. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Testlauf Testlauf: Modell wurde in kleinen, mobilen Roboter gebaut. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Testlauf Testlauf: Modell wurde in kleinen, mobilen Roboter gebaut. Modellwelt besteht aus zwei T-Verzweigungen und Verbindungsgängen Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Testlauf Testlauf: Grauschattierungen spiegeln die Annahmen des Roboters über den Aufenthaltsort des Ziels wieder Das Ziel ist mit Wahrscheinlichkeit in dieser Region hoher niedriger Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Testlauf Zeitschritt: 1 Stehen bleiben Der Roboter fängt ohne Informationen über die Position des Ziels an. Deshalb macht er zunächst nichts. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Nach einem Zeitschritt sieht er das Ziel in einem Korridor. Ergebnisse Testlauf Zeitschritt: 2 Stehen bleiben Nach einem Zeitschritt sieht er das Ziel in einem Korridor. Da er sich durch Aktionen keinen Erkenntnisgewinn errechnet bleibt er weiter stehen. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Das Ziel geht nach links, ist aber immer noch sichtbar. Ergebnisse Testlauf Zeitschritt: 3 Stehen bleiben Das Ziel geht nach links, ist aber immer noch sichtbar. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Testlauf Zeitschritt: 4 Stehen bleiben Das Ziel geht weiter, der Roboter kann es aber noch mit genügender Sicherheit orten. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Der Sichtkontakt bricht ab, deshalb sieht sich der Roboter genötigt, Ergebnisse Testlauf Zeitschritt: 5 Geradeaus gehen Der Sichtkontakt bricht ab, deshalb sieht sich der Roboter genötigt, dem Ziel zu folgen. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Er dreht sich in die Richtung, in der er das Ziel vermutet. Ergebnisse Testlauf Zeitschritt: 6 Nach links drehen Er dreht sich in die Richtung, in der er das Ziel vermutet. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Testlauf Zeitschritt: 7 Geradeaus gehen Er sieht das Ziel wieder. Um genauere Daten zu erhalten entscheidet er sich dafür, das Ziel zu verfolgen. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Testlauf Zeitschritt: 8 Geradeaus gehen Er entscheidet sich dafür, möglichst nahe am Ziel zu bleiben, um es nicht zu verlieren. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Er verfolgt das Ziel weiter. Ergebnisse Testlauf Zeitschritt: 9 Geradeaus gehen Er verfolgt das Ziel weiter. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Testlauf Zeitschritt: 10 Umdrehen Er weis nicht in welche Richtung das Ziel gegangen ist und denkt zunächst, es ist an ihm vorbei zurück in den Gang geschlüpft. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Testlauf Zeitschritt: 11 Nach links drehen Nachdem er das Ziel im Gang nicht findet, überprüft er die beiden Abzweigungen. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Mit sicher geortetem Ziel bleibt er wieder stehen. Ergebnisse Testlauf Zeitschritt: 12 Stehen bleiben Mit sicher geortetem Ziel bleibt er wieder stehen. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Unerwartetes Verhalten Unerwartetes Verhalten in entscheidungstheoretischen Modellen: Entwickler stellen nur Erwartungen, Aktionen und Dienstprogramme zur Verfügung. Verhalten resultiert aus Suche nach bester Lösung. Es treten unvorhergesehene Verhaltensweisen auf. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Situation 1: Das Ziel steht an einer Verzweigung. Erwartetes Verhalten: Der Roboter versucht nahe am Ziel zu bleiben, um festzustellen, welche Abzweigung das Ziel nimmt. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Situation 1: Das Ziel steht an einer Verzweigung. Erwartetes Verhalten: Der Roboter versucht nahe am Ziel zu bleiben, um festzustellen, welche Abzweigung das Ziel nimmt. Resultat: Der Roboter verhält sich wie erwartet. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Situation 2: Das Ziel steht an einer abbiegenden Sackgasse. Erwartetes Verhalten: Der Roboter versucht nahe am Ziel zu bleiben, um zu sehen, ob es um die Ecke geht. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

? Ergebnisse Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Situation 2: Das Ziel steht an einer abbiegenden Sackgasse. Erwartetes Verhalten: Der Roboter versucht nahe am Ziel zu bleiben, um zu sehen, ob es um die Ecke geht. Resultat: Der Roboter hält einen großzügigen Abstand zum Ziel. ? Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter bleibt nahe am Ziel. Mögliches Verhalten des Ziels: Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter bleibt nahe am Ziel. Mögliches Verhalten des Ziels: Es geht in die Sackgasse. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter bleibt nahe am Ziel. Mögliches Verhalten des Ziels: Es geht in die Sackgasse. Es geht vorbei am Roboter in den Gang. Nicht gut! Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter hält Abstand vom Ziel. Mögliches Verhalten des Ziels: Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter hält Abstand vom Ziel. Mögliches Verhalten des Ziels: Es geht in die Sackgasse. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Ergebnisse Unerwartetes Verhalten Beispiel für unerwartetes Verhalten im MTL Problem: Verhalten: Der Roboter hält Abstand vom Ziel. Mögliches Verhalten des Ziels: Es geht in die Sackgasse. Es geht in den Gang Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Resümee Vorteile von Entscheidungstheorie und Bayesschen Netzen: Unsicherheit: Entscheidungstheorie und Bayessche Netze sind ein natürlicher Ansatz für KI Systeme. Eindeutigkeit: Die Annahmen, die in diesem Ansatz gemacht werden, um Wissen wiederzuspiegeln, sind explizit und klar. Entwicklung: Entscheidungstheorie und Wahrscheinlichkeitstheorie sind gut entwickelt. Einfachheit: Bayessche Netze sind einfach zu erstellen, benutzen und analysieren. Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Resümee Und jetzt? Ihre Vorteile haben zur Verbreitung von Entscheidungstheorie und Bayesschen Netzen beigetragen. Es existiert ein breites Anwendungsfeld. Kleines Beispiel: Der Microsoft Office Assistent stützt sich auf Bayessche Netze Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl

Vielen Dank für Ihre Aufmerksamkeit Weitere Infos: http://www.fmi.uni-passau.de/~rabl Hauptseminar Echtzeitsysteme WS 2002/2003 Tilmann Rabl