4/11/2017 2. Reaktive Agenten.

Slides:



Advertisements
Ähnliche Präsentationen
Hier einige Hieroglyphen:
Advertisements

Definition [1]: Sei S eine endliche Menge und sei p eine Abbildung von S in die positiven reellen Zahlen Für einen Teilmenge ES von S sei p definiert.
Eine dynamische Menge, die diese Operationen unterstützt,
6. Regelbasierte Systeme
Polynomial Root Isolation
Algebraische Zahlen: Exaktes Rechnen mit Wurzeln
Software-Engineering II Eingebettete Systeme, Softwarequalität, Projektmanagement Prof. Dr. Holger Schlingloff Institut für Informatik der Humboldt.
Zusammenfassung der Vorwoche
Default Logiken Zhao Li
Digitalgeometrie mit Anwendungen zur Bildanalyse und Computergrafik
Verifizieren versus Berechnen
Terminierung und Deadlocks Enkhbat Daginaa Betreuerin Prof. Heike Wehrheim Totale Korrektheit.
Christian Schindelhauer
Kapitel 4 Syntaktische Analyse: LR Parsing.
Java: Objektorientierte Programmierung
FH-Hof Deadlocks Richard Göbel. FH-Hof Deadlock - Definition Menge von Prozessen ist an einem Deadlock beteiligt: wenn jeder Prozess in dieser Menge auf.
Java: Dynamische Datentypen
Java: Referenzen und Zeichenketten
Experiment 2 Unterscheidung verschiedener Vokalkategorien (mit Versuchsbegrenzung) Carola Mook Nach einem Artikel von Patricia K. Kuhl.
Algorithmentheorie 04 –Hashing
WS Algorithmentheorie 13 - Kürzeste (billigste) Wege Prof. Dr. Th. Ottmann.
1 Bewegungsplanung Computational Geometry Prof. Dr. Th. Ottmann Bewegungsplanung bei unvollständiger Information Ausweg aus einem Labyrinth Finden eines.
WS 03/04 Algorithmentheorie 03 - Randomisierung Prof. Dr. S. Albers Prof. Dr. Th. Ottmann.
WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.
Dynamische Programmierung (2) Matrixkettenprodukt
Algorithmentheorie 02 – Polynomprodukt und Fast Fourier Transformation
Prof. Dr. S. Albers Prof. Dr. Th. Ottmann
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Prof. Dr. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Tobias Lauer.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Prof. Dr. Th. Ottmann.
WS Algorithmentheorie 08 – Dynamische Programmierung (2) Matrixkettenprodukt Prof. Dr. Th. Ottmann.
Vorlesung Informatik 3 Einführung in die Theoretische Informatik (17 –Turingmaschinen) Prof. Dr. Th. Ottmann.
Geometrisches Divide and Conquer
Die Beschreibung der Insula Ostia in XML
Kapitel 5 Stetigkeit.
Kapitel 6 Differenzierbarkeit. Kapitel 6: Differenzierbarkeit © Beutelspacher Juni 2005 Seite 2 Inhalt 6.1 Die Definition 6.2 Die Eigenschaften 6.3 Extremwerte.
Universität Dortmund, Lehrstuhl Informatik 1 EINI II Einführung in die Informatik für Naturwissenschaftler und Ingenieure.
Agent Based Supply Chain Management1 ABSCM-Vorlesung im WS 2001/2002.
Reinforcement Learning
PKJ 2005/1 Stefan Dissmann Zusammenfassung der Vorwoche Variable stehen für (einen) Wert, der sich im Programmablauf ändern kann. Variablen besitzen einen.
George Herbert Mead Soziale Handlungen: das Verhalten eines Individuums stellt einen Reiz für ein anderes dar, um in einer bestimmten Weise wiederum auf.
PG 520 Intelligence Service – gezielte Informationen aus dem Internet
Christian Schindelhauer
1/16 UNIVERSITY OF PADERBORN Projektgruppe KIMAS Projektgruppe KIMAS Agenten Andreas Goebels, Alexander Weimer.
1/25 UNIVERSITY OF PADERBORN Projektgruppe KIMAS Projektgruppe KIMAS MultiAgenten-Systeme Andreas Goebels.
Tino Reindanz - FSU Jena Seminar Aktive Datenbanken – SS 2007 Folie 1 Seminar Aktive Datenbanken Rule Development Rule Development for Active Database.
Input / Wahrnehmung Control / Bewusstsein Output / Motorik Information.
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Polynome und schnelle Fourier-Transformation
Auslegung eines Vorschubantriebes
Erfindervon Fuzzy Logic
Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II
Benutzerhinweise: Die nächste Folie sowie die jeweils nächste
Agenda für heute, 7. April, 2005 Bedingte ProgrammausführungBedingte Programmausführung Algorithmische Grundlagen Vergleichsoperatoren, Wahrheitswerte.
Technische Informatik II Übung 7: Automaten Implementierungsaspekte
Petrinetze 1. Einführung Informatik : wesentlich Modellierung von
Arne Vater Wintersemester 2006/ Vorlesung
Christian Schindelhauer Wintersemester 2006/07 2. Vorlesung
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.
Prüfung auf Serialisierbarkeit (3)
Seminarleiter-Zuordnung (S1-S8)
Analyse der Laufzeit von Algorithmen
Korrektheit von Programmen – Testen
Programmiersprachen II Vorbesprechung Klausur Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Gliederung 0. Motivation und Einordnung 1. Endliche Automaten
11/13/ Reaktive Agenten.
 Präsentation transkript:

4/11/2017 2. Reaktive Agenten

Agenten 4/11/2017 Ein intelligenter Agent interagiert mit seiner Umgebung mittels Sensoren und Effektoren und verfolgt gewisse Ziele: sensors percepts environment agent ? effectors

Agenten Beispiele: Menschen und Tiere 4/11/2017 Beispiele: Menschen und Tiere Roboter und Software-Agenten (Softbots) aber auch: Heizungen, ABS...

Agenten 4/11/2017 Es gibt jedoch andere Definitionen aus den unterschiedliche Fachgebieten wie Ein Programm ist ein Softwareagent, wenn es korrekt in einer (Agenten-) Sprache wie ACL, KQML oder KIF kommuniziert. BDI Agenten werden durch Überzeugungen (believes), Wünsche (desires) und Intentionen (intentions) beschrieben, praktisch werden sie mit einer Modallogik und speziellen Datenstrukturen implementiert.

Agenten Beispiel 1: Simulation Soccer RoboCup – Roboterfußball 4/11/2017 Beispiel 1: Simulation Soccer RoboCup – Roboterfußball

Agenten Beispiel 2: Taxifahrer Typ Taxifahrer Wahrnehmung 4/11/2017 Beispiel 2: Taxifahrer Typ Taxifahrer Wahrnehmung Kameras, Tachometer, GPS, Mikrophon Aktionen Steuern, Schalten, Bremsen, mit Gästen sprechen Ziele Sichere, schnelle, legale, komfortable Fahrt; Profit maximieren Umgebung Straßen, andere Verkehrsteilnehmer, Fußgänger, Fahrgäste

Charakterisierung von Agenten 4/11/2017 Agenten können charakterisiert werden durch: Wahrnehmungen (perceptions) Aktionen (actions) Ziele (goals) Umgebung (environment) (= PAGE)

Beispiele von Agenten nach PAGE 4/11/2017 Art Wahr- nehmung Aktionen Ziele Um- gebung Medi-zinisches Diagnose-system Symptome, Diagnose, Antworten des Patienten Fragen, Tests, Behand-lungen Gesundheit,geringe Kosten Patient, Hospital Satelliten-bildanalyse Punkte verschiedener Intensität Klassifikation Korrekte Klassifikation Satelliten-bilder Roboter Teile aufheben und einsortieren Teile richtig einsortieren Förderband mit Teilen

Beispiele von Agenten nach PAGE 4/11/2017 Art Wahr- nehmung Aktionen Ziele Um- gebung Raffinerie Regler Temperatur, Druck Öffnen, Schließen von Ventilen, Temperatur einstellen Reinheit, Ertrag, Sicherheit maximieren Raffinerie Interaktiver Englisch-tutor Eingegebene Wörter und Übungen, Vorschläge Korrekturen ausgeben Testergeb-nisse des Studenten maximieren Menge von Studenten

Typen von Agenten (I) 4/11/2017 Man kann Agenten nach der Art und Weise ihrer Umwelt-Interaktionen unterscheiden: reaktive Agenten die über ein Reiz-Antwort-Schema ihr Verhalten steuern, reflektive Agenten die planbasiert agieren, also explizit Pläne, Ziele und Intentionen verarbeiten, situierte Agenten die einfaches Reagieren und überlegtes Handeln in dynamischer Umwelt verbinden,

Typen von Agenten (II) 4/11/2017 autonome Agenten die zwischen reflektiven und situierten Agenten einzuordnen sind (und meist in der Robotik verwendet werden), rationale Agenten die den reflektiven Agenten entsprechen, jedoch eine ausgeprägte Bewertungsfunktionalität besitzen, soziale Agenten die in der Lage sind, ihr Handeln an einem Gemeinziel auszurichten.

Stimulus-Response Agent 4/11/2017 Der einfache reaktive Agent antwortet unmittelbar auf Wahrnehmungen (Stimulus-Response Agent) Sensor S-R-Agent Wie ist die Welt jetzt? Umgebung Bedingung-Aktion- Regeln Was soll ich jetzt tun? Effektor

Stimulus-Response Agent 4/11/2017 Das Skelett eines solchen Agenten sieht etwa so aus: function S-R-Agent (percept) returns action static : rules state INTERPRET-INPUT (percept) rule RULE-MATCH (state, rule) action RULE-ACTION (rule) return action Der Agent sucht eine Regel deren Bedingung der gegebenen Situation entspricht und führt die zugehörige Aktion (Regel-Konklusion) aus.

Beispiel: Gitterwelt (Grid-Space World) 4/11/2017 Die Umwelt sei der Einfachheit halber eine fiktive zweidimensionale Gitterzelleneinheit, in der sich verschiedene (Spielzeug-)Agenten tummeln. In den Zellen können Objekte mit verschiedenen Eigenschaften sein, es gibt auch Barrieren. Agenten können von Zelle zu Zelle laufen. Es gibt keine „tight spaces“ (Lücken zwischen Objekten und Begrenzungen, die nur eine Zelle breit sind.) Diese Umgebungen sind nicht erlaubt

Gitterwelt (II) Beispiel: Roboter in zweidimensionaler Gitterwelt 4/11/2017 Begrenzung Der Roboter kann festellen, welche Zellen in seiner Nachbarschaft belegt sind. s1 s2 s3 s8 s4 s7 s6 s5 Massives Objekt Beispiel: Roboter in zweidimensionaler Gitterwelt

Gitterwelt (III) si  {0,1} Sensoreingabe: 4/11/2017 si  {0,1} Sensoreingabe: sj = 0  Zelle sj ist frei für Roboter Bei X im Bild ist Sensoreingabe (0,0,0,0,0,0,1,0) Es gibt die 4 Aktionen: north, east, south, west north bewegt z.B. den Roboter eine Zelle nach oben, falls die Zelle frei ist, ansonsten wird der Roboter nicht bewegt Eine Aufgabe wird häufig in 2 Schritten, der perception processing und der action computation Phase gelöst

Perception und Action Komponenten 4/11/2017 Vom Entwickler zuge- wiesene Bedeutungen: Eigenschafts- vektor, X 1 An einer Wand 1 1 In einer Ecke 1 Sensor Eingabe Perceptual processing Action function Aktion

Beispiel: Wandverfolgung 4/11/2017 Aufgabe: Gehe zu einer Zelle an der Begrenzung eines Objekts und folge dieser Grenze Perception: Es gibt 28 verschiedene Sensoreingaben (einige fallen wegen „no tight Space“ Voraussetzung weg). Wir wählen 4 Merkmale x1, …, x4:

Wandverfolgung (II) 4/11/2017 Das Merkmal in jedem Diagram hat genau dann den Wert 1, wenn mindestens eine der markierten Zellen belegt ist. x1 x2 x3 x4 (In komplexen Welten sind Informationen typischerweise unsicher, vage, oder sogar falsch.)

Wandverfolgung (III) If x2=1 and x3=0 then south 4/11/2017 Aktionen: Falls keines der 4 Merkmale den Wert 1 hat, führe north durch Sonst: If x1=1 and x2=0 then east If x2=1 and x3=0 then south If x3=1 and x4=0 then west If x4=1 and x1=0 then north

Wandverfolgung (IV) 4/11/2017 s1 s2 s3 s8 s4 s7 s6 s5 Ein Roboter der hier startet bewegt sich im Uhrzeigersinn an der äusseren Begrenzung entlang. Ein Roboter der hier startet bewegt sich entgegen dem Uhrzeigersinn am Objekt entlang.

Auswertung der Sensoreingaben 4/11/2017 Für die beiden Phasen perception processing und action computation werden oft Boolesche Algebren verwendet. So gilt:

Auswertung der Sensoreingaben 4/11/2017 Eine geeignete Repräsentationsform für Aktionen sind Regelsysteme der Form cj  aj , wobei cj der Bedingungsteil und aj der Aktionsteil sind. In unserem Beispiel erhält man z. B. die Regeln: Regelsysteme und Boolesche Algebren kann man gut mit Hilfe von Netzwerken implementieren.

Wandverfolgung 4/11/2017 Ein alternativer Ansatz zu S-R-Agenten besteht in der Einführung von Subsumptions–Modulen: Jedes Modul enthält Sensorinformationen direkt von der Umwelt. Sind die spezifizierten Voraussetzungen des Moduls erfüllt, so wird das Programm ausgeführt. „Höhere“ Module subsumieren „tiefere“, d.h. falls die Voraussetzung eines höheren Moduls erfüllt ist, wird das tiefere Modul durch das höhere ersetzt.

Wandverfolgung Sensorsignale Perception Action comp. Perception 4/11/2017 Sensorsignale Perception Action comp. Perception Action comp. corridor traveling Perception Action comp. obstacle avoidance Perception Action comp. Action wandering