Projekt Simulation: Einführung

Slides:



Advertisements
Ähnliche Präsentationen
Definition [1]: Sei S eine endliche Menge und sei p eine Abbildung von S in die positiven reellen Zahlen Für einen Teilmenge ES von S sei p definiert.
Advertisements

Stochastik und Markovketten
Masterstudiengang IE (Industrial Engineering)
Projekt Simulation: Einführung
Der Binomialtest Man habe einen wahren Anteil P.
Hypothesen testen: Grundidee
Statistische Methoden II
Nachholung der Vorlesung vom Freitag
Vorlesung Die Vorlesung Statistische Methoden II nächste Woche vom 6. Juni ( nächste Woche ) wird auf den 4. Juni (Mittwoch) vorverlegt ! 14 – 16 Zeit:
Konfidenzintervalle Intervallschätzung
M-L-Schätzer Erwartungswert
Chi-Quadrat-Test auf Unabhängigkeit I
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -
Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz.
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur nächste Woche - statt Vorlesungen -
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
II. Wahrscheinlichkeitstheorie
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
III. Induktive Statistik
Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz.
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird verlegt. Der Nachholtermin wird noch bekannt gegeben.
Statistische Methoden II SS 2003
Extra-SPSS-Kurse Durchführung: Birte Holtfreter Termine Di Mi Mi Ort PC-Pool Loefflerstarße.
Bedingte Wahrscheinlichkeiten
Grundbegriffe der (deskriptiven) Statistik
Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Tutorium
Wiederholung und Beispiele
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Binomialverteilung: Beispiel
Vorlesung: ANOVA I
Wahrscheinlichkeitsrechnung
Eigenschaften der OLS-Schätzer
Histogramm/empirische Verteilung Verteilungen
Ausgleichungsrechnung I
Ausgleichungsrechnung I
Wahrscheinlichkeitsverteilung
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Wahrscheinlichkeit Zufallsexperiment:
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
Grundlagen der Messtechnik
Wahrscheinlichkeitsrechnung
Stetige Verteilungen Das Uhrenbeispiel Dichtefunktion
1 (C) 2002, Hermann Knoll, HTW Chur, Fachhochschule Ostschweiz Wahrscheinlichkeitsverteilung Lernziele: Wahrscheinlichkeitsverteilung und der Wahrscheinlichkeitsdichte.
Der Zentralwert.
ENDLICHE KÖRPER RSA – VERFAHREN.
Begriff der Zufallsgröße
Einführung zur Fehlerrechnung
Stochastik Grundlagen
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
K. Desch - Statistik und Datenanalyse SS05
K. Desch - Statistik und Datenanalyse SS05 Statistik und Datenanalyse 1.Wahrscheinlichkeit 2.Wahrscheinlichkeitsverteilungen 3.Monte-Carlo-Methoden 4.Statistische.
Die Binomialverteilung
K. Desch - Statistik und Datenanalyse SS05
Aufgabe 5 Gegeben sei folgende Graphik mit den zugehörigen Merkmalsdefinitionen. – Erstellen Sie die zugehörige Kontingenztabelle der absoluten Häufigkeiten.
Geoinformationssysteme
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
1. 2 Das Grundproblem der Beurteilenden Statistik ● Wir haben uns bisher mit Problemen der Wahrscheinlichkeitsrechnung beschäftigt: – Die Wahrscheinlichkeit.
 Präsentation transkript:

Projekt Simulation: Einführung Simulation in a Nutshell - Teil 2 - Simulation und Modellbildung Klassifikation von Simulationsmethoden Zeitsynchrone Simulation: ein Beispiel Ereignisgesteuerte Simulation - eine Fallstudie Analyse und Interpretation von Simulationsläufen Literatur: Pagé, B.: Diskrete Simulation, Springer Verlag, 1991 Vorlesungsfolien Informatik 2, F. Mattern, TH Darmstadt, 1997

Beispiel: Telefonischer Fahrkartenvertrieb Fragen über Fragen: wie viele Verkäufer? Wie lange dauert es, bis ein Kunde bedient ist? Werden alle in "etwa" der gleichen Zeit bedient? Wie viel Anrufe kommen "in der Zeiteinheit" an? Was heißt das?? Genauer: wie groß ist der Abstand zwischen zwei Anrufen? Wie lange wartet eine Kunde, bevor er aufgibt und auflegt? Wie viele Kunden können sich maximal in der Warteschleife aufhalten?

Eine Anwendung Beispiel Reisebüro: Telefonische Fahrkartenreservierung Systemspezifikation: 1. 5 Angestellte nehmen Buchungen entgegen. 2. 18 Telefonleitungen (d. h. max. 13 Anrufer warten). 3. “Bitte warten” wenn alle Angestellten belegt. 4. Angest. wird frei --> am längsten wartenden bedienen (FIFO). 5. Wartebereitschaft der Kunden im Mittel 4 Min. (normalverteilt). 6. Endgültiger Verzicht eines Kunden, wenn keine Leitung frei oder Wartezeit überschritten. 7. Zwischenankunftszeiten exponentialverteilt (20 Sek.). 8. Bedienzeit exponentialverteilt (mit Mittel 1 Min. bei einfacher Fahrt, 2 Min. bei Rückfahrkarte). 9. Wahrscheinlichkeit für Rückfahrkarte = 0.75.

Zufallszahlen Im richtigen Leben hat man es oft mit Zufallszahlen (Zufallsgrößen) zu tun: - die Zahl beim Würfeln - die Wartezeit beim Bäcker (zwischen 7 und 8) - die Zeit zwischen zwei Anrufen beim Kartenservice .... ... ... Der Abstand zwischen zwei Anrufen ist eine zufällige Größe. Man nennt X eine Zufallsvariable, wenn sie die Werte einer Zufallsgröße annimmt. Die Variable X = "Abstand zwischen zwei Anrufen“ ist eine Zufallsvariable.

Verteilungsfunktion Zufallsfallsvariable X : Die Funktion F(x) = P(X < x) Wahrscheinlichkeit dafür, dass X < x heißt Verteilungsfunktion. Wahrscheinlichkeit, dass die Zeit zwischen 2 Anrufen "bis zu 4 Minuten" beträgt Exponentialverteilung Mittelwert l = 0.33 min

Dichtefunktion Wahrscheinlichkeit,dass Abstand zwischen zwei Anrufen zwischen 2 und 4 Minuten liegt . Exponentialverteilung Mittelwert l = 0.33 min Aus der Dichtefunktion f(x) läßt sich ablesen, mit welcher Wahrscheinlichkeit die Zufallsvariable Werte zwischen a und b annimmt, denn die Verteilungsfunktion F(x) ist definiert: F(x) =  f(t) dt x -

Fragen? 1. Wie weiß man, welche Verteilung eine Zufallsvariable hat? Weiß man normalerweise anfangs nicht! - analysiere kumulative Häufigkeiten (empirische Verteilung) - bestimme daraus empirische Verteilung - oder teste Vermutung, dass Daten in bestimmter allgemeiner Weise (normal, exponentiell,...) verteilt sind und teste diese Hypothese (mit statistischen Testverfahren) - oder es ist bekannt, dass gewisse Prozesse sich nach gewissen Verteilungen zufällig verhalten (z.B. normalverteilt). Dann müssen "nur noch" die Parameter bestimmt werden, besonders Mittelwert und Varianz.

Fragen? 2. Wie erzeugt man Zufallszahlen? Erzeugung wichtig, da "echter Zufall" im Rechner nicht existiert. Denkbar: Tabellen echter Zufallszahlen. Nicht handlich... Vorteil von Pseudozufallszahlen: Reproduzierbarkeit Gleichverteilte Zufallszahlen? Andere Verteilungsfunktion? 1 1 Gleichverteilung F(x) = x (zwischen 0 und 1) Dichte: f(x) = 1 (zwischen 0 und 1 zwischen a und b: 1/(b-a)) Kongruenzenverfahren: z i+1 = (a * z i ) mod p, p große Primzahl Liefert Zufallszahlen zwischen 0 und p-1, Normierung auf 0<= z < 1 Im Simulationsprojekt: Java Klasse zur Erzeugung von Zufallszahlen benutzen.

Zufallszahlen Erzeugen anderer Verteilungen aus gleichverteilten Zufallszahlen (eine von mehreren Möglichkeiten) Z.B. Exponentialverteilung aus Gleichverteilung Idee: Verteilungsfunktion F(x) bildet eine (0,1) gleichverteilte Größe auf F(x) ab. Umkehrfunktion x = F-1(y), z.B. x = -1/l * ln (1-y) (0,1)-gleichverteilter Y-Wert liefert F(x)- verteilten x-Wert

Zufällige Größen im Beispiel Zwischenankunftszeit der Anrufe  Dauer eines Kartenverkaufs an einen Kunden (Bediendauer) exponentialverteilt (einfache Fahrt: Mittelwert 1 min, Rückfahrt: 2 min Art der Aufträge (mit unterschiedlicher Bediendauer !) diskrete Verteilung (nur endlich viele mögliche Werte): p = 0,25: einfache Fahrt, p = 0,75 = Rückfahrkarte Geduld–am–Ende – Zeit: Wann legt der Kunde auf, bevor er bedient wird? Normalverteilt, Mittelwert = 4 Min

Ereignisgesteuerte Simulation Ereignisse und Aktivitäten Aktivität A2 Aktivität 3 Akti. 4 Aktivitäten können überlappen (Anruf und Kartenverkauf) Ereignisse entsprechen nicht in allen Fällen Anfang und Ende einer Aktivität. - Anfang / Ende verschiedener Ereignisse können zusammenfallen: "Ende Warten = Beginn Bedienung" - Ereignis ohne Dauer: "Geduld am Ende"

Modellentwurf „Kartenverkauf“ Zustand des Modells (" als Schnappschuß"): - Status (frei / beschäftigt) jedes Angestellten - Anzahl der freien Leitungen - Menge der wartenden Anrufer Genügt hier nicht die Anzahl? Braucht man die Identität oder nur die Anzahl ? - Anruf --> Beginn Bedienung / Warten - Ende Warten (freie Bediener / abgelaufene Geduld) - Ende Bedienung Ereignistypen ? Ereignistypen Zustands- übergänge Aus Sicht eines individuellen Kunden

Ereignisgesteuerte Simulation

Ereignisgesteuerte Simulation K3 Gibt auf 9.07 Ereigniszeit statt synchroner Ticks K1 AR,Beg. Bedienung 9.00 K2 AR,Beg. Warten 9.02 K3 AR,Beg. 9.03 K2 Gibt auf 9.04 K4 AR 9.05 K1 Ende Wert der Zufallsvariable "Zwischenankunftszeit" K3 Ende Bedienung 9.06 Nur ein Bediener! K1 AR Beg. Bedienung 9.00 K2 AR Beg. Warten 9.02 K3 AR Beg. 9.03 K2 Gibt auf 9.04 K3 Gibt auf 9.07 K4 AR 9.05 K1 Ende Erzeugung der Events K3 Ende Bedienung 9.06 Bei Benden des Wartens erzeugt K3 Bedien-Ende- Event

neuer Kunde kommt; versucht zu wählen! Modellierung Welche Ereignisse (Ereignistypen)? neuer Kunde kommt; versucht zu wählen! Ende der Geduld; nur wenn in Warteschleife Bedienende; Kunde verlässt das System Ist nicht auch Bedienanfang ein Ereignis? Welche Zustände? # freie Bediener Schlange der wartenden Kunden # freier Leitungen Wartende Kunden sind keine Ereignisse Welche Ergebnisdaten? Wartezeit pro Benutzer Anteil der abspringenden Kunden mittlere Warteschlangenlänge mittlere Auslastung von Leitungen / Bedienern .....

Der Zyklus der Simulation Hier muß ein erstes Ereignis erzeugt werden, damit es los geht. Ggf. auch ein letztes! Initialisieren Gibt es noch ein Ereignis Uhr = Zeit des nächsten Ereignisses Ereignis aus Ereignis- liste entnehmen Ende der Simulation, Gesamtstatistik Ggf. Statistik- Ausgabe N Y Zustandsänderung gemäß Ereignis- routine Ende: „das letztes Ereigns“ bearbeitet oder Uhr > Sim.zeit Hier passiert was: Zustand verändern, neue Ereignisse erzeugen. Es wird also immer das jüngste Ereignis bearbeitet. Dabei fallen ggf. neue Ereignisse an.

Die Ereignisroutinen Kundenanruf Bedienroutine ausführen Auszuführen bei Eintritt des Ereignisses Kundenanruf Nächsten Kunden- anruf vor- merken alle Leitungen besetzt? freiLeitungen --; Sachbearbeiter frei? Kundensatz er- zeugen, in Kunden- warteschlange GeduldEndeEreignis vormerken bediener--; Bedienroutine ausführen abgewieseneKd++ Trick: erhält die Simulation am Leben. Hat das mit Kausalität zu tun? Kundenanruf ursächlich für nächsten Kundenanruf?? Hier wird auch das Ende- ereignis erzeugt!

Die Ereignisroutinen (2) Bedienende freieLeitungen++; KdWarteschlange leer? bedienert++; Kunden aus KdWarte- schlange entnehmen, Kdsatz löschen Bedienroutine ausführen Ja GeduldEnde Lösche Kundensatz freieLeitungen++;

ggf. Statistikdaten schreiben Bedienung Beachte: es gibt zwei Arten von Objekten in der ereignis- gesteuerten Simulation: - Ereignisse: im wesentlichen intern, treiben die Simulation - nach der Realität modellierte Dinge, wie Warteschlange mit Kunden Bedienroutine GeduldEnde- ereignis löschen ggf. Statistikdaten schreiben u. Ausgaben Bedienende-Ereignis einplanen

Der ereignisgesteuerte Simulator schematisch Uhr (Simulationszeit) springt zum jeweils nächsten Ereignis, Ereignisroutinen: ändern den Zustand, einschl. Erzeugung ggf. zukünftiger Ereignisse. Ereignisrepräsentation: prinzipiell ausreichend - Zeit - Ereignistyp 17 23 25 12 Zustand Programmcode

Die Kunst des (ereignisorientierten) Modellierens Aktivitäten so in Ereignisketten auflösen, dass Realität adäquat vom Modell widergespiegelt wird Wechselwirkungen zwischen Aktivitäten auf die Ereignisse beschränkt sind Ereignisse sich korrekt einplanen Ereignisroutinen die Zustandsveränderungen richtig wiedergeben. Entscheidende Frage: wie gut spiegelt das Simulationssystem die Realität wider? Modell adäquat? entsprechen die angesetzten Wahrscheinlichkeitsverteilungen den wahren Verhältnissen? Sind die Ergebnisse (statistisch) vertrauenswürdig? warum Bsp. nicht zeitgesteuert??

Planung und Analyse von Experimenten Zielgröße(n) festlegen: - Was soll untersucht werden? Hypothesen formulieren (zu jedem Experiment gehört Hypothese!) - Wovon hängen Zielgrößenwerte ab? - In welcher Größenordnung Fixieren der Parameter für das Untersuchungsziel Beispiel: - Wie lassen sich die Wartezeiten so verkürzen, dass nur noch jeder die 10 % der wartenden Kunden abspringt? - Hypothese: mehr Personal - Ziel: Aussage, wieviele Kunden prozentual abspringen, wenn nur statt n n+1, n+2, ... Mitarbeiter eingesetzt werden? - Zielgröße: Kundenabsprung als Funktion von Anzahl eingesetzter MA Wichtig: Welches Vertrauen kann man in Ergebnisse haben? -> Statistik

Einschwingphase xt t a) Heuristische Verfahren: - Augenmaß Zufallsvariable (Zielgröße) Einschwingvorgang Und was ist hiermit? Verkehrsimulation: Rush hour? a) Heuristische Verfahren: - Augenmaß - Max / Min-Test: in Folge x0, x1, ...xi, x i+1,... prüfen, ob xi Max oder Min der xj, i<j wenn nein: diese Restfolge mit erstem Glied xi+1 nehmen. b) Statistische Testverfahren

Schätzgenauigkeit der Ergebnisse Abstraktes Simulationsproblem: Gesucht die Verteilungsfunktion F(X) einer Zufallsvariable des Modells (z.B. Anzahl der Kunden in der Warteschleife) Oft ausreichend: Erwartungswert der unabhängigen Zufallsvariablen schätzen E [X ] = m =  x f(x) dx x1,x2,...xn sei Ausgang eines Experiments (z.B. die gemessenen Längen der Warteschlange zu n Zeitpunkten) - Mittelwert ist erwartungstreuer Schätzwert für echten Mittelwert m : x = (1/n) S xi , d.h lim ( (1/n) S xi ) = m i=1..n n ->  i=1..n - reicht aber nicht für genauere Aussagen. Beispiel...

Schätzgenauigkeit Wie bestimmt man m ? Beispiel aus der Literatur: Für Bedien- / Wartesystem mit exponentialverteilter Zwischenankunfts- und Bedienzeit lässt sich Mittelwert analytisch errechnen (M/M/1-Bediensystem) Erwartungswert für Warteschlangenlänge bei bestimmten Parametern: m = 4,86 Aber X = 3,2 bei Stichprobe von n = 1000 Wie bestimmt man m ? X ist selbst eine Zufallsvariable mit dem Mittelwert E(X) = m Abschätzen, mit welcher Wahrscheinlichkeit der wahre Mittelwert m in einem Intervall [x – cn , x + cn ] liegt.

Schätzgenauigkeit der Simulationswerte „Mit Wahrscheinlichkeit 0.95 findet man den wahren Wert der Anrufer , die aufgeben, iin diesem Intervall t Mit welcher Wahrscheinlichkeit (Konfidenzniveau) befindet sich der wahre Wert m in einem gegebenen Intervall (Konfidenzintervall) - Typische Aufgabe der Statistik, nicht simulationsspezifisch.

Konfidenzintervall Tatsächlicher, unbekannter Mittel- wert Experiment 1 x-cn x x+cn Experiment 2 x-cn x x+cn Experiment n x-cn x x+cn

Schätzen der Lage des Mittelwerts Es gilt : der wahre Mittelwert liegt bei genügend großem n mit von z abhängiger Wahrscheinlichkeit im Intervall: [ x - z* s/( n) , x + z * s/( n)] wenn die unbekannte Verteilung die Varianz s hat. Also cn = z* s/( n) z = 1,96 : Wahrscheinlichkeit beträgt 0,95, dass m im Intervall. Wie groß ist Streuung s ?? Schätzen!

Varianz schätzen Schätzer für Varianz : Varianz: Var(X) = E[(X-E(X))2] = s2 =  (x – m)2 f(x) dx Var(X1+X2+...Xn) = Var(X1) + Var(X2) + ... + Var(Xn) für unabhängige Xi Wenn s2 Varianz der Xi, dann s(X) = s /  n Schätzwert dafür : s 2 = 1/(n-1) S (x i - x ) 2 Standardabweichung: s ~ s =  s2 Damit : Mittelwert m liegt mit 95%iger Wahrscheinlichkeit im Intervall [ x - 1,96* s/( n) , x + 1,96 * s/( n)] (*) Wichtige Voraussetzung: die X sind unabhängig! Anzahl Versuche groß ! n >= 30

Vorgehen Unabhängige Simulationsläufe, die die interessierenden Größen jeweils zu einem neuen Stichprobenwert zusammenfassen. Mit den n unabhängigen Simulationsläufen Konfidenzintervall für E(X) mit (*) bestimmen. Verfahren funktioniert nur bei unabhängigen Versuchen n >= 30 Sehr aufwendig, da die die gesamte Simulation wiederholt werden muß. Es gibt statistische Verfahren mit geringerem Aufwand

Beispiel Experiment i gemessener Mittelwert x 1 5,9 2 6.4 3 6.0 4 6.0 1 5,9 2 6.4 3 6.0 4 6.0 5 4.7 6 8.6 7 4.0 8 6.4 9 5.7 10 5.9 x = 5.96 s = 1.19 1.96* s/( n) = 0.74 x  0.74 = [5.22, 6.7] Tatsächlicher Mittelwert m Liegt mit Wahrscheinlichkeit 0,95 im Intervall [5.22, 6.7]

Validierung ... ist schwierig! Klassifikation der Validierungsschritte stammt von Pagé (s. Literatur) ... ist schwierig! Stimmt das konzeptuelle Modell mit Realität überein? - Experten befragen, - Verifikation der Verteilungsannahmen durch Analyse von echten Daten Modellverifikation Tut das System das, was es soll? - Prinzipien der Entwicklung großer Programme beachten, - Plausibilitätsprüfungen Operationale Verifikation Stimmen das dynamisch Modellverhalten mit der Realität überein? (für Prognosemodelle offenbar besonders schwer. 20 Jahre warten??) - Vergleich mit historischen Daten - Vergleich von Verteilungen von echten und von Modelldaten (statistische Testverfahren) - unabhängiges Modell erstellen, rechnen und vergleichen