Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

im Rahmen der Vorlesung
Berechnung des Korrelationskoeffizienten Vorbemerkung. Der Korrelationskoeffizient ist im Grunde ein Bruch aus 3 unvollständig berechneten statistischen.
Mathematisches Seminar – Thema 2.1
Stochastik in der Sek. II Sabrina Schultze.
Umgang mit Messunsicherheiten
Gliederung Definition des Wahrscheinlichkeitsbegriffes
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Der Binomialtest Man habe einen wahren Anteil P.
Klausur „Diskrete Mathematik II“
Relevanz Ranking Bisher: Sind wir davon ausgegangen, dass das Ergebnis des Rankings des statistischen Verfahrens in den Index geschrieben wird und dem.
Was ist eine Datenbank? ermöglicht die Eingabe von Daten
Statistische Methoden II SS 2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Konfidenzintervalle Intervallschätzung
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Statistische Methoden II SS 2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
III. Induktive Statistik
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird verlegt. Der Nachholtermin wird noch bekannt gegeben.
Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz.
Extra-SPSS-Kurse Durchführung: Birte Holtfreter Termine Di Mi Mi Ort PC-Pool Loefflerstarße.
Verteilungsfunktion der Normalverteilung I. Verteilungsfunktion der Normalverteilung II.
Grundbegriffe der (deskriptiven) Statistik
Test auf Normalverteilung
Grundbegriffe der (deskriptiven) Statistikder Wahrscheinlichkeitstheorie.
Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.
Digital Audio Medientyp digital audio representation
Christian Steinle, Joachim Gläß, Reinhard Männer
Deskriptive Statistik
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Binomialverteilung: Beispiel
Histogramm/empirische Verteilung Verteilungen
Normalverteilung bei stetigen Zufallsgrößen
Wahrscheinlichkeitsverteilung
Magnetometer FGM-3 Kalibrierung und Untersuchungen mit dem Selbstbaumagnetometer FGM-3 von Speake.
Aufgabenzettel V Statistik I
Die Poisson-Verteilung: Mittelwert und Standardabweichung
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten
STATISIK LV Nr.: 1375 SS März 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Computerorientierte Physik VORLESUNG
Jamshid Azizi: Folie Isomorphietest Jamshid Azizi
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
Statistik I - Übung Sarah Brodhäcker.
Das Heronverfahren arithmetisches Mittel geometrisches Mittel
Stetige Verteilungen Das Uhrenbeispiel Dichtefunktion
1 (C) 2002, Hermann Knoll, HTW Chur, Fachhochschule Ostschweiz Wahrscheinlichkeitsverteilung Lernziele: Wahrscheinlichkeitsverteilung und der Wahrscheinlichkeitsdichte.
Fundamente der Computational Intelligence (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich Informatik Lehrstuhl für Algorithm Engineering Wintersemester.
Erzeugung und Verwendung von Zufallszahlen
2.5.2 Multivariate Monte Carlo-Simulation
Der Binomialtest Man habe einen wahren Anteil P. Kann man aufgrund von p sagen, daß in der Population tatsächlich der Anteil P zugrunde liegt? [Beispiele]
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Was ist eine Datenbank „MS Access“
Personalvertreterwahlen Datenbankanwendung. Spezifikationen Eingabe des Wahltags Bestimmung der Zahl der Wahlberechtigten und der Zahl der potentiellen.
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
 Präsentation transkript:

Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger

Agenda n Problemstellung n Lösungsansatz n Implementierung n Performance n Feedback

Problemstellung n Generierung von TelKo Daten n Input: u Verteilung, Parameter u Wahrscheinlichkeitsmodell n Output: u TelKo Mikrodaten (Gespräche) u Beginn, Dauer, Tarifzone

Problemstellung n TelKo Datenstruktur u Gesprächsdauer/ Belegungsdauer u Einfallsabstand n ln-Normalverteilung durch Transformation

Problemstellung

Agenda n Problemstellung n Lösungsansatz n Implementierung n Performance n Feedback

Lösungsansatz n Erzeugung von einzelnen Kunden n Erzeugung von einzelnen Gesprächsdaten für jeden Kunden mit Zeitstrahlmodell

Erzeugung von Kunden n Kundengruppen unterteilt nach Telfonierverhalten n Ziehung der kundenspezifi- schen Parameter mit ZV aus Kundengruppen

Erzeugung von Gesprächsdaten n Generierung für einzelnen Kunden n Beginn bei Null n Fortlaufende Ziehung von Gesprächsdauer und Zwischengesprächsabstand n Ermittlung der Tarifstruktur vor jeder Ziehung

Zeitenstrahl t=0 } Zwischenzeit 1 t1t1 Gespräch 1 t2t2 Ziehung: Tarifzone (Ort, Nah, Fern) Gesprächsdauer } Abhängig vom Startzeitpunkt t3t3 } Zwischenzeit 2...

Agenda n Problemstellung n Lösungsansatz n Implementierung n Performance n Feedback

Implementierung n Eingabe n Ziehung n Generierung n Ausgabe

Eingabe n Festlegung der Rahmen- bedingungen u Klassen u Tarifzonen u Anschlussarten u Zeitfenster u WoEnde / Werktag u Dirac

Eingabe n Einlesen der Verteilungs- parameter u SHV: diskrete Verteilung u Mittelwert/Streuung für Gesprächs- dauer und Einfallabstand u Prozentsatz der gleichverteilten Gesprächsdauern

Ziehung n Diskretes Ziehen: u Kundenklasse u Anschlussart u Tarifzone n Gleichverteilte Z-Zahl zwischen 0 und 1

Ziehung n Beispiel: n Zufallszahlen: 0,44=>Nah 0,76=>Fern 0,54=>Nah 0,01=>Ort

Ziehung n Stetiges Ziehen: u Gesprächdauer u Zwischenankunftszeit n Normalverteilte Z-Zahl n Transformation

Ziehung n Beispiel: u µ = 2, = 1.5 u Z-Zahl x N(0,1) = -0.7 Transformation u x LN = exp(1.5*(-0.7) +2) = 2.59

Generierung n Bestimmung des Kunden u Klasse u Anschlussart n Alternierende Ziehung von ZAK und Gesprächsdauer

Generierung n ZAK durch Ziehung einer ZZ und deren Transformation n Dirac n Tarifzone in abh der akt Zeit und Klasse n Gesprächslänge unter Berücksichtigung von Zeitfensterüberlauf

Augabe n Kunde u Kunden ID u Klasse u Anschluss n Gespräch u Kunden ID u Tarifzone u Beginn u Dauer

Agenda n Problemstellung n Lösungsansatz n Implementierung n Performance n Feedback

Performance n Abbildungsgenauigkeit n Bandbreite n Datenvolumen

Abbildungsgenauigkeit n Gesprächsdauer u 100 Kunden u 8 * sec = 8 Tage u kein Dirac

Abbildungsgenauigkeit n Tarifzonen u 100 Kunden u 8 * sec = 8 Tage

Abbildungsgenauigkeit n Klassen u Kunden u 3 Anschlussarten u 2 Klassen

Abbildungsgenauigkeit n Sehr exakte Abbildung der Tarifzonen bzw. Klassen n Ausreichend genaue Abbildung der Gesprächsdauer bzw. ZAK u große Werte genauer abgebildet als kleine

Bandbreite / Datenvolumen n 1000 Kunden mit realitätsnahen Parametern n 5 Kundenklassen n 5 Tarifzonen n 650 sec Laufzeit n kB Gesprächsdaten n 10 kB Kundendaten

Agenda n Problemstellung n Lösungsansatz n Implementierung n Performance n Feedback

Feedback n Wahrscheinlich zu detaillierte Parameterstruktur n Hindernis Datenschutz n Datenbankanbindung n Zeitfenster alle gleichlang

Fragen