Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger
Agenda n Problemstellung n Lösungsansatz n Implementierung n Performance n Feedback
Problemstellung n Generierung von TelKo Daten n Input: u Verteilung, Parameter u Wahrscheinlichkeitsmodell n Output: u TelKo Mikrodaten (Gespräche) u Beginn, Dauer, Tarifzone
Problemstellung n TelKo Datenstruktur u Gesprächsdauer/ Belegungsdauer u Einfallsabstand n ln-Normalverteilung durch Transformation
Problemstellung
Agenda n Problemstellung n Lösungsansatz n Implementierung n Performance n Feedback
Lösungsansatz n Erzeugung von einzelnen Kunden n Erzeugung von einzelnen Gesprächsdaten für jeden Kunden mit Zeitstrahlmodell
Erzeugung von Kunden n Kundengruppen unterteilt nach Telfonierverhalten n Ziehung der kundenspezifi- schen Parameter mit ZV aus Kundengruppen
Erzeugung von Gesprächsdaten n Generierung für einzelnen Kunden n Beginn bei Null n Fortlaufende Ziehung von Gesprächsdauer und Zwischengesprächsabstand n Ermittlung der Tarifstruktur vor jeder Ziehung
Zeitenstrahl t=0 } Zwischenzeit 1 t1t1 Gespräch 1 t2t2 Ziehung: Tarifzone (Ort, Nah, Fern) Gesprächsdauer } Abhängig vom Startzeitpunkt t3t3 } Zwischenzeit 2...
Agenda n Problemstellung n Lösungsansatz n Implementierung n Performance n Feedback
Implementierung n Eingabe n Ziehung n Generierung n Ausgabe
Eingabe n Festlegung der Rahmen- bedingungen u Klassen u Tarifzonen u Anschlussarten u Zeitfenster u WoEnde / Werktag u Dirac
Eingabe n Einlesen der Verteilungs- parameter u SHV: diskrete Verteilung u Mittelwert/Streuung für Gesprächs- dauer und Einfallabstand u Prozentsatz der gleichverteilten Gesprächsdauern
Ziehung n Diskretes Ziehen: u Kundenklasse u Anschlussart u Tarifzone n Gleichverteilte Z-Zahl zwischen 0 und 1
Ziehung n Beispiel: n Zufallszahlen: 0,44=>Nah 0,76=>Fern 0,54=>Nah 0,01=>Ort
Ziehung n Stetiges Ziehen: u Gesprächdauer u Zwischenankunftszeit n Normalverteilte Z-Zahl n Transformation
Ziehung n Beispiel: u µ = 2, = 1.5 u Z-Zahl x N(0,1) = -0.7 Transformation u x LN = exp(1.5*(-0.7) +2) = 2.59
Generierung n Bestimmung des Kunden u Klasse u Anschlussart n Alternierende Ziehung von ZAK und Gesprächsdauer
Generierung n ZAK durch Ziehung einer ZZ und deren Transformation n Dirac n Tarifzone in abh der akt Zeit und Klasse n Gesprächslänge unter Berücksichtigung von Zeitfensterüberlauf
Augabe n Kunde u Kunden ID u Klasse u Anschluss n Gespräch u Kunden ID u Tarifzone u Beginn u Dauer
Agenda n Problemstellung n Lösungsansatz n Implementierung n Performance n Feedback
Performance n Abbildungsgenauigkeit n Bandbreite n Datenvolumen
Abbildungsgenauigkeit n Gesprächsdauer u 100 Kunden u 8 * sec = 8 Tage u kein Dirac
Abbildungsgenauigkeit n Tarifzonen u 100 Kunden u 8 * sec = 8 Tage
Abbildungsgenauigkeit n Klassen u Kunden u 3 Anschlussarten u 2 Klassen
Abbildungsgenauigkeit n Sehr exakte Abbildung der Tarifzonen bzw. Klassen n Ausreichend genaue Abbildung der Gesprächsdauer bzw. ZAK u große Werte genauer abgebildet als kleine
Bandbreite / Datenvolumen n 1000 Kunden mit realitätsnahen Parametern n 5 Kundenklassen n 5 Tarifzonen n 650 sec Laufzeit n kB Gesprächsdaten n 10 kB Kundendaten
Agenda n Problemstellung n Lösungsansatz n Implementierung n Performance n Feedback
Feedback n Wahrscheinlich zu detaillierte Parameterstruktur n Hindernis Datenschutz n Datenbankanbindung n Zeitfenster alle gleichlang
Fragen