Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Radio Frequency Identification Datenmanagement Odyssee im Datenraum: Datenbanktechnologie der Zukunft
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Warum RFID?
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Radio Frequency Identification (RFID) Schlüsseltechnologie für Objektverfolgung Identifizierung von Objekten mit Hilfe von Funkwellen Speicherung von Informationen auf Mikrochip Berührungsloses Auslesen von Daten ohne direkten Sichtkontakt
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Einsatzgebiete Logistik – Objektverfolgung – Post – Automobilbereich – Flughäfen Versorgungskettenmanagement Diebstahlschutz Sicherheitsysteme / Zutrittskontrolle / Wegfahrsperren Zeitmessung bei Sportveranstaltungen
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Objektverfolgung: Systemarchitektur
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Systemarchitektur (EPC, location, time)
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Daten im Cache 1) Ereignis (EPC, location, time) wird erfasst 2) Falls EPC nicht im Cache neuer Tupel anlegen (EPC, location, time, time, null) 3) Sonst: vergleiche location aus Ereignis und location im Cache ● Falls übereinstimmen – selbe Position → aktualisiere last_scan ● Sonst: Data Staging anstoßen, Daten in location, last_scan und last_scan_previous_sensor aktualisieren EPC location time_in last_scan last_scan_ps Cache
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Data Warehouse
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Daten: Naiver Ansatz Datenredundanzrate Auswertungszeiten Schnelle Data Staging EPC location time RFID_READ
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Daten: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Daten: Beispiel Ein Regal mit sechs Milchartikel mit je einen RFID Tag Zwei Kundeneinkaufswägen mit RFID Sensoren Eine Kasse mit RFID Sensor Jede Minute wird gescant
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Daten: Naiver Ansatz 39 Tupel in der Datenbank gespeichert – Je sechs für die ersten sechs Minuten – Drei für die siebte Minute ➔ „Standard“ Data Warehouse mit Data Cube benötigt lange Auswertungszeiten ➔ Lösung: RFID Data Warehouse mit Data Staging
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Data Warehouse Wird „on the fly“ generiert / befüllt Data Staging wird beim Eintreffen eines Ereignisses getriggert Verschiedene Möglichkeiten zur Eliminierung von Datenredundanz – Ohne Pfaderweiterung – Mit Pfaderweiterung (Read and Path) – Bewegung in Gruppen (Read and Bulk)
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Data Warehouse: ohne Pfaderweiterung Zwei Zeitstempel – time_in: Zeitpunkt an dem das Objekt den Standort betretten hat – time_out: Zeitpunkt an dem das Objekt den Standort verlassen hat EPC location time_in time_out RFID_READ Pfadinformationen Datenreduzierung (18 statt 39 Tupel)
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Data Warehouse: mit Pfaderweiterung Tabelle um Attribut path erweitert (p 1 ;...;p n ) EPC location time_in time_out path RFID_READ Data Staging Redundanz von „path“ Pfadrekunstruktion Leichte Erkennung von Gruppen
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme RFID Data Warehouse: Bewegung in Gruppen Wichtigste Beobachtung: Objekte bewegen sich in Gruppen in die frühen Phasen (Bsp.: Lager zur Filiale) Pfadangaben nicht für jedes Objekt einzeln speichern Stattdessen: Pfade refferenzieren EPC location time_in time_out RFID_READ id previous_id location path_id path_reader time_in time_out RFID_PATH
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Data Staging für Analytische Verfahren
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Data Staging Aufgabe: Pfade erkennen, aggregieren und in den Warehouse-Tabellen abspeichern Zwei Ansätze – Tupelbasiert – Bulk EPC location time_in time_out RFID_READ id previous_id location path_id path_reader time_in time_out RFID_PATH
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Tupelbasiertes Data Staging: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal Zeitpunkt t1
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Tupelbasiertes Data Staging: Beispiel Zeitpunkt t1
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Tupelbasiertes Data Staging: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal Zeitpunkt t3
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Tupelbasiertes Data Staging: Beispiel Zeitpunkt t3
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Tupelbasiertes Data Staging: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal Zeitpunkt t5
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Tupelbasiertes Data Staging: Beispiel Zeitpunkt t5
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Tupelbasiertes Data Staging: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal Zeitpunkt t6
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Tupelbasiertes Data Staging: Beispiel Zeitpunkt t6
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Tupelbasiertes Data Staging: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal Zeitpunkt t7
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Tupelbasiertes Data Staging: Beispiel Zeitpunkt t7
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Bulk Data Staging: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal Zeitpunkt t1
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Bulk Data Staging: Beispiel Zeitpunkt t1
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Bulk Data Staging: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal Zeitpunkt t3
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Bulk Data Staging: Beispiel Zeitpunkt t3
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Bulk Data Staging: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal Zeitpunkt t5
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Bulk Data Staging: Beispiel Zeitpunkt t5
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Bulk Data Staging: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal Zeitpunkt t6
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Bulk Data Staging: Beispiel Zeitpunkt t6
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Bulk Data Staging: Beispiel Einkaufswagen 1 Einkaufswagen 2 Kasse 1 Regal Zeitpunkt t7
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Bulk Data Staging: Beispiel Zeitpunkt t7
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Benchmark
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Benchmark: Datenvolumina (in MB)
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Benchmark: Auswertungszeit (in ms)
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Benchmark: Data Staging Ereignisse (in events per second)
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Zusammenfassung & Ausblick
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Zusammenfassung und Ausblick Drei Ansätze für den Umgang mit Datenredundanz – No Path Extension – Read and Path – Read and Bulk Zwei Data Staging Algorithmen – Tupelbasiert – Bulk Weiterführende Arbeiten – mehrere Caches – Integration mit bestehende Verteile Anwendungen
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Quellen [GHLK06] Hector Gonzalez, Jiawei Han, Xiaolei Li, and Diego Klabjan. Warehousing and Analyzing Massive RFID Data Sets. ICDE IEEE Computer Society, [KAK07] Stefan Krompass, Stefan Aulbach, and Alfons Kemper. Data Staging for OLAP- and OLTP-Applications on RFID Data. BTW GI,2007.
Technische Universität München Fakultät für Informatik, Lehrstuhl Datenbanksysteme Nächste Woche ➔ Siherheit für dienstbasierte Infrastrukturen Markus Sieber