Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

DIFS: A Distributed Index for Features in Sensor Networks Seminar: Data Management in Wireless Sensor Networks Sebastian Knebel.

Ähnliche Präsentationen


Präsentation zum Thema: "DIFS: A Distributed Index for Features in Sensor Networks Seminar: Data Management in Wireless Sensor Networks Sebastian Knebel."—  Präsentation transkript:

1 DIFS: A Distributed Index for Features in Sensor Networks Seminar: Data Management in Wireless Sensor Networks Sebastian Knebel

2 DIFS: A Distributed Index for Features in Sensor Networks2 Gliederung 1.Einleitung 2.Events und Queries 3.Grundlagen und Voraussetzungen 3.1. GHT: A Geographic Hash Table 4.DIFS 4.1. Überblick 4.2. Design 4.3. Einfügen von Events 4.4. Queries für Events 4.5. Löschen von Events

3 DIFS: A Distributed Index for Features in Sensor Networks3 Gliederung 5.Analyse und Bewertung 6.Verbesserungsansätze

4 DIFS: A Distributed Index for Features in Sensor Networks4 1. Einleitung

5 DIFS: A Distributed Index for Features in Sensor Networks5 1. Einleitung Szenario: Beobachtung eines aktiven Vulkans

6 DIFS: A Distributed Index for Features in Sensor Networks6 1. Einleitung Temperatur- messung unter- halb der Oberfläche Sensorknoten verteilt um den Vulkan

7 DIFS: A Distributed Index for Features in Sensor Networks7 1. Einleitung bekannt: Energieverbrauch wesentlich in Sensornetzwerken größter Verbrauch durch Übertragung und Empfang von Daten Zugriff auf große Mengen an gesammelten Daten: –herkömmlich: Datenspeicherung in externem Punkt, außerhalb Sensorumgebung Problem: viel Dynamik, bottleneck am Gateway –besser: lokale Speicherung beim oder in der Nähe des Sensors

8 DIFS: A Distributed Index for Features in Sensor Networks8 1. Einleitung Lösung: Daten lokal gespeichert, Queries über Knoten laufen lassen und Knoten antworten ggf. ein möglicher Ansatz zur Energieerhaltung mittels: daten-centrischer Speicherung daten-zentrischer Speicherung (DCS): –alle Events bekannt, an einem Punkt im Netzwerk basierend auf Namen gespeichert –Queries werden zum dazugehörigen Knoten mit Daten bzw. Pointern geroutet

9 DIFS: A Distributed Index for Features in Sensor Networks9 1. Einleitung –unterstützt logische Zusammenführung Daten mit Queries, verhindert Überfluten –Geographic Hash Table beschreibt spezielle Lösung zur Archivierung –solange DCS recht generell, wird berichtet, wenn High- Level Event auftrat –Problem: wenn Event aus mehreren Attributen besteht, schwierig Werte abzugrenzen Lösung: DCS erweitern, damit Queries bestimmt Reichweiten/Wertebereiche unterstützen

10 DIFS: A Distributed Index for Features in Sensor Networks10 1. Einleitung DIFS: –verteilter Index –stellt für niedrige Such- und Speicherkommunikation Anforderungen bereit –versucht Anforderungen über beteiligte Knoten zu balancieren

11 DIFS: A Distributed Index for Features in Sensor Networks11 2. Events und Queries

12 DIFS: A Distributed Index for Features in Sensor Networks12 2. Events und Queries High-Level Events: –verschiedene Möglichkeiten der Kategorisierung, hier vier mögliche vorgestellt: Sensorwerte: - grob - umfasst High-Level Events, sowie zusammengesetzte Maßeinheiten (Durchschnitt, Median,...) - Vulkanbsp.: Höchsttemperatur, Mengen austretender Gase, Stärke an Erschütterung,...

13 DIFS: A Distributed Index for Features in Sensor Networks13 2. Events und Queries Timing-Parameter: - meist nicht ausreichend, wie Wert aussieht, sondern der zeitliche Verlauf Bsp.: Temperaturverläufe in einem Bereich des Vulkans räumliche Dimensionen: - gemeint physikalische Form und Standort des Events - Bsp.: Regionen unterschiedlicher Temperaturen Wo sind die heißen Bereiche am Vulkan? Wo ist das Risiko eines Ausbruchs am größten?

14 DIFS: A Distributed Index for Features in Sensor Networks14 2. Events und Queries Beziehungen zwischen Events: – Beziehungen bestehen letztendlich zwischen Events –z.B. wird der Wertebereich in die Umgebung oder Schnitt umgewandelt –Bsp.: Ein Gebiet mit Gas-Konzentration kann auch ein Gebiet hoher Temperatur sein. oftmals auch Kombination Queries durch einfache Komparatoren bewertet oder durch komplexe Berechnungsfunktion nach Gewichtung generiert

15 DIFS: A Distributed Index for Features in Sensor Networks15 3. Grundlagen und Voraussetzungen

16 DIFS: A Distributed Index for Features in Sensor Networks16 3. Grundlagen und Voraussetzungen

17 DIFS: A Distributed Index for Features in Sensor Networks GHT: A Geographic Hash Table liefert schlüssel-/wertbasierten, verteilten Index Events mit Schlüsseln benannt, Speicherung und Suche nutzen diese Schlüssel werden zu einer geographischen Position gehashed Geographisches Routing zur Bestimmung des Knotens in der Nähe der Position Knoten dienen dann als Rendevous-Punkt

18 DIFS: A Distributed Index for Features in Sensor Networks GHT: A Geographic Hash Table Events mit gleichen Schlüsseln Vermeidung eines Schwerpunktes auf dem Rendevous-Punkt durch structured replication structured replication: –benutzt hierarchische Zerlegung des geographischen Raumes –Event-Name wird zu einem geographischen Ort gehasht –Events werden nun in assoziierten Ort gespeichert in der Nähe des Lokalisierungsortes

19 DIFS: A Distributed Index for Features in Sensor Networks19 4. DIFS

20 DIFS: A Distributed Index for Features in Sensor Networks Überblick DIFS erweitert GHT um effiziente Bereichs-Queries balancierte Last über Knoten bleibt erhalten Grund: Nutzung eines vielfach hierarchischen Index DIFS enthält hierarchische Strukturen wie structured replication und Histogramme dabei: Nichtwurzelknoten können verschiedene Eltern haben Knoten speichern Events für eine Reihe von Werten, die in bestimmten geographischen Region erfasst wurden Schlüsselidee: Einbeziehung Schlüsselwert, Name des Events, Standort des Erfassungsknotens

21 DIFS: A Distributed Index for Features in Sensor Networks Design DIFS für folgende Ziele entwickelt: –balancierte Suchlösungen auch bei gestiegenem Gesamtverkehr bei Nachrichten und Speicherung –Suche von Daten mittels Name, Wertebereich, Standort sollen kommunikationseffizient und schnell sein –effiziente Antworten-Queries für verteilte Daten –sichere Transaktionen

22 DIFS: A Distributed Index for Features in Sensor Networks Design geographischen Hash innerhalb eines hierarchisch zerlegten Schlüsselraumes konstruiert Suchhierarchie jeder Kinderknoten hat num Eltern, wobei num = 2 i, i >= 1 Je weiter die räumliche Ausdehnung ist, über die der Index-Knoten bescheid weiß, um so mehr hängt der Wertebereich von Abdeckung ab. Neu: Attribut Flussdichte, repräsentiert, wie oft ein Phänomen in einem bestimmten Zeitraum an einem bestimmten Ort auftritt

23 DIFS: A Distributed Index for Features in Sensor Networks Design um Hierarchie aufzubauen, speichert Knoten Event- Vorinformationen in lokalen Index mit knappster räumlicher Überdeckung, aber größtem Wertebereich DIFS begrenzt Output der Hashfunktion auf ein Gebiet, das einen Knoten der Hierarchie abdeckt

24 DIFS: A Distributed Index for Features in Sensor Networks Design Bounding Box: –geographisch begrenzte Hashfunktion mit Input: Standort, Schlüssel, Bounding Box Output: Standort (innerhalb der Bounding Box) –Partitionierung des Netzes: Netzwerk rechteckig, in 4 gleichgroße Quadranten unterteilt, dies wiederum jeweils in 4 Subquadranten usw. Zuerst Hash-Standort (x h, y h ) generiert Nutzung 2 separater Hashfunktionen um Output-x- und y-Koordinaten zu generieren

25 DIFS: A Distributed Index for Features in Sensor Networks Design Länge l Breite w

26 DIFS: A Distributed Index for Features in Sensor Networks Einfügen von Events Berechnung des gehash-ten Standortes auf die verketteten Attribute und den Wertebereich Dimension der ersten Bounding Box ist die Minimumüberdeckungsregion des Indexknotens Bsp: Netzwerk Länge l, Breite w, DIFS-Level h Minimum-Bounding Box mit Breite und Höhe

27 DIFS: A Distributed Index for Features in Sensor Networks Einfügen von Events Blatt leitet periodisch Informationen als Histogramm zu num Eltern jeder für 1 / num der Werte verantwortlich Eltern haben jeweils vier Kinder alle Knoten vier Kinder (außer Blätter), num Eltern (außer Wurzel) Beispiel - ein wiederholt starker Temperaturanstieg: –Event bei Koordinaten (14, 37) und Flussdichte sei 57 –erwartete Aufteilung der Flussdichte [0,255] –minimale Bounding Box-Breite 8 Einheiten –num = 2

28 DIFS: A Distributed Index for Features in Sensor Networks Einfügen von Events Level-0-Knoten(14,37) Level-1-Knoten Zählerwerte [0,127] (0,32) – (16,47) Level-2-Knoten Zählerwerte [0,63] (0,32) – (32,63) usw. Event(Temperaturanstieg) Koordinaten (14,37) und Wert 57 [0,255]

29 DIFS: A Distributed Index for Features in Sensor Networks Queries für Events Queries über Wertebereich oder Verteilung beschrieben 1) durch Wert: –Vulkanologe interessiert an Flussdichtenbereich [47,68] –Querie zerlegt und übermittelt an die Knoten –Knoten behandeln diese wie folgt: wie bisher durch num Indexwertebereich reduziert Beispiel: –num = 4, quadratisches Netzwerk der Breite 128, minimale Indexüberdeckung der Breite 8,

30 DIFS: A Distributed Index for Features in Sensor Networks Queries für Events Wertebereich [0,255] Level-0-Knoten überdeckt 256 Werten über einer Breite von 8 jeder Level-1-Knoten 64 Werte mit Breite 16 jeder Level-2-Knoten 16 Werte mit Breite 32 jeder Level-3-Knoten 4 Werte mit Breite 64 jeder Level-4-Knoten 1 Wert mit Breite 128

31 DIFS: A Distributed Index for Features in Sensor Networks Queries für Events daraus ergibt sich minimaler Satz von Indexknoten, die exakt den Wertebereich überdecken –Zerlegung wählt dann diese kleinste Anzahl –durch Verwendung derselben Hashfunktion, wie bei Speichung, wird die Query bei diesen Indexknoten starten und sich zu jedem Event ausbreiten

32 DIFS: A Distributed Index for Features in Sensor Networks Queries für Events 2) durch Verteilung: –Queries auf der Verteilung der Daten aufwandsfrei ausführbar –Bedingung: Jedes Histogramm beinhaltet totale Anzahl an Werten über und unter dem Histogrammbereich und Zähler für jeden

33 DIFS: A Distributed Index for Features in Sensor Networks Löschen von Events Temperaturänderung ist unwichtig, Daten werden zu alt Blätterknoten kontrollieren das Einfügen, d.h. kommunizieren als einzige mit Speicherelementen Kontrollieren auch speicherinitierte Löschung von Indizes 2 Mechnismen vom Index aus: –explicit deletion –timeout explicit deletion erfordert einfach Entfernen der Pointer zum Speicherort der Events

34 DIFS: A Distributed Index for Features in Sensor Networks Löschen von Events timeout deletion erfordert einen time stamp zu jedem Pointer Periodische Überprüfung des Zeitstempels und Löschung, wenn größer als system-definiertes Alter weitere Möglichkeit search-initiated Knoten leitet Löschnachricht für einen Wertebereich weiter Pointer für Wertebereich werden gelöscht und ein flag, damit der Bereich nicht wieder indiziert wird

35 DIFS: A Distributed Index for Features in Sensor Networks35 5. Analyse und Bewertung

36 DIFS: A Distributed Index for Features in Sensor Networks36 5. Analyse und Bewertung bedeutet höhere Speicherkommunikationskosten als bei nicht-indizierte Techniken nach der Registierung entstehen weitere Kosten gleichförmige Verteilung führt zu hohen Suchkosten, da Suche zu allen Blättern Queries mit beschränkten Suchkriterien führen zu Beschneidung der Äste in Suchbäumen => niedrigere Suchkosten bottleneck Auslastung größtenteils reduziert

37 DIFS: A Distributed Index for Features in Sensor Networks37 5. Analyse und Bewertung bei kompletten Datenbereich keine bessere Leistung verbessert großbemessene Netzwerke durch Verwendung eines vielfach-gerooteten Baumes und der Balancierung des Kommunikations-Overhead über viele Knoten

38 DIFS: A Distributed Index for Features in Sensor Networks38 6. Verbesserungsansätze

39 DIFS: A Distributed Index for Features in Sensor Networks39 6. Verbesserungsansätze Toleranz bis zu einem bestimmten Grad an Datenverlust Indizierung mehrerer Attribute: –verschiedene Indizes für jedes Attribut –mehrere Attribute auf einen Index –n-dimensionale Histogramme für n Attribute über einen Index verbreitet –Verwendung einer Auswertung-/Schätzfunktion statt separater Attributbehandlung produziert Ranking, das indiziert wird

40 DIFS: A Distributed Index for Features in Sensor Networks40 6. Verbesserungsansätze Wie beeinflusst Indizierung von Teilen der Wertebereiche die Systemleistung? Suchkostenminimierung durch: –Hierarchische Ausbreitung durch Unicasts zu steuern –Routing zu den Knoten im höchsten Baum-Level, die Query Bereich vollständig abdecken, als Bereich zu zerlegen


Herunterladen ppt "DIFS: A Distributed Index for Features in Sensor Networks Seminar: Data Management in Wireless Sensor Networks Sebastian Knebel."

Ähnliche Präsentationen


Google-Anzeigen