Abschlussvortrag Diplomarbeit Daniel Weber

Slides:



Advertisements
Ähnliche Präsentationen
Be.as WEB Technologie
Advertisements

Objektrelationales Mapping mit JPA
ER-Datenmodell und Abfragen in SQL
Geometrische Datenstrukturen Haozhe Chen Aaron Richardson.
TelegraphCQ Manuel Hertlein.
System J – Compiler – Praktikum: Datenbanksystementwicklung Knut Stolze
Aufbau des Internets Überblick Prof. Dr. T. Hildebrandt
PlanetenWachHundNetz Instrumenting Infrastructure for PlanetLab.
Effizientes Routing in verteilten skalierbaren Datenstrukturen
Lehrstuhl Informatik III: Datenbanksysteme Achim Landschoof 28. April 2009 Strukturierte P2P Systeme 1 Achim Landschoof Betreuerin: Dipl.-Inf. Jessica.
MMQL – Multimedia Query Language Eine Anfragesprache für Multimedia-Ähnlichkeitsanfragen Christian Mantei.
Übung Datenbanksysteme SQL-Anfragen (2)
Übung Datenbanksysteme WS 2003/ Übung Datenbanksysteme Hierarchische DBMS
Einführung Dateisystem <-> Datenbanksystem
Content-Server Content Infra- struktur Streams Lösung Johannes Kohlmann, Universität Mannheim Content Server Johannes Kohlmann.
Aufgabe April 2004Übung Data Warehousing2 1: Accounts 'gruppe ' auf ' morawetz ' (IP: !) Oracle-Account gleichen Namens SQL*Plus:
Überlegungen zur Architektur eines Fachinformations-Netzwerkes am Beispiel des CeGIM Mehrwert ist es nicht nur, Daten von ihren Quellen zu den Nutzern.
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Diplomarbeit Thema: Untersuchungen zur Spezifikation und Realisierung von Interoperabilitätskonzepten (hauptsächlich) CORBA-basierter Multiagentensysteme.
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
... und alles was dazugehört
Clustered Neuronal Network A C#.NET project for Compute Cluster Server 2003.
Clustered Neuronal Network A C#.NET project for Compute Cluster Server 2003.
EXPLAIN PLAN - Erste Schritte April 2004EXPLAIN PLAN2 Was fehlt noch? Konkretes Beispiel für einen Plan.
Best Practices in der Datenbank-programmierung
PHP und MYSQL am Organisatorisches Der komplette Kurs im Schnelldurchgang Bewertung von wichtig und unwichtig Historisch Kulturwissenschaftliche.
A Social Tagging Environment for Web Information Extraction
SQL Überblick Abfragen aus einer Tabelle
WS 2012/13 Datenbanksysteme Fr 15:15 – 16:45 R Vorlesung #6 SQL (Teil 3)
WS 2013/14 Datenbanksysteme Do 17:00 – 18:30 R Vorlesung #6 SQL (Teil 3)
SS 2004 Datenbanken 4W Mi 13:30 – 15:00 G 2.30 Vorlesung #7 SQL (Teil 2)
WS 2011/12 Datenbanksysteme Mi 15:15 – 16:45 R Vorlesung #9 Physische Datenorganisation.
WS 2013/14 Datenbanksysteme D0 15:15 – 16:45 R Vorlesung #5 SQL (Teil 2)
WS 2007/08 Datenbanksysteme Mi 17:00 – 18:30 R Vorlesung #5 SQL (Teil 2)
Technische Information. © Sistema GeoDAT, S.L. 01/08/2004Sistema GeoDAT, S.L.2 SERVER … Betriebssysteme … –Microsoft Windows Server 2000 oder –Microsoft.
Datenbanksysteme für hörer anderer Fachrichtungen
WS 2011/12 Datenbanksysteme Fr 15:15 – 16:45 R Vorlesung #5 SQL (Teil 2)
Aggregatsfunktion SQL = Structured Query Language.
1 Gruppierung, Aggregierung und Sortierung (2) Abarbeitungsmodell bei Gruppierung: Werte from- und where-Klauseln aus wie bisher (Bildung von Kreuzprodukt.
SQL - Structured Query Language AIFB SS (1/9) Join-Operationen in SQL-92(1/9) Syntax einer Join-Operation: join-op := CROSS JOIN | [NATURAL]
Peer-to-Peer-Netzwerke
Structured Query Language
Directors Prof. Dr.-Ing. K.D. Müller-Glaser Prof. Dr.-Ing. J. Becker Prof. Dr. rer. nat. W. Stork Institute for Information Processing Technology.
Modellierungsspezialisten DRITTE NORMALFORM! „Bei der Abfrage, können wir dann alles wieder zusammenfügen!“
WS 2014/15 Datenbanksysteme D0 15:15 – 16:45 R Vorlesung #6 SQL (Teil 3)
SQL - Structured Query Language  AIFB SS (1/6) Spezielle Anfragen an eine Relation(1/6) projekt P-NAMEP-NRP-FILIALEP-LEITER p Karlsruhe3115.
Prolog: Datenbanken Inhalt - Überblick - Erstellen einer Datenbank
Datenbank für Skriptenverkauf
Datenbanken abfragen mit SQL
Eine komplexe Netzanwendung Webserver und Datenbankserver im Netzwerk in einer Anwendung einrichten.
Rechen- und Kommunikationszentrum (RZ) Sicherheitsorientierte Webentwicklung am Beispiel der Matse-Dienste Jan-Frederic Janssen.
Dr. Klaus Ruhlig Technology & Product Consulting Sun Microsystems, München Skalierbare Rechnerarchitekturen für ein DWH: Eine vergleichende Analyse.
Modellierungsspezialisten DRITTE NORMALFORM! „Bei der Abfrage, können wir dann alles wieder zusammenfügen!“
© CSP GmbH & Co. KG 2005 Einleitung HerausforderungenLösung Architektur Demonstration Langzeitarchivierung für Oracle Datenbanken Stefan Brandl, Dipl.-Inf.,
Erzeugung von hoch skalierbaren virtuellen Welten Seminar Algorithmen zur Unterstützung von Immersive Gaming Philip Mildner, 8. Oktober 2008.
Vs Verteilte Hash-Tabellen (distributed hastables, DHT) am Beispiel von Chord (Stoica et al. 2001) Ziel:"Gutes" Verteilen von Informationen auf.
Intelligent Solutions The Energie Steiermark is Austria’s 4 th -largest energy company, focused on providing its customers with electricity,
Übung Datenbanksysteme I SQL
Frank Schneede Senior Berater ORACLE Deutschland GmbH.
Vorlesung #4 Relationales Kalkül und SQL (Teil 1)
Vorlesung #6 SQL (Teil 3).
SQL Join.
Wirtschaftsinformatik
Frank Schneede Senior Berater ORACLE Deutschland GmbH.
Left Join, Right Join, Outer Join
SQL Join.
Indexierung Oracle: indexes Indexierung.
Mehr Möglichkeiten mit der SQL-Version
Abfragestrategien in verteilten Systemen
 Präsentation transkript:

Abschlussvortrag Diplomarbeit Daniel Weber Distributed Query Processing for Locality-Aware Data in P2P Networks - HiSbase - Abschlussvortrag Diplomarbeit Daniel Weber 6. April 2019 Daniel Weber

Einordnung und Motivation Ziele Anfragebearbeitung Evaluation Ausblick Überblick Einordnung und Motivation Ziele Anfragebearbeitung Evaluation Ausblick 6. April 2019 Daniel Weber

Einordnung und Motivation Astrophysik / GAVO Große Datenmengen in astrophysikalischen Katalogen Crossmatching: Übereinstimmungen in verschiedenen Katalogen Flaschenhals der zentralen Verarbeitung der Daten 6. April 2019 Daniel Weber

Einordnung und Motivation Ziele Anfragebearbeitung Evaluation Ausblick Überblick Einordnung und Motivation Ziele Anfragebearbeitung Evaluation Ausblick 6. April 2019 Daniel Weber

Crossmatching direkt auf den Peers welche die Daten halten Ziele Verteilung der Daten in einem P2P-System unter Beibehaltung der Lokalität Nicht nur Ausnutzung der Rechen- und Plattenkapazität sondern auch des Hauptspeichers der teilnehmenden Peers Crossmatching direkt auf den Peers welche die Daten halten 6. April 2019 Daniel Weber

eindimensionaler zirkulärer Keyspace Routing: P2P-System: Pastry eindimensionaler zirkulärer Keyspace Routing: leaf set: Nachbarn im Keyspace neighbourhood set: Nachbarn im Netz routing table: Prefix-Routing zu anderen Peers konfigurierbare Metrik zur Bestimmung der Netznachbarschaft 6. April 2019 Daniel Weber

Abbildung von Regionen statt Datenpunkten auf das P2P-Netz Lokalität Abbildung von Regionen statt Datenpunkten auf das P2P-Netz 6. April 2019 Daniel Weber

Lokalitätserhaltende Datenstrukturen 1 4 5 2 3 6 7 8 9 12 13 10 11 14 15 32 33 36 37 34 35 38 39 40 41 44 45 42 43 46 47 16 17 20 21 18 19 22 23 24 25 28 29 26 27 30 31 48 49 52 53 50 51 54 55 56 57 60 61 58 59 62 63 9 8 7 6 1 2 3 4 5 6. April 2019 Daniel Weber

Pastry: Routing auf dem Ring B C 6. April 2019 Daniel Weber

Crossmatching Grobes Vorfiltern Feinarbeit auf kleiner Datenmenge 6. April 2019 Daniel Weber

Crossmatching in SQL select ... from catalogue1 as c1 left outer join catalogue2 as c2 on abs(c1.ra-c2.ra) < r and abs(c1.dec-c2.dec) < r and (c1.x*c2.x+c1.y*c2.y+c1.z*c2.z) < cos(radians(r)) where ... 6. April 2019 Daniel Weber

Crossmatching: Herausforderung Stauchungen in Polarregionen 6. April 2019 Daniel Weber

Crossmatching in SQL select ... from catalogue1 as c1 left outer join catalogue2 as c2 on abs(c1.ra-c2.ra) < case when abs(c1.dec)+r > 89.9 then 180 else degrees(abs(atan(sin(radians(r)) / sqrt(abs(cos(radians(c1.dec-r)) * cos(radians(c1.dec+r))))))) end and abs(c1.dec-c2.dec) < r and (c1.x*c2.x+c1.y*c2.y+c1.z*c2.z) < cos(radians(r)) where ... 6. April 2019 Daniel Weber

Crossmatching in HiSbase select ... from catalogue1 as c1 left outer join catalogue2 as c2 on xmatch(c1,c2,r) where ... Umwandlung XMATCH-Notation in SQL durch HiSbase 6. April 2019 Daniel Weber

Einordnung und Motivation Ziele Anfragebearbeitung Evaluation Ausblick Überblick Einordnung und Motivation Ziele Anfragebearbeitung Evaluation Ausblick 6. April 2019 Daniel Weber

Anfragen: Der Weg zu den Daten Antworten: Der Weg der Daten zurück Anfragebearbeitung Anfragen: Der Weg zu den Daten Antworten: Der Weg der Daten zurück Fehlerbehandlung 6. April 2019 Daniel Weber

Anfragebearbeitung – Teil 1 C D1 D2 D3 D4 P I FullQueryMsg PreparedQueryMsg PartialQueryMsgs Vorbereitung der Anfrage: Ermittlung betroffener Regionen Übersetzung des XMATCH Auswahl des Koordinators Koordination der Anfrage: Befragen aller Regionen Sammeln der Antworten Abarbeitung der Anfrage: Direkt auf den Peers Erkennen doppelter Anfragen 6. April 2019 Daniel Weber

Anfragebearbeitung – Teil 2 FullAnswerMsg PartialAnswerMsgs C D1 D2 D3 D4 P I Sammeln der Antworten: Wann sind alle eingetroffen? Ggf. Duplikate entfernen Transfer der Antworten: Transport zurück zum Ursprung der Anfrage 6. April 2019 Daniel Weber

Anfragebearbeitung im Fehlerfall FullErrorMsg PartialErrorMsg C D1 D2 D3 D4 P I Meldung des Fehlers an den Koordinator Abbruch der weiteren Koordination Meldung an den Ursprungsknoten 6. April 2019 Daniel Weber

Einordnung und Motivation Ziele Anfragebearbeitung Evaluation Ausblick Überblick Einordnung und Motivation Ziele Anfragebearbeitung Evaluation Ausblick 6. April 2019 Daniel Weber

730 (bzw. 1460) Anfragen je Knoten bei verschiedenen MPLs Evaluationssetup 16 PCs mit je 512 MB RAM gegen 1 Server mit 2 GB RAM 208 Regionen 730 (bzw. 1460) Anfragen je Knoten bei verschiedenen MPLs Ziel: Messung des Durchsatzes 6. April 2019 Daniel Weber

Evaluationsanfragen zufällige Auswahl von Objekten aus 2MASS und ROSAT Suche von „Treffern“ dazu in SDSS Bildung von Anfrage-fenstern durch Auf- und Abrunden 6. April 2019 Daniel Weber

6. April 2019 Daniel Weber

Evaluationsergebnisse Superlineare Steigerung des Durchsatzes bei 16 Knoten MPL-Maximum bei einem Knoten zwischen 5 und 10 parallelen Anfragen MPL-Maximum bei 16 Konten bei 600 parallelen Anfragen (je Knoten!) 6. April 2019 Daniel Weber

Einordnung und Motivation Ziele Anfragebearbeitung Evaluation Ausblick Überblick Einordnung und Motivation Ziele Anfragebearbeitung Evaluation Ausblick 6. April 2019 Daniel Weber

Ausblick: Alternative Koordinatorauswahl Bisher: immer „erster“ betroffener Knoten als Koordinator Besser: „mittlerer“ Knoten, da dieser vermutlich mehr angefragte Regionen abdeckt Dadurch Reduzierung der transportierten Datenmenge B A C 6. April 2019 Daniel Weber

Zusätzliche Ausgabeformate Handhabung von Query-Hot-Spots Ausblick: Weiteres Anbindung von Clients Zusätzliche Ausgabeformate Handhabung von Query-Hot-Spots 6. April 2019 Daniel Weber

Verteilte Anfragebearbeitung Evaluation von HiSbase Zusammenfassung Verteilte Anfragebearbeitung Evaluation von HiSbase 6. April 2019 Daniel Weber