Effizientes Routing in verteilten skalierbaren Datenstrukturen

Slides:



Advertisements
Ähnliche Präsentationen
1 Multicast Routing in Ad Hoc Netzen.ppt Oliver Finger_ TECHNISCHE UNIVERSITÄT ZU BRAUNSCHWEIG CAROLO-WILHELMINA Institut für Betriebssysteme und.
Advertisements

Randomisierte Algorithmen für Verteilungsprobleme
Kohonennetze für Information Retrieval mit User Feedback
IT-Projektmanagement
Heterogene Informationssysteme
Hash-Tabellen und -Funktionen Hash-Tabellen in Java
Eine dynamische Menge, die diese Operationen unterstützt,
Inkrementelle Entwicklung von virtuellen Kooperationsstrukturen
Christian Schindelhauer
Universität Rostock Fakultät für Informatik und Elektrotechnik Institut für Informatik, Lehrstuhl DBIS Albert-Einstein-Straße 21, D Rostock Putbus,
:33 Internet Applikationen – Hard und Softwareplattform Copyright ©2003, 2004 Christian Donner. Alle Rechte vorbehalten. Architektur Moderner.
PlanetenWachHundNetz Instrumenting Infrastructure for PlanetLab.
Kapitel 6. Suchverfahren
<d,a,s, ,i,s,t, ,e,i,n,e, ,L,i,s,t,e>
H. Niemann OFFIS Escherweg Oldenburg
Seminar Internet-Dienste
Web-CMS der Universität Ulm
1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Algorithmen für Peer-to-Peer-Netzwerke Sommersemester Vorlesung.
HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Algorithmen des Internets Sommersemester Vorlesung Christian.
1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Algorithmen für Peer-to-Peer-Netzwerke Sommersemester Vorlesung.
1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Algorithmen für Peer-to-Peer-Netzwerke Sommersemester Vorlesung.
Medienkonzept und Medienentwicklungsplanung
Lehrstuhl Informatik III: Datenbanksysteme Achim Landschoof 28. April 2009 Strukturierte P2P Systeme 1 Achim Landschoof Betreuerin: Dipl.-Inf. Jessica.
Web 3.0 – Programmierung – Semantic Web / CIDOC CRM
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Peer-to-Peer- Netzwerke Christian Schindelhauer Sommersemester.
Referent: Jan Kretzschmar1 Seminar Informationsverwaltung in Netzen Thema: RDF - Beschreibungen und Peer - To - Peer Routing Referent: Jan Kretzschmar.
XML in Client-Server und GRID Architektur
1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Algorithmen für Peer-to-Peer-Netzwerke Sommersemester Vorlesung.
1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Algorithmen für Peer-to-Peer-Netzwerke Sommersemester Vorlesung.
1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Algorithmen für Peer-to-Peer-Netzwerke Sommersemester Vorlesung.
Introducing the .NET Framework
Routingverfahren in Content Delivery Networks
Cachingverfahren und Proxies Teil 1
Content-Server Content Infra- struktur Streams Lösung Johannes Kohlmann, Universität Mannheim Content Server Johannes Kohlmann.
Algorithmen zur Unterstützung von Immersive Gaming
1 Thomas Butter Content Delivery Networks Peer-to-Peer Netze Thomas Butter
Einführung in die Technik des Internets
Evaluierung des ITU-T.124 Telekonferenzstandards
Mark Doll – 1/21V3D2 Workshop 2003, Frankfurt/Main 19./ http:// Ansätze für eine Web-basierte Initiierung qualitätsbasierter Kommunikationsdienste.
Datenverteilung in Ad-hoc Netzen 1/24 Adaptive Datenverteilung in mobilen Ad-hoc Netzen unter Verwendung des Area Graph basierten Bewegungsmodells S. Bittner,
Peer-to-Peer-Netzwerke
Peer-to-Peer-Netzwerke
Entwicklung verteilter Anwendungen II, SS 13 Prof. Dr. Herrad Schmidt SS 13 Kapitel 4 Folie 2 REST Web Services (1)
Universität Zürich Informatikdienste GoKoordinatorenmeeting 27. April UZH Global Storage Projekt.
Anwendungen Servlet II Formular Auswertung Zähler
Netzwerke.
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Peer-to-Peer- Netzwerke Christian Schindelhauer Sommersemester.
Algorithmen und Datenstrukturen Übungsmodul 11
Effiziente Filterung in zentralisierten und verteilten Benachrichtigungssystemen Sven Bittner, 7. November 2003 Arbeitsgruppe Datenbanken und Informationssysteme,
Rechnersysteme: Halbzeit Marcel Waldvogel. Marcel Waldvogel, IBM Zurich Research Laboratory, Universität Konstanz, , 2 Daten und Information.
1 Vorbesprechung Seminar: Weitverteiltes Rechnen mit dem Grid (SE 2.0, ) LVA-Leiter: T. Fahringer Büro: 8/09 Tel.: Mail:
Peer-to-Peer-Netzwerke
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Peer-to-Peer- Netzwerke Christian Schindelhauer Sommersemester.
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Peer-to-Peer- Netzwerke Christian Schindelhauer Sommersemester.
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Peer-to-Peer- Netzwerke Christian Schindelhauer Sommersemester.
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Peer-to-Peer- Netzwerke Christian Schindelhauer Sommersemester.
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Peer-to-Peer- Netzwerke Christian Schindelhauer Sommersemester.
Peer-to-Peer-Netzwerke
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Peer-to-Peer- Netzwerke Christian Schindelhauer Sommersemester.
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Peer-to-Peer- Netzwerke Christian Schindelhauer Sommersemester.
1 Karim El Jed TECHNISCHE UNIVERSITÄT ZU BRAUNSCHWEIG CAROLO-WILHELMINA Institut für Betriebssysteme und Rechnerverbund
->Prinzip ->Systeme ->Peer – to – Peer
Vortrag - Diplomarbeiten (HS I)
University of Würzburg Informatik III (Distributed Systems) Prof. Dr. P. Tran-Gia www3.informatik.uni-wuerzburg.de Towards Efficient Simulation of Large.
Computer Networks Group Universität Paderborn Pro/Seminar Rechnernetze WS 07/08 Holger Karl.
1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Algorithmen für Peer-to-Peer-Netzwerke Sommersemester Vorlesung.
Application Service Providing „Jetzt kann jeder an unserem Erfolg teilhaben“
Parallelising Molecular Dynamics for Message Passing Systems (complete) Martin Gerber
Systeme II 6. Die Anwendungsschicht
Abschlussvortrag Diplomarbeit Daniel Weber
 Präsentation transkript:

Effizientes Routing in verteilten skalierbaren Datenstrukturen Otto-von-Guericke – Universität Magdeburg Arbeitsgruppe Data and Knowledge Engineering Institut für Technische und Betriebliche Informationssysteme Effizientes Routing in verteilten skalierbaren Datenstrukturen Leipzig, 27.02.2003 Erik Buchmann, Klemens Böhm {buchmann|kboehm}@iti.cs.uni-magdeburg.de

Merkmale von Peer-to-Peer Systemen alle Knoten gleichberechtigt, keine Trennung Client - Server dynamisch skalierbar auf sehr viele, unabhängige Rechner jeder neue Teilnehmer bringt neue Ressourcen ein wirtschaftlicher Betrieb, keine Rechenleistung auf Vorrat

Peer-to-Peer Datenstrukturen Zahlreiche Anwendungen, z.B.: Index- oder Speicherstruktur bei DBMS Object Lookup in sehr großen Datenbeständen / sehr vielen Rechnern Auslieferung von Webseiten Operationen: put(Key,Value), get(Key) Selbstorganisation, selbständige Entscheidungen über Replikation, Lastausgleich, Datenverteilung Varianten: CAN, Chord, Pastry, P-Grid etc.

Content-Adressable Networks Jeder Knoten hat eigenen, n-dimensionalen Schlüsselbereich (Torus) kennt alle Nachbarn seines Schlüsselbereichs leitet Messages an Nachbarn in Richtung des Ziels weiter 13 4 5 3 1 12 2 9 8 10 7 6 11

Routing im CAN Operationen: put(Key,Value), get(Key) 13 4 5 3 1 12 2 9 8 10 7 6 11 get(k) Operationen: put(Key,Value), get(Key) Transformation der Anwendungs- schlüssel in CAN-Schlüssel: (Schlüssel) → {k0,k1,...,kn} "www.erikbuchmann.de" → {81256,12445} Nachrichten an den Knoten weitergeben, dessen Schlüsselraum den geringsten Abstand zum Zielpunkt aufweist Kritische Größe: Message Hops pro Operation

Vorschlag 1: Kontaktdaten-Cache zusätzlich zu den Nachbarn weitere Knoten in der Kontaktliste halten veraltete / unvoll- ständige Infor- mationen möglich Informationsbe- schaffung ohne zusätzliche Messages

Fragen im Zusammenhang mit dem Kontaktdaten-Cache Wahl der richtigen Größe des Cache zu klein: ineffektiv zu groß: veraltete Einträge, hoher Ressourcenverbrauch Wahl der optimalen Ersetzungsstrategie wenig veraltete Einträge, kurze Wege zu häufig nachgefragten Datenobjekten Nutzen bei realen Daten unser Szenario: Einsatz bei einem Web-Service

Durchführung der Experimente Simulationsumgebung PC-Cluster aus 32 Rechnern 2GHz-P4, 2 GB RAM, 100 MBit-Ethernet CAN-Prototyp 100.000 Knoten 1.000.000 Abfragen 2D-Schlüsselraum Experimente sowohl mit künstlich generierten als auch mit echten Testdaten

Experiment 1: Cache-Größe bereits geringe Cache-Größe verringert Messages um 2/3

Vorschlag 2: Lokalitätserhaltende Schlüsselabbildung Eingriff bei der Abbildung von Anwendungsschlüsseln auf CAN-Schlüssel Klassisch: Gleichverteilung der Schlüsselwerte z.B. Hash-Funktion soll gleichmäßige Auslastung sicherstellen keine Berücksichtigung der Abfragelokalität Lokalitätserhaltende Schlüsselabbildung Abruf benachbarter Objekte zu konstanten Kosten

Realisierung lokalitätserhaltender Schlüsselabbildung Beispiel: URLs Schlüsselraum des CAN: Schlüsselwerte: /iti_dke/ /iti_dke/lehre/ /iti_dke/lehre/ecommerce.html /~buchmann/index.htm /~buchmann/styles.css /~buchmann/back.jpg /~buchmann/empty.gif /~buchmann/logo.jpg /~buchmann/progrs.htm /~buchmann/arrowleft.gif /~buchmann/main.gif /~buchmann/arrowright.gif

Experiment 2: Schlüsselabbildung Gleichverteilung (Zufallsgenerator) Mittlere Anfragelokalität (Künstliche Websurfer) Hohe Anfragelokalität (Webserver-Log) Zahl der Messages konnte nahezu halbiert werden!

Vorschlag 3: Caching-Strategie Optimierung des Kontaktdaten-Cache durch Wahl einer Verdrängungsstrategie Experimente: Random, LRU, LRD, LFU, ISD ISD: Inverse Square Distribution für P2P-Datenstrukturen entwickelt Wahrscheinlichkeit für ein Node im Cache umgekehrt proportional zum Quadrat der überbrückten Distanz Aber: Ersetzungsstrategie hat keinen großen Einfluß

Zusammenfassung und Ausblick wir haben: ein prototypisches, flexibel anpassbares Content- Adressable Network einen Cluster, auf dem auch 500.000 parallel arbeitende Peers möglich sind erste Anwendungen und realistische Testszenarien erste Erfolge: winziger Cache für Kontaktdaten beschleunigt Routing die lokalitätserhaltende Abbildung der Anwendungs- schlüssel steigert die Routing-Performanz weiter zukünftige Vorhaben: Entwicklung von Anwendungen, Replikation, Lastausgleich