Hauptspeicher- Datenbanksysteme

Slides:

Advertisements

Ähnliche Präsentationen

Partitionierungstechniken in Datenbanksystemen

Advertisements

Geometrische Datenstrukturen Haozhe Chen Aaron Richardson.

KA – Rechnerarchitektur I ____________________________________________________________________________________________ ____________________________________________________________________________________________.

Fakultät für informatik informatik 12 technische universität dortmund Optimizations Peter Marwedel TU Dortmund Informatik 12 Germany 2009/01/17 Graphics:

Peter Marwedel TU Dortmund, Informatik 12

Aufgabenbesprechung Programming Contest. Order 7 Bo Pat Jean Kevin Claude William Marybeth 6 Jim Ben Zoe Joey Frederick Annabelle 0 SET 1 Bo Jean Claude.

Anfrage-Optimierung und -Bearbeitung in Verteilten DBMS

Lehrstuhl Informatik III, DatenbanksystemeMartin Wimmer Übung zu Architektur und Implementierung von Datenbanksystemen 1 Implementierungen des Join- Operators.

Datenbanksysteme in der Zukunft. © Prof. T. Kudraß, HTWK Leipzig Entwicklungslinien 1. Object Relational Arrives 2. Databases in the Cloud 3. Queues,

Kap.6 Datenstruktur für Peripheriespeicher Kap.6.0 Plattenspeicher

Vorlesung 2 Rechnerarchitektur Peter B. Ladkin Wintersemester 2001/2002 Universität Bielefeld Technische Fakultät.

Content-Server Content Infra- struktur Streams Lösung Johannes Kohlmann, Universität Mannheim Content Server Johannes Kohlmann.

1 Kapitel 12: Transaktionsverwaltung. 2 Transaktion Bündelung mehrerer Datenbankoperationen Mehrbenutzersynchronisation Recovery.

Open Source Prozessor Leon2 Peer Royla und Marco Siebert RST-Labor WS 04/05 Prof. Dr.-Ing. Thomas Risse.

EPIC, IA-64 und Itanium Eine Kurzpräsentation von Jan Hübbers bei Prof. Dr.-Ing. Risse im Fach Labor Rechnerstrukturen an der Hochschule Bremen

Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.

Inhalt Der Cell Prozessor Aufbau des Cells Platine Block Diagramm

Hauptspeicher- Datenbanksysteme

Mehrrechner-Datenbanksysteme

EXPLAIN PLAN - Erste Schritte April 2004EXPLAIN PLAN2 Was fehlt noch? Konkretes Beispiel für einen Plan.

1 Ein kurzer Sprung in die tiefe Vergangenheit der Erde.

Technische Universität München Fakultät für Informatik Transactions AND Analytics OLTP AND OLAP in Main Memory Database Systems HyPer one size fits all...

1 J4 Hash-Join R und S werden mittels der gleichen Hashfunktion h – angewendet auf R.A und S.B – auf (dieselben) Hash- Buckets abgebildet Hash-Buckets.

DW-Architektur: Row Store vs Column Store

Chair of Informatics III: Database Systems Multi-Core-Algorithmik für Datenbankanwendungen Alfons Kemper, Thomas Neumann, Florian Funke, Henrik Mühe,

SQL Azure Administration

Charakteristika von Unternehmensanwendungen. Wozu werden Unternehmensanwendungen genutzt? Enterprise applications are about the display, manipulation,

You need to use your mouse to see this presentation © Heidi Behrens.

3.4 CPU-Chips und Busse CPU-Chips

WS 2007/08 Datenbanksysteme Mi 17:00 – 18:30 R Vorlesung #10 Physische Datenorganisation.

WS 2011/12 Datenbanksysteme Mi 15:15 – 16:45 R Vorlesung #9 Physische Datenorganisation.

Fusszeilentext – bitte in (Ansicht – Master – Folienmaster, 1. Folie oben) individuell ändern! Danach wieder zurück in Normalansicht gehen! 1 OTR Shearography.

Grundlagen der Informatik

Berner Fachhochschule Hochschule für Agrar-, Forst- und Lebensmittelwissenschaften HAFL Recent activities on ammonia emissions: Emission inventory Rindvieh.

Vorlesung Datenbanksysteme vom Physische Datenorganisation

Arne Tornieporth Freitag, 31. März 2017 Hannover

SAN der zweiten Generation Compellent … in weniger Speicher investieren Christian Browers – BDM - DE / A / CH.

Vorlesung #10 Physische Datenorganisation

ADAT©2010 Dipl. - Ing. Andrea SabinSeite: 1 Version 1.0c Adat Semester 1.

By: Jade Bowerman. German numbers are quite a bit like our own. You start with one through ten and then you add 20, 30, 40 or 50 to them. For time you.

Structured Query Language

Central Processing Unit von David Kleuker und Thomas Auner

WS 2004/2005 Datenbanken II - 5W Mi 17:00 – 18:30 G 3.18 Vorlesung #3 Anfragebearbeitung (Teil 1)

1 Mehrrechner- Datenbanksysteme Grundlegende Architekturen Anfragebearbeitungstechniken.

Der formelle Imperativ – the Imperative

1 Public libraries’ perspectives in the digital media world Doom or bloom: reinventing the library in the digital age 29th October 2009 Christian Hasiewicz.

Institut für Angewandte Mikroelektronik und Datentechnik Phase 5 Architectural impact on ASIC and FPGA Nils Büscher Selected Topics in VLSI Design (Module.

Vorlesung Datenbanksysteme vom Physische Datenorganisation

Synchronization: Multiversion Concurrency Control

Mag. Thomas Hilpold, Universität Linz, Institut für Wirtschaftsinformatik – Software Engineering 1 Algorithmen und Datenstrukturen 1 SS 2002 Mag.Thomas.

Charakteristika von Unternehmensanwendungen. Wozu werden Unternehmensanwendungen genutzt? “Enterprise applications are about the display, manipulation,

Datenbanken abfragen mit SQL

Berliner Elektronenspeicherring-Gesellschaft für Synchrotronstrahlung m.b.H., Albert-Einstein-Straße 15, Berlin frontend control at BESSY R. Fleischhauer.

Kapitel 8 Grammar INDEX 1.Command Forms: The Du-Command Form & Ihr- Command 2.Sentences & Clauses.

© LIT Stadthagen KayCode: A digitally signed QR-code Can not be forged Blended into the product and linked to a website with information and service for.

Das Wetter Lernziele: Heute: The „Wenn“ clause! - To describe and report the weather - To discuss activities done in different types of weather - To compare.

Lync and Learn mit Manfred Helber Thema heute: Überblick der Leistungserweiterungen von Windows Server 2016 Start: 9.30 Uhr 30 Minuten Vortrag & Demo 30.

Hauptspeicher- Datenbanksysteme Hardware-Entwicklungen Anwendungsstudie: Handelsunternehmen Column- versus Row-Store OLAP&OLTP: Snapshotting Kompaktifizierung.

Oracle Exadata und HP Oracle Database Machine © 2008 Oracle Corporation – Proprietary and Confidential Alfred Schlaucher (Oracle Data Warehouse) EXTREME.

Dr. Klaus Ruhlig Technology & Product Consulting Sun Microsystems, München Skalierbare Rechnerarchitekturen für ein DWH: Eine vergleichende Analyse.

LLP DE-COMENIUS-CMP Dieses Projekt wurde mit Unterstützung der Europäischen Kommission finanziert. Die Verantwortung für den Inhalt dieser.

DOAG SID Data Warehouse

Gastvortrag HoloLens Programm Über mich HoloLens Daten Bedienung

The IT–Information System

Kleidung A presentation on clothes. The last slide has a ‘Beat the image’ game. Children should either try to say the word before it disappears off the.

Data Hazards 0x30 sub $6 $0 $1 0x34 add $7 $6 $

Telling Time in German Deutsch 1 Part 1.

Indexierung Oracle: indexes Indexierung.

Official Statistics Web Cartography in Germany − Regional Statistics, Federal and European Elections, Future Activities − Joint Working Party meeting.

OFFICE 365 FOCUS SESSION SHAREPOINT ONLINE 101:LERNE DIE BASICS 19. März 2018 Höhr-Grenzhausen.

Präsentation transkript:

Hauptspeicher- Datenbanksysteme Hardware-Entwicklungen Anwendungsstudie: Handelsunternehmen Column- versus Row-Store OLAP&OLTP: Snapshotting Kompaktifizierung Mehrbenutzersynchronisation Indexierung Multi-Core Anfragebearbeitung

Vortrag am Freitag Marcel Kornacker Cloudera Impala 13 Uhr

Hauptspeicher-Datenbanksysteme Disk is Tape, Tape is dead … Jim Gray Die Zeit ist reif für ein Re-engineering der Datenbanksysteme Man kann heute für 25000 Euro einen Datenbankserver mit 1 TeraByte Hauptspeicher und 32 Rechenkernen kaufen

Einsatz von Hauptspeicher-Datenbanksystemen

Feasibility: Main Memory DBMS Amazon Data Volume Revenue: 15 billion Euro Avg. Item Price: 15 Euro 1 billion order lines per year 54 Bytes per order line 54 GB per year + additional data - compression Transaction Rate Avg: 32 orders per s Peak rate: Thousands/s + inquiries Intel Tera Scale Initiative Server with several TB main memory We just ordered one from Dell for 49 K Euro Main Memory capacity will grow faster than Customers‘ Needs Cf. RAMcloud-project at Stanford Ousterhoud et al.

Leistungsengpässe: Profiling eines klassischen Datenbanksystems

Widerholung: Speicherhierarchie Register (L1/L2/L3) Cache Hauptspeicher Plattenspeicher Archivspeicher

Überblick: Speicherhierarchie Register Cache Hauptspeicher Plattenspeicher Archivspeicher 1 – 8 Byte Compiler 8 – 128 Byte Cache-Controller 4 – 64 KB Betriebssystem Benutzer

Überblick: Speicherhierarchie 1-10ns Register 10-100ns Cache 100-1000ns Hauptspeicher 10 ms Plattenspeicher sec Archivspeicher Zugriffslücke 105

Überblick: Speicherhierarchie 1-10ns Register 10-100ns Cache 100-1000ns Hauptspeicher 10 ms Plattenspeicher sec Archivspeicher Kopf (1min) Raum (10 min) München (1.5h) Pluto (2 Jahre) Andromeda (2000 Jahre) Zugriffslücke 105

Row Store versus Column Store

Row Store versus Column Store

Anfragebearbeitung

Komprimierung

Datenstrukturen einer Hauptspeicher-Datenbank

Row-Store-Format

Column-Store-Format

Column-Store-Format (cont‘d)

Einfügeoperation eines Tupels Insert into Verkaeufe values (12, 007, 4711, 27.50)

Anfragen

Hybrides Speichermodell

Anfragebearbeitung

Anwendungsoperationen in der Datenbank: Stored Procedures

Snapshots für Anfragen Snapshot der Haupt-Datenbank OLAP Haupt-Datenbank OLTP

Update Staging: In vielen Systemen verwendet, zB. NewDB von SAP

Scan-only Datenbanken: ISAO von IBM oder Crescando von der ETHZ

Ursprüngliches Schattenspeicher-Verfahren: Lorie77 für IBM System R

Copy on Write Update aa‘ 2 µs

Snapshotting via fork-ing: Details

Snapshot Maintenance: copy on write

Fast because of Hardware-Support: MMU

OLAP Queries on Tx-Consistent Snapshots

Multiple Query Sessions

Synchronization-Assertions Serializability of the OLTP Transactions What else if executed serially We support full ACID  see coming slides Snapshot isolation of the OLAP queries Multi-version mixed synchronization method Several OLAP queries form one Tx = OLAP Session Bernstein, Hadzilacos, Goodman: Chapter 5.5

Kompaktifizierung: Motivation

Kompaktifizierung der Datenbank

Invalidierung gefrorener Datenobjekte

Transaktionsverwaltung: serielle Ausführung auf Partitionen

Snapshot used for Tx-consistent Backup

Logging the Transaction Processing To Storage Server via 10 Gb/s rDMA Interface (e.g. Myrinet or Infiniband)

Isolation von OLAP und OLTP

Tentative Ausführung langer Transaktionen

High Availability & Load Balancing Active for OLAP Stand-By for OLTP Possible for Backup

Row-Store A B C D E F Column-Store A B C D E F

Indexstrukturen für Hauptspeicher-Datenbanken Radix-Baum / Trie / Präfixbaum

Idee des Adaptiven Radix-Baums ART

Adaptive Knoten des ART-Baums

Join-Berechnung Cache-Lokalität Mehrkern-Parallelität NUMA-Berücksichtigung Synchronisations-freie Parallelität

Grundidee des hoch-parallelen Sort/Merge-Joins

Bereichspartitionierung

Hochparallel Bereichs/Radix-Partitionierung

Paralleler Radix-Join

Mehrfache Partitionierung des Radix-Joins: Cache-Lokalität

Hash-Join-Teams: Globale Hashtabelle

Algorithmen auf sehr großen Datenmengen R  S S 44 17 97 5 6 27 2 13 9 R 2 3 44 5 78 90 13 17 42 89 Nested Loop: O(N2) Sortieren: O(N log N) Partitionieren und Hashing