Datenbanksysteme in der Zukunft. © Prof. T. Kudraß, HTWK Leipzig Entwicklungslinien 1. Object Relational Arrives 2. Databases in the Cloud 3. Queues,

Slides:



Advertisements
Ähnliche Präsentationen
Persistente Domänenmodelle mit JPA 2.0 und Bean Validation
Advertisements

Web Storage System - Einrichten, Verwalten und Anwendungsmöglichkeiten
Projekte mit SQL Remote Einführung Objekt-DB Radeberger Ein aktuelles Projekt : mediakey
Rechnernetze und verteilte Systeme (BSRvS II)
Datenbanken Einführung.
Folien 2-5, 7-8 © Prof. Dr. Manfred Rössle (FH Aalen)
Objekt – Relationales – Modell Tomasz Makowski IN
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Lightweight Directory Access Protocol
Universität Paderborn
Objektrelationales Mapping mit JPA
Objektorientierter Entwurf (OOD) Übersicht
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Client-Server-Architekturen
Oracle PL/SQL Server Pages (PSP). © Prof. T. Kudraß, HTWK Leipzig Grundidee: PSP – Internet-Seiten mit dynamischer Präsentation von Inhalten durch Einsatz.
Open Database Connectivity (ODBC). © Prof. T. Kudraß, HTWK Leipzig Open Database Connectivity (ODBC) Idee: – API für eine DBMS, das ein Call-Level-Interface.
XML in Datenbanksystemen. © Prof. T. Kudraß, HTWK Leipzig 2 2 Warum wird XML eingesetzt? Antworten von Unternehmen: erweiterte Suchmöglichkeiten im Unternehmen.
Oracle WebServer - Einführung. © Prof. T. Kudraß, HTWK Leipzig Oracle Web Application Server HTML WebServer ® File system Static HTML PL/SQL Packages.
SQL/XML. © Prof. T. Kudraß, HTWK Leipzig 2 2 Motivation Speicherung von XML in allen großen kommerziellen DBMS vorhanden proprietäre Lösungen für die.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Web-Datenbanken Ein Ausblick. © Prof. T. Kudraß, HTWK Leipzig Ausblick auf aktuelle Trends Web 2.0 (Social Web) Informationsintegration: (Web) Content.
Access 2000 Datenbanken.
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Informationssysteme SS Informationssysteme Grundvorlesung Informatik Sommersemester 2004 Universität des Saarlandes, Saarbrücken Dr. Ralf Schenkel.
Einführung und Überblick
JDBC: JAVA Database Connectivity
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 24: Ausblicke.
Visualisierung objektrelationaler Datenbanken
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Vom XML Schema zur relationalen Datenbank Seminararbeit zum Multimedia-Seminar im SS 2002 Erstellt von: Thomas Dickel.
Datenbank.
Dariusz Parys Developer Evangelist Microsoft Deutschland GmbH Christian Weyer Solutions Architect thinktecture.
Sesame Florian Mayrhuber
Überblick über die Datenbankproblematik
WS 2011/12 Datenbanksysteme Mi 15:15 – 16:45 R Vorlesung #9 Physische Datenorganisation.
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
WS 2013/14 Datenbanksysteme Do 17:00 – 18:30 R Vorlesung #2 Das relationale Modell (Teil 1)
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
Allgemeines zu Datenbanken
ESRI EUROPEAN USER CONFERENCE
Management- und Web Services- Architekturen
DI (FH) DI Roland J. Graf MSc (GIS) U N I V E R S I T Ä T S L E H R G A N G Geographical Information Science & Systems UNIGIS.
Vorlesung #10 Physische Datenorganisation
Betriebliche Anwendung von Datenbanksystemen: Data Warehouse
XML und Datenbanken © 2006 Markus Röder
Rechnersysteme: Halbzeit Marcel Waldvogel. Marcel Waldvogel, IBM Zurich Research Laboratory, Universität Konstanz, , 2 Daten und Information.
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 19 Version 1.0a Programme - Zusatzsoftware Oracle: –Forms –Reports –Designer –Jdeveloper –APEX (Application Express)
Einführung Dateisystem <-> Datenbanksystem
WS 2004/2005 Datenbanken II - 5W Mi 17:00 – 18:30 G 3.18 Vorlesung #10 RDBMS Erweiterungen.
Datenbanken im Web 1.
Oracle Portal think fast. think simple. think smart. Dieter Lorenz, Christian Witt.
TypoScript.
OOSE nach Jacobson Sebastian Pohl/ST7 Betreuer: Prof. Dr. Kahlbrandt.
SS 2014 – IBB4B Datenmanagement Do 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
EJB Architektur für große Web - Applikationen Gerald Weber
Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #1 Datenmanagement.
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
Datenbanken Produkte Dienstleistungen Referenzen.
Datenbanken Produkte Dienstleistungen Referenzen.
© 2003, Rudolf Jansen Einsatz der XML-Features der Oracle 9i DB zur Systemintegration Rudolf Jansen Freiberuflicher Entwickler und Autor
© 2015 TravelTainment NoSQL – Eine Alternative zu relationalen Datenbanken Dominik Schmitz.
Oracle Exadata und HP Oracle Database Machine © 2008 Oracle Corporation – Proprietary and Confidential Alfred Schlaucher (Oracle Data Warehouse) EXTREME.
Oracle Text bei sehr großen Datenmengen Referent Martin Augst Senior Project / Account Manager Semantec GmbH Benzstr.
Information Retrieval mit Oracle Text Erfahrungsbericht.
DOAG SID Data Warehouse
Von Wietlisbach, Lenzin und Winter
Datenbanken Von Amed und Alicia.
Von Wietlisbach, Lenzin und Winter
 Präsentation transkript:

Datenbanksysteme in der Zukunft

© Prof. T. Kudraß, HTWK Leipzig Entwicklungslinien 1. Object Relational Arrives 2. Databases in the Cloud 3. Queues, Transactions, Workflows 4. Cubes and Online Analytical Processing 5. Data Mining 6. Column Stores 7. Text, Temporal, and Spatial Data Access 8. NoSQL 9. Data Streams 10. Publish-Subscribe and Replication 11. Data Management on New Hardware 12. Smart Objects: Databases Everywhere 13. Self-Managing and Always Up

© Prof. T. Kudraß, HTWK Leipzig 1. Object Relational Arrives Sündenfall Cobol: Trennung in Data Division und Procedure Division DB Community hat das übernommen Bemühungen um Wiedervereinigung seit 40 Jahren – Stored Procedures – Objekt-relationale DBMS (seit Mitte 90er Jahre) Objektorientierte Sprachen: Java, C# Zusammenwachsen OO Sprachen + SQL – Felder sind Objekte (Werte oder Referenzen) – Sätze (Records) sind Vektoren von Objekten (Feldern) – Tabellen bestehen aus Record-Objekten – Voraussetzung: Modularisierung der DBMS-Architektur – Objektrelationale Mapper (Hibernate, Java Persistence API) – Mehrschichtenarchitekturen order_nocust_infoline_itemsamount Hold CheckStatus Cancel Ship

© Prof. T. Kudraß, HTWK Leipzig 2. Databases in the Cloud Cloud Storage als Ressource des Cloud Computing, verschiedene Kategorien (Weiterentwicklung der Idee: DB as a Service) BLOB Storage: Virtuelles Dateisystem – Speicherung von Text- und Binärdaten in der Cloud – Zugriff über APIs, SOAP, REST Table Storage: BigTable-Ansatz, NoSQL-Datenbank – BigTable-Konzept (eine riesige Tabelle ohne feste Struktur) – Zugriff über SOAP & REST, APIs (echter) DB-Server – virtueller Datenbankserver zur eigenen Verwendung – übliche APIs

© Prof. T. Kudraß, HTWK Leipzig 3. Queues, Transactions, Workflows Internet-Anwendung: – asynchrone Tasks, bilden Workflow – arbeiten mit autonomen Agenten Alle DBMS bieten Queuing Systeme – über einfache ACID Transaktionen hinaus – implementieren Publish-Subscribe und Workflow- Systeme – WFS = Applikation on top of a Queuing System

© Prof. T. Kudraß, HTWK Leipzig 4. Cubes & OLAP Frühe relationale Systeme: – Indexe als Tabellen-Replikate – Frühe Ideen führten zu Materialized Views mit schnellem Zugriff auf Star und Snowflake Schema Frühe 90er: Data Cubes als typisches OLAP-Pattern (Aggregation von Daten entlang verschiedener Dimensionen) – Algorithmen für Cube-Design und Implementation – Optimierung für effiziente Verwaltung von Cubes (z.B. Multi- Terabyte Faktentabelle in einigen Gigabytes) Bestandteil vieler DBMS Aktuelles Forschungsgebiet: Verbesserung der Visualisierung und Abfragen auf Cubes

© Prof. T. Kudraß, HTWK Leipzig 5. Data Mining Daten – Information – Wissen – Weisheit Data Mining = erster Schritt zum Wissen Maschinelles Lernen verbündet sich mit Datenbanken – Clustering – Entscheidungsbäume – Neuronale Netze, Bayes-Netze – Zeitreihenanalyse Grundidee: Learning Table – Wird gefüllt in Trainingsphase – Genutzt zur Generierung synthetischer Daten (mit Wahrscheinlichkeiten) – Überprüfung von Werten (mit Unsicherheit) Forschung: bessere Mining-Algorithmen, Behandlung ungenauer und unsicherer Antworten

© Prof. T. Kudraß, HTWK Leipzig 6. Column Stores Tabellen mit Tausenden Spalten (die meisten NULL) z.B. LDAP: 7 geforderte und über 1000 optionale Attribute Klassischer Ansatz (Row Store) – Jedes Objekt ist Zeile einer Tabelle, aber sehr ineffizient – Große – aber dünn besetzte Tabellen Speicherung als ternäre Relation (Column Store) – Schlüssel, Attribute, Wert (Key-Value-Store) – Decomposition Storage Model – Außergewöhnliche Kompression (oft als Bitmap) – Erlaubt bessere Optimierung Forschung: automatische Algorithmen für Column Stores

© Prof. T. Kudraß, HTWK Leipzig 7. Text, Temporal, Spatial Data Access Datenbanken-Community von Information Retrieval (IR) isoliert Viele Anwendungen – Große Textbestände – Daten mit temporale und räumlichen Eigenschaften Stores Neue Datentypen in erweiterbaren DBMS – Erweiterung des SQL-Standards Ungenaue Antworten, probabilistisches Schließen (vor allem beim Text Retrieval) Herausforderung für traditionelle Datenbanken Noch keine klare Algebra für Integration dieser neuen Datentypen

© Prof. T. Kudraß, HTWK Leipzig 8. NoSQL Databases Nicht alle Daten relational Glaubenskrieg bei DB-Profis: Wieviel Struktur muss eine Datenbank haben? Integration von DB-Systemen mit File-Systemen Traditionelle File-Systeme nicht mehr ausreichend (in großen Unternehmen Milliarden von Dateien) Weiterentwicklung zu Datenbanksystemen Alternative Datenbankmodelle: – Dokumentenorientierte DB (z.B. CouchDB) – Graphen-DB – Key Value Stores

© Prof. T. Kudraß, HTWK Leipzig 9. Stream Processing Ständige Erzeugung von Daten durch Beobachtung der Umwelt – Teleskope – Bar-Code-Leser, die Frachtgut kontrollieren – Verkehrsdaten – RFID Scanner – Sensoren (z.B. Smart Dust) Abfragen auf diesen Daten (z.B. Historie) gewünscht Datenströme (Streams): verbieten persistente Speicherung und zeitaufwendige Verarbeitung innerhlab eine traditionellen DBMS Ziel: Datengetriebene Verarbeitung der potenziell unbeschränkten Datenströme, bei der sich ein System adaptiv verhalten sollte (z.B. in Bezug auf Datenankunftsrate) Klassische DBMS: bedarfsgesteuerte Verarbeitung endlicher Eingabemengen (im Allgemeinen Relationen) Entwicklung dezidierter Systeme = Datenstrommanagementsysteme (DSMS)

© Prof. T. Kudraß, HTWK Leipzig 10. Publish-Subscribe & Replication Publish-Distribute-Subscribe Modell weit verbreitet bei Massendaten Data Warehouses – große Datenarchive – Publizieren Teilmengen von Daten an Data Marts Real-Time Warehouse (Echtzeitnotifikation bei Datenänderungen), z.B. – Finanzapplikationen – Preisänderungen – Inventory Management – Bestandsänderungen – Information Retrieval – Content-Änderungen Ideen von aktiven Datenbanken Forschung: anspruchsvolle standing queries und bessere Optimierung für große Anzahl Queries and großes Datenvolumen

© Prof. T. Kudraß, HTWK Leipzig 11. Data Management on New Hardware Wachsende Kapazität von Platten und Hauptspeicher – 1 Sekunde zum Lesen des gesamten RAM – 20 Minuten zum Lesen der gesamten Disk Bei Terabyte-Datenbanken – Memory Scans dauern Minuten – Terabyte Disk Scans dauern Stunden Neue Algorithmen – zur intelligenten Nutzung von Multiprozessoren, die sich massiven Hauptspeicher teilen (Parallelisierung z.B. Map/Reduce) – zur intelligenten Nutzung der kostbaren Disk-Bandbreite Neue Speichermedien – Solid State Disks (SSD) Neue Ära: In-Memory Databases Green IT Issues

© Prof. T. Kudraß, HTWK Leipzig 12. Smart Objects: Databases Everywhere Ubiquitäres Computing (überall Sensor-Netzwerke) – Wearable Computing – Smart Dust Vom block-orientierten Disk-Interface zum File Interface zum Service Interface (in den nächsten 3 Jahrzehnten) Früher: Spezial-Hardware benötigt Heute: Disks haben schnelle Allzweck-Prozessoren (Moores Law) Wiedergeburt der Database Machines Verteilte Anfragetechnologie für Sensor-Netzwerke Konsequenz: Mini-Datenbanksysteme in Smart Dust

© Prof. T. Kudraß, HTWK Leipzig 13. Self Managing and Always Up Datenbanken sind überall – im File-System (z.B. auch -System) – auf der Platte – im Smart Dust – Viele, viele Anwendungen Was müssen Datenbanksysteme sein? – Self-managing – Self-organizing – Self-healing Verteilte Datenspeicher robuster machen in Richtung DB- Technologie – Datensicherheit – Effiziente Anfragebearbeitung

© Prof. T. Kudraß, HTWK Leipzig Schlußfolgerungen: Wie gehts weiter? Zusammenführen von exaktem und probabilistischem Schließen Modularität von DBMS (Web Service-Schnittstelle, Integration mit Programmiersprachen) Wiedervereinigung von Code und Daten hat entscheidende Bedeutung neue Algorithmen und neue Subsysteme ins DBMS Aus Datenbanksystemen werden Datenbankbetriebssysteme (Data Integrator, Mediator) Hardwareentwicklung treibt Entwicklung von DBMS voran (RAM, Speicher, Netzwerke) Informationslawine rollt weiter neue Herausforderungen für die Datenbanktechnologien