Datenstrukturen und Datenorganisation unter besonderer Berücksichtigung von Datenmodellierung Prof. Rudolf Bayer, Ph.D. www3.in.tum.de TU München, WS 2001/02.

Slides:



Advertisements
Ähnliche Präsentationen
ER-Datenmodell und Abfragen in SQL
Advertisements

Kap. 7 Sortierverfahren Kap. 7.0 Darstellung, Vorüberlegungen
Eine dynamische Menge, die diese Operationen unterstützt,
Übung Datenbanksysteme WS 2003/ Übung Datenbanksysteme Entwurf eines Bibliothekssystems
Datenbanken Einführung.
Folien 2-5, 7-8 © Prof. Dr. Manfred Rössle (FH Aalen)
spezielle Nutzersichten formale Ebene (deskriptive Regeln)
Software Von Webmaster Mario.
MySQL.
Prof. Dr. Günter Törner Dipl-Math. Thorsten Bahne
IT – Struktur an Schulen
Vorlesung: Prof. Norbert Fuhr
Einführung in Informationssysteme
SAP R/3 - Speichermanagement
Datenbanken I (0,*) Produkt 3 Karczewski Datenbanken I.
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Stefanie Selzer - Pascal Busch - Michael Kropiwoda
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
SQL/XML. © Prof. T. Kudraß, HTWK Leipzig 2 2 Motivation Speicherung von XML in allen großen kommerziellen DBMS vorhanden proprietäre Lösungen für die.
Oberseminar Datenbanken Multimediale Datenbanken Christian Völschow.
Text-Retrieval mit Oracle Vortrag von Andreas Mück & David Diestel.
MMQL – Multimedia Query Language Eine Anfragesprache für Multimedia-Ähnlichkeitsanfragen Christian Mantei.
Übung Datenbanksysteme WS 2003/ Übung Datenbanksysteme Hierarchische DBMS
1 Lösungen zu Übungsblatt 4 zur Vorlesung Datenstrukturen, Prof. R. Bayer, WS 2001/02 Übung 8.1: Gegeben sei der Beginn einer DTD Definition. Vervollständigen.
1 Inhaltsverzeichnis 1. Einleitung 1.1 Architektur von IV-Systemen 1.2 Anwendungsbeispiel OMNIS/Myriad 1.3 Vorlesungsziel 1.4 Abbildung E/R und objektorientierte.
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
Kap.6 Datenstruktur für Peripheriespeicher Kap.6.0 Plattenspeicher
Geometrische Objekte in Datenbanken Martin Pfeifle Institut für Informatik, Universität München Lehr- und Forschungseinheit für Datenbanksysteme Prof.
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library
Vorlesung 3: Verschiedenes Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin
Access 2000 Datenbanken.
Datenbanken Einführung Merkmale dateiorientierte Datenverwaltung
1 WS 2012 Software-Engineering II Aspektorientierung.
Datenmanagement in Sensornetzen PRESTO - Feedback gesteuertes Datenmanagement - SS 2007 Sören Wenzlaff.
Datenmodellierung - Aufbau einer Datenbank -
Fachbereich Mathematik/Informatik Universität Osnabrück
Betriebliche Informationssysteme Prof. Dr. Michael Löwe
Xindice Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Seyda Kurt.
UML Begleitdokumentation des Projekts
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
... und alles was dazugehört
Ordner- und Dateistrukturen in Windows 7 (Teil 1)
Normdaten und Metadaten Die Idee eines Internationalen Authority File Christel Hengel Die Deutsche Bibliothek META-LIB-Workshop, 22. Oktober 2002, Die.
Kollektionen in Java Aufzählungstypen, Generische Typen
Datenbanken?.
Entwicklung verteilter Anwendungen I, WS 13/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 5 Folie 2 ADO.NET s.a:
XML-Query. Übersicht Was ist XML-Query? Vergleich RDB XML-Dokument Syntaktisches und Use-Cases Kritik und Diskussion.
Vorlesung #2 Datenbankentwurf
SS 2010 – IBB4C Datenmanagement Fr 15:15 – 16:45 R Vorlesung #2 Datenbankentwurf.
WS 2011/12 Datenbanksysteme Mi 15:15 – 16:45 R Vorlesung #9 Physische Datenorganisation.
Vorlesung Datenbanksysteme vom Physische Datenorganisation
Einführung in Datenbankmodellierung und SQL
Vorlesung #10 Physische Datenorganisation
Ihr Trainer: Gerold Hämmerle
Rechnersysteme: Halbzeit Marcel Waldvogel. Marcel Waldvogel, IBM Zurich Research Laboratory, Universität Konstanz, , 2 Daten und Information.
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 19 Version 1.0a Programme - Zusatzsoftware Oracle: –Forms –Reports –Designer –Jdeveloper –APEX (Application Express)
Structured Query Language
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
1 Übungen zur Vorlesung Datenstrukturen Prof. R. Bayer, WS 2001/02 Übung 1: Kap.1.1: analysieren Sie eine Bank Anwendung mit folgenden Kennzahlen: Die.
SS 2014 – IBB4C Datenmanagement Do 17:00 – 18:30 R Vorlesung #2 Datenbankentwurf.
Einführung Dateisystem <-> Datenbanksystem
1 Einordnung (1) Elementare Zustandsräume Konstruktoren für Zustandsräume Operatoren Datenmodell Konkreter Zustandsraum Konkrete Konsistenz- bedingungen.
TypoScript.
XML in der Praxis: Electronic Bill Presentment (EBP) Institut für Wirtschaftsinformatik J. W. Goethe-University J. W. Goethe University Institute of Information.
Datenbank System (DBS) - Warum?
PHPmyadmin Maya Kindler 6c.
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #2 Datenbankentwurf.
Prof. Rudolf Bayer, Ph.D. www3.in.tum.de TU München, WS 2000/01
 Präsentation transkript:

Datenstrukturen und Datenorganisation unter besonderer Berücksichtigung von Datenmodellierung Prof. Rudolf Bayer, Ph.D. www3.in.tum.de TU München, WS 2001/02

2 Inhaltsverzeichnis 1. Einleitung 1.1 Architektur von IV-Systemen 1.2 Anwendungsbeispiel OMNIS/Myriad 1.3 Vorlesungsziel 1.4 Abbildung E/R und objektorientierte Modelle 1.5 Speicher 1.6 UNIX File System 1.7 Rückblick über Datenstrukturen 1.8 Datenstrukturen und formale Sprachen

3 Kap. 1 Einleitung Kap. 1.1 Architektur von IV-Systemen Mehrschichten-Ansatz: Anwendungen Konzetuelle Modelle Logische Modelle Physische Modellierung = Implementierung Problem: Geeignete Abbildung über alle Abstraktionsebenen?

4 Randbedingungen Anwendungen: t/s, DB-Größen, updates/s, Responsezeit, Archiv-Größe, Zuverlässigkeit (z.B. 24x7), Annahmen zur Ableitung solcher Kennzahlen? verfügbare Basistechnologien Kosten, Fertigstellungsdatum,

5 Beispiele für Anwendungen Telekom Rechnungen OMNIS/Elektra Bank Bayer. Staatsbibliothek VW-Reparaturen Amadeus Krankenversicherung AOK human genome GfK Patentamt VW-Zulieferung JIT

6 Beispiel Telekom Rechnungen 20 Mio Anschlüsse x 500 Anrufe/Monat = Anrufe/Monat DB Größe 100 B/Anruf ~ B/Monat = 1 TB/Monat Transaktionsrate Anrufe/Monat = 3x10 8 Anrufe/Tag ~ 3x10 3 Anrufe/sec Tagsüber ~ 6x10 3 Anrufe/sec insert into Anrufe (Tel#, Datum, Start, Ende, Tel2#, Einheiten, Provider)

7 Telefon Rechnungen erstellen select Tel#, provider, sum(Einheiten) from Anrufe group by Tel#, provider Sortiere Anrufe nach (Tel#, provider, Datum, Start) Frage: Zeit, um 1 TB Daten zu sortieren? Alternative Architekturen zu einem zentralen System?

8 Beispiele für konzeptuelle Modelle E/R ME/R Objekt orientierte Modelle (oo) Html Xml UML Prozeß-Algebra Petri Netze Dexter Modell Amsterdam Modell

9 Beispiele für logische Modelle Hierarchische (IMS) Netzwerke (UDS) Relationale DBMS~ 10 Mrd $ Weltmarkt Deduktive DBMS ( ), LOLA, NAIL!, ECRC, MCC Objektorientierte DBMS (Object Store, Versant, Ontos, Objectivity) ~ 100 Mio $ Weltmarkt ~ 1% NF 2 (non firsr normal form), ähnlich zu XML

10 Beispiele für Basistechnologien Prozessoren + Multiprozessoren Speicher + Caches Busse (intern und extern) Festplatten und RAIDS Betriebssysteme und Prozesse, Threads Netze und Protokolle (Netzzugriff vs Plattenzugriff) Architekturen (Client-Server)

11 Kap.1.2 Anwendungsbeispiel: OMNIS/Myriad Ziel: Literatur-Verwaltung, multimediale Dokumenten-Verwaltung Konzeptuelles Modell der Bibliotheken Hierarchien von Dokumenten Zeitschrift Band Heft Aufsatz Monographie

12 Maschinelles Austauschformat Bibliotheken MAB Autoren* Titel Untertitel Verleger Jahr Ort Zeitschrift Band* Heft* erste Seite letzte Seite Fingerprint... Ca. 950 einzelne Felder !!!

13 Konzeptuelles Modell von OMNIS/Elektra Vollständiger Text Dokument als Folge von Seitenbildern Treffer mit Kurzinformation Methoden Recherchieren, Freitext Kurzinfo anzeigen Dokument bestellen, drucken, lesen, lokal speichern Bezahlen Zitieren Hinweis: Modell geht weiter als heutige Realität in klassischen Bibliotheken, Methoden werden von unterschiedlichen Akteuren veranlaßt

14 Recherche: z.B. Freitext-Suche in 5 GB (konzetuelle Ebene) exakte Einzelbegriffe Pattern-Match mit Wildcards: datenbank% dat%ba% Phrasensuche: relational algebra query opti% Boolsche Kombinationen dat%ba% & dat%stru% datenba% & optimier% Nachbarschaftssuche hierarchy.... space Struktursuche: Attributkombinationen ?Autor = ´Bayer´ & ?Jahr 1986 & ?Jahr > 1978 & dat%ba% & synchroni_ation

15 Dokumenten DB, logisches Modell von OMNIS Dok = (Text, DB-Satz, Image-Folge, Postscript-Datei) noch zu ergänzen: Details des DB-Satzes, z.B. Dublin Core, MAB, UniMarc,... Text Repräsentation für Freitext Recherche: My0 (Wort, W#)My1 (W#, Doc#, Pos) typische DB-Größe: 10 6 Dokumente Images x 40 KB = Bytes = 200 GB Text: B = 5 GB Speicherung dieser DB?

16 Das physische Modell: Erfassungsvorgang 1.Einscannen Pixelbild = Image geeignete Datenstruktur? z.B. Spezialform von Quad-Tree Kompressionsalg., 1 x auf Server Dekompression: < 2sec auf PC 486 Speicherung in DB Verschickung über Netz

17 2. Text erzeugen: OCR OCR (Image) Text fehlerhaft!! Abgleich 1 Seite Text 200 Wörter mit Stammreduktion Wörterbuch: Einträge Korrekturvorschläge für ca. 10 Wörter Darstellung der Textseite? Darstellung des Wörterbuchs für Abgleich Darstellung des Wörterbuchs für Korrektur

18 3. Archivierung Indexierung des Textes Erzeugung von Strukturdaten Index warten Dok auf mehrere DBen verteilen Gefragt: Datenstrukturen für alle Be- und Verarbeitungsvorgänge! Spezielle Anforderungen der Vorgänge berücksichtigen!

19

20 Retrieval auf logischer Ebene datenba% select My1.Doc# from My0, My1 where My0.Wort like datenba% and My0.W# = My1.W# hierarchy... space My01My11My12My02 W#Doc#W# Pos<Pos Pos+6>Pos

21 select My11.Doc# from My0 My01, My1 My11, My1 My12, My0 My02 whereMy01.Wort = hierarchy and My01.W# = My11.W# and My02.Wort = space and My02.W# = My12.W# and My11.Doc# = My12.Doc# and My11.Pos < My12.Pos and My11.Pos+6 > My12.Pos Physische Ebene: Datenstrukturen, schnelle Bearbeitung solcher Queries?

22 Kap. 1.3 Vorlesungsziel Zwei zentrale Anliegen Anwendung modellieren Geeignete Datenstrukturen, um Komplexität mehrerer Operationen gleichzeitig niedrig zu halten: Zeitkomplexität Platzkomplexität mit Randbedingungen von Anwendungen! z.B. insert, update, delete, find, compress, decompress, bulk load,... retrieve interval, sort (z.B. Sätze variabler bzw. fester Länge)

23 Def.: O(... ) - Notation, Ordnung einer Funktion: Seinen N o, R o nicht-neg. integer, real Sei X entweder N o oder R o, g : X X O(g) def : = {f : x x | c > o, x o X, x x o : f(x) c g(x)} Notationen: f O(g), f = O(g), f hat Ordnung O(g), f ist von Ordnung O(g) Eigenschaften: f 1 O(f) g 1 O(g) f 1 g 1 O(fg) f O(g) g O(h) f O(h) f O(g) O(f) O(g)