Prof. Rudolf Bayer, Ph.D. www3.in.tum.de TU München, WS 2000/01

Slides:



Advertisements
Ähnliche Präsentationen
ER-Datenmodell und Abfragen in SQL
Advertisements

Kap. 7 Sortierverfahren Kap. 7.0 Darstellung, Vorüberlegungen
Dr. Brigitte Mathiak Kapitel 10 Physische Datenorganisation.
Übung Datenbanksysteme WS 2003/ Übung Datenbanksysteme Entwurf eines Bibliothekssystems
Datenbanken Einführung.
Software Von Webmaster Mario.
MySQL.
Prof. Dr. Günter Törner Dipl-Math. Thorsten Bahne
CD-ROMs im Netz Direkter Zugriff auf CD-ROMs via Web-Browser Hartmut Jörg.
Datenbanken I (0,*) Produkt 3 Karczewski Datenbanken I.
Seminar: XML für Fortgeschrittene Referent: Katrin Apel
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Text-Retrieval mit Oracle Vortrag von Andreas Mück & David Diestel.
1 Lösungen zu Übungsblatt 4 zur Vorlesung Datenstrukturen, Prof. R. Bayer, WS 2001/02 Übung 8.1: Gegeben sei der Beginn einer DTD Definition. Vervollständigen.
1 Inhaltsverzeichnis 1. Einleitung 1.1 Architektur von IV-Systemen 1.2 Anwendungsbeispiel OMNIS/Myriad 1.3 Vorlesungsziel 1.4 Abbildung E/R und objektorientierte.
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
Datenstrukturen und Datenorganisation unter besonderer Berücksichtigung von Datenmodellierung Prof. Rudolf Bayer, Ph.D. www3.in.tum.de TU München, WS 2001/02.
Kap.6 Datenstruktur für Peripheriespeicher Kap.6.0 Plattenspeicher
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library
Informationsmanagement in Fachbereichen Findet man (administrative) Informationen schnell? Kann man nach Stichworten suchen? Kann man in Publikationen.
Xindice Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Seyda Kurt.
UML Begleitdokumentation des Projekts
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Ordner- und Dateistrukturen in Windows 7 (Teil 1)
SQL PHP und MySQL Referat von Katharina Stracke und Carina Berning
Im Internet geht alles schneller, aber es dauert länger
P060 - IFI-Pflegedialogsystem - Termine und Nachrichten Ingenieurbüro für Informationssysteme Konzepte und Marketing Gerade Straße Buchholz i.d.N.
PHP und MYSQL am Organisatorisches Der komplette Kurs im Schnelldurchgang Bewertung von wichtig und unwichtig Historisch Kulturwissenschaftliche.
Entwicklung verteilter Anwendungen I, WS 13/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 5 Folie 2 ADO.NET s.a:
XML-Query. Übersicht Was ist XML-Query? Vergleich RDB XML-Dokument Syntaktisches und Use-Cases Kritik und Diskussion.
SS 2010 – IBB4C Datenmanagement Fr 15:15 – 16:45 R Vorlesung #2 Datenbankentwurf.
WS 2011/12 Datenbanksysteme Mi 15:15 – 16:45 R Vorlesung #9 Physische Datenorganisation.
Vorlesung Datenbanksysteme vom Physische Datenorganisation
Einführung in Datenbankmodellierung und SQL
Liske Informationsmanagementsysteme 2005 Informationen managen Strategisches Kalkül und technische Wirksamkeit.
Vorlesung #10 Physische Datenorganisation
Ihr Trainer: Gerold Hämmerle
Rechnersysteme: Halbzeit Marcel Waldvogel. Marcel Waldvogel, IBM Zurich Research Laboratory, Universität Konstanz, , 2 Daten und Information.
Schwerpunkt: Zeitschriftenartikel in Datenbanken
Structured Query Language
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
1 Übungen zur Vorlesung Datenstrukturen Prof. R. Bayer, WS 2001/02 Übung 1: Kap.1.1: analysieren Sie eine Bank Anwendung mit folgenden Kennzahlen: Die.
Vortrag - Diplomarbeiten (HS I)
1 Einordnung (1) Elementare Zustandsräume Konstruktoren für Zustandsräume Operatoren Datenmodell Konkreter Zustandsraum Konkrete Konsistenz- bedingungen.
TypoScript.
Datenbank System (DBS) - Warum?
PHPmyadmin Maya Kindler 6c.
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #2 Datenbankentwurf.
Datenbanken erstellen mit PostgreSQL
Datenbanken abfragen mit SQL
IS: Datenbanken, © Till Hänisch 2000 Einführung Worüber reden wir hier eigentlich ?
Tidy DIE effiziente Software für Dokumentenarchivierung und Dokumentenmanagement Theorie in dieser Präsentation, Praxis anschliessend Fragen: fragen! Tidy.
WS2016: Container von A bis Z
Vorlesung #2 ER –Modellierung (Datenbankentwurf)
BE-Statistik-Datenbank des LFV Bayern e.V.
Übungsblatt 3 zur Vorlesung Datenstrukturen Prof. R. Bayer, WS 2001/02
Alles wird gut! Suche im MyCoRe Jens Kupferschmidt
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
Vorlesung #2 Datenbankentwurf
Basiskomponente Bibliothek Informationsveranstaltung
Einführung "Datenbanksysteme"
Datenbanken Eine Einführung Kerstin Fröhlig, HHBK.
Von Wietlisbach, Lenzin und Winter
Grundlagen Datenbanken (GDB)
Datenbank WI WAHB12 Carolin & Sarah.
Datenbanken Von Amed und Alicia.
Von Wietlisbach, Lenzin und Winter
(Structured Query Language)
 Präsentation transkript:

Prof. Rudolf Bayer, Ph.D. www3.in.tum.de TU München, WS 2000/01 Datenstrukturen und Datenorganisation unter besonderer Berücksichtigung von Datenmodellierung Prof. Rudolf Bayer, Ph.D. www3.in.tum.de TU München, WS 2000/01

Inhaltsverzeichnis 1. Einleitung 1.1 Architektur von IV-Systemen 1.2 Anwendungsbeispiel OMNIS/Myriad 1.3 Vorlesungsziel 1.4 Abbildung E/R und objektorientierte Modelle 1.5 Speicher 1.6 UNIX File System 1.7 Rückblick über Datenstrukturen 1.8 Datenstrukturen und formale Sprachen

Kap. 1 Einleitung Kap. 1.1 Architektur von IV-Systemen Mehrschichten-Ansatz: Anwendungen Konzetuelle Modelle Logische Modelle Physische Modellierung = Implementierung Problem: Geeignete Abbildung über alle Abstraktionsebenen?

Randbedingungen Anwendungen: t/s, DB-Größen, updates/s, Responsezeit, Archiv-Größe, Zuverlässigkeit (z.B. 24x7), Annahmen zur Ableitung solcher Kennzahlen? verfügbare Basistechnologien Kosten, Fertigstellungsdatum,

Beispiele für Anwendungen Telekom Rechnungen OMNIS/Elektra Bank Bayer. Staatsbibliothek VW-Reparaturen Amadeus Krankenversicherung AOK human genome GfK Patentamt VW-Zulieferung JIT

Beispiel Telekom Rechnungen 20 Mio Anschlüsse x 500 Anrufe/Monat = 1010 Anrufe/Monat DB Größe 100 B/Anruf ~ 1012 B/Monat = 1 TB/Monat Transaktionsrate 1010 Anrufe/Monat = 3x108 Anrufe/Tag ~ 3x103 Anrufe/sec Tagsüber ~ 6x103 Anrufe/sec insert into Anrufe (Tel#, Datum, Start, Ende, Tel2#, Einheiten)

Telefon Rechnungen erstellen select Tel#, provider, sum(Einheiten) from Anrufe group by Tel#, provider Sortiere Anrufe nach (Tel#, provider, Datum, Start) Frage: Zeit, um 1 TB Daten zu sortieren? Alternative Architekturen zu einem zentralen System?

Beispiele für konzeptuelle Modelle E/R ME/R Objekt orientierte Modelle (oo) Html Xml UML Prozeß-Algebra Petri Netze Dexter Modell Amsterdam Modell

Beispiele für logische Modelle Hierarchische (IMS) Netzwerke (UDS) Relationale DBMS ~ 10 Mrd $ Weltmarkt Deduktive DBMS (1980-1995), LOLA, NAIL!, ECRC, MCC Objektorientierte DBMS (Object Store, Versant, Ontos, Objectivity) ~ 100 Mio $ Weltmarkt ~ 1% NF2 (non firsr normal form), ähnlich zu XML

Beispiele für Basistechnologien Prozessoren + Multiprozessoren Speicher + Caches Busse (intern und extern) Festplatten und RAIDS Betriebssysteme und Prozesse, Threads Netze und Protokolle (Netzzugriff vs Plattenzugriff) Architekturen (Client-Server)

Kap.1.2 Anwendungsbeispiel: OMNIS/Myriad Ziel: Literatur-Verwaltung, multimediale Dokumenten-Verwaltung Konzeptuelles Modell der Bibliotheken Hierarchien von Dokumenten Zeitschrift Band Heft Aufsatz Monographie

Maschinelles Austauschformat Bibliotheken MAB Autoren* Titel Untertitel Verleger Jahr Ort Zeitschrift Band* Heft* erste Seite letzte Seite Fingerprint ... Ca. 950 einzelne Felder !!!

Konzeptuelles Modell von OMNIS/Elektra Vollständiger Text Dokument als Folge von Seitenbildern Treffer mit Kurzinformation Methoden Recherchieren, Freitext Kurzinfo anzeigen Dokument bestellen, drucken, lesen, lokal speichern Bezahlen Zitieren Hinweis: Modell geht weiter als heutige Realität in klassischen Bibliotheken, Methoden werden von unterschiedlichen Akteuren veranlaßt

Recherche: z.B. Freitext-Suche in 5 GB (konzetuelle Ebene) • exakte Einzelbegriffe • Pattern-Match mit Wildcards: datenbank% dat%ba% • Phrasensuche: relational algebra query opti% • Boolsche Kombinationen dat%ba% & dat%stru% datenba% & optimier% • Nachbarschaftssuche hierarchy .... space • Struktursuche: Attributkombinationen ?Autor = ´Bayer´ & ?Jahr  1986 & ?Jahr > 1978 & dat%ba% & synchroni_ation

Logisches Modell von OMNIS Dokumenten DB, Logisches Modell von OMNIS Dok = (Text, DB-Satz, Image-Folge, Postscript-Datei) noch zu ergänzen: Details des DB-Satzes, z.B. Dublin Core, MAB, UniMarc, ... Text Repräsentation für Freitext Recherche: My0 (Wort, W#) My1 (W#, Doc#, Pos) typische DB-Größe: 106 Dokumente 5 • 106 Images x 40 KB = 2 • 10 11 Bytes = 200 GB Text: 5 • 106 • 103 B = 5 GB Speicherung dieser DB?

Das physische Modell von OMNIS Erfassungsvorgang Einscannen  Pixelbild = Image • geeignete Datenstruktur? z.B. Spezialform von Quad-Tree) • Kompressionsalg., 1 x auf Server • Dekompression: < 2sec auf PC 486 • Speicherung in DB • Verschickung über Netz

2. Text erzeugen: OCR OCR (Image)  Text fehlerhaft!! • Abgleich 1 Seite Text  200 Wörter mit Stammreduktion Wörterbuch: 105 - 106 Einträge • Korrekturvorschläge für ca. 10 Wörter • Darstellung der Textseite? • Darstellung des Wörterbuchs für Abgleich • Darstellung des Wörterbuchs für Korrektur

3. Archivierung • Indexierung des Textes • Erzeugung von Strukturdaten • Index warten • Dok auf mehrere DBen verteilen Gefragt: Datenstrukturen für alle Be- und Verarbeitungsvorgänge! Spezielle Anforderungen der Vorgänge berücksichtigen!

Retrieval auf logischer Ebene datenba% select My1.Doc# from My0, My1 where My0.Wort like datenba% and My0.W# = My1.W# hierarchy ... space My01 My11 My12 My02 W# Doc# W# Pos < Pos Pos+6 > Pos

select My11.Doc# from My0 My01, My1 My11, My1 My12, My0 My02 where My01.Wort = ‚hierarchy‘ and My01.W# = My11.W# and My02.Wort = ‚space‘ and My02.W# = My12.W# and My11.Doc# = My12.Doc# and My11.Pos < My12.Pos and My11.Pos+6 > My12.Pos Physische Ebene: Datenstrukturen, schnelle Bearbeitung solcher Queries?

Kap. 1.3 Vorlesungsziel Zentrales Anliegen: Geeignete Datenstrukturen, um Komplexität mehrerer Operationen gleichzeitig niedrig zu halten: • Zeitkomplexität • Platzkomplexität mit Randbedingungen von Anwendungen! z.B. insert, update, delete, find, compress, decompress, bulk load, ... retrieve interval, sort (z.B. Sätze variabler bzw. fester Länge)

Def.: O( ... ) - Notation, Ordnung einer Funktion: Seinen No, Ro nicht-neg. integer, real Sei X entweder No oder Ro, g : X  X O(g)def : = {f : x  x |  c > o, xo  X, x  xo : f(x)  c•g(x)} Notationen: f  O(g), f = O(g), f hat Ordnung O(g), f ist von Ordnung O(g) Eigenschaften: f1  O(f)  g1  O(g)  f1•f2  O(f•g) f  O(g)  g  O(h)  f  O(h) f  O(g)  O(f)  O(g)