Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Datenstruktur 1: Textdatei Heike Boß, wohnhaft in der Darmstädter Straße 46, hat die.

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Einführung. Einführung Inhalt Einführung Architektur Vorlagen Blöcke Tabellen Listen Textformatierung Grafik und Farbe Buch-Erstellung.
Hash-Tabellen und -Funktionen Hash-Tabellen in Java
WAS ZUM NACHDENKEN !
Funktionen.
Datenbanken Einführung.
Folien 2-5, 7-8 © Prof. Dr. Manfred Rössle (FH Aalen)
System J – Compiler – Praktikum: Datenbanksystementwicklung Knut Stolze
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
Grundlagen der Informatik
Auswertung der Interviews
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
Strukturen. In einer Struktur kann eine beliebige Anzahl von Komponenten (Daten) mit unterschiedlichen Datentypen (im Gegensatz zu Feldern) zusammengefaßt.
SQL als Abfragesprache
Datensicherheit in DBMS
IS: Datenbanken, © Till Hänisch 2000 CREATE TABLE Syntax: CREATE TABLE name ( coldef [, coldef] [, tableconstraints] ) coldef := name type [länge], [[NOT]NULL],
Access 2000 Datenbanken.
Datenbanken Einführung Merkmale dateiorientierte Datenverwaltung
Datenintegrität Referentielle Integrität create table
Datenmodellierung - Aufbau einer Datenbank -
MeiNetz-Suche Wie kann man in meiNetz etwas suchen? 1.durch Gruppen browsen 2.Suchfunktion.
Datenbanken 13: Objekt-Klasse-Datenbank
Erhard Künzel für Info 9. Klasse: Digitale Schule Bayern© Erhard Künzel.
Datenbanken 10: Einfügen, Ändern, Löschen
3.5.2 Fremdschlüssel/ Referentielle Integrität (6/9)
3.5.2 Fremdschlüssel/ Referentielle Integrität (1/9)
2.2 Definition eines Datenbankschemas (SQL-DDL)
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
objekt-relationale Datenbanken
YouTube5 .0 Projektpräsentation
Online-Befragung Themen: 1. Vor- und Nachteile 2. Voraussetzungen
Datenbankentwicklung IV-LK
Präsentation von Katharina Iltsche und Silvia Köppe
ETWAS ZUM NACHDENKEN !.
R.P.G. MAL WAS ZUM NACHDENKEN!.
WAS ZUM NACHDENKEN!.
Du hast bei einem Wettbewerb folgenden Preis gewonnen:
Relationale Datenbanken III
HORIZONT 1 XINFO ® Das IT - Informationssystem Java Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
Access 2000 Willkommen im Access-Kurs Oliver Mochmann.
GIS - Seminar Wintersemester 2000/2001
Proseminar: „Webtechnologien für Ecommerce“
Die quadratische Ergänzung - Wiederholung der 1. binomischen Formel
Gui-Objekte und Datenmodellobjekte
1.2 Trennung von Struktur und Inhalt
1.5 Das Entwurfsmuster Kompositum
WS 2013/14 Datenbanksysteme Do 17:00 – 18:30 R Vorlesung #7 SQL (Teil 4)
WS 2013/14 Datenbanksysteme D0 15:15 – 16:45 R Vorlesung #5 SQL (Teil 2)
WAS ZUM NACHDENKEN !.
Relationales Datenmodell und DDL
Lösen von quadratischen Ungleichungen
Bericht der Gruppe Avatare Universität zu Köln BA Medienkulturwissenschaft/Medieninformatik Historisch-Kulturwissenschaftliche Informationsverarbeitung.
WAS ZUM NACHDENKEN !.
Neue Medien Geschichte - Hagen Februar 2004
Semantic Web.
WS 2014/15 Datenbanksysteme D0 15:15 – 16:45 R Vorlesung #6 SQL (Teil 3)
Vordefinierte Datentypen (1)
Peter Brezany Institut für Softwarewissenschaften Universität Wien
Prolog: Datenbanken Inhalt - Überblick - Erstellen einer Datenbank
1 Zahlreiche Transformationen - Achtung Hochspannung Meike Klettke.
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #1 Datenmanagement.
WS 2014/15 Datenbanksysteme Do 17:00 – 18:30 R Vorlesung #9 SQL Zusammenfassung.
Datenbanken erstellen mit PostgreSQL
Datenmigrationstools: DTW – Kontenplan
csv2siard Version 1.7 csv2siard erlaubt die Konvertierung von CSV-Datei Sammlungen in eine SIARD-Datei. Die Vorteile einer solchen Konvertierung: 1.einzelne.
Vorlesungsverzeichnisse der Universität Bern: Von der Digitalisierung zur Faktenbasis Niklaus Bütikofer Universität Bern Universitätsarchiv Weiterbildungsprogramm.
SQL Structured Query Language Enzio Thiem. INHALT CREATE TABLE Anweisung Gängige Datentypen Beispiel CREATE TABLE Beispiel CREATE TABLE - erweitert Beispiel.
SQL Basics Schulung –
Abfragesprache SQL in ORACLE
Constraints anlegen und löschen, Data Dictionary Tabellen
 Präsentation transkript:

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Datenstruktur 1: Textdatei Heike Boß, wohnhaft in der Darmstädter Straße 46, hat die Konten und Auf dem ersten Konto hat sie derzeit 4560,00, auf dem zweiten Konto hat sie 2398,78. Für beide Konten hat sie einen Kreditrahmen von Friedrich Coy wohnt im Siedlerweg 17und hat die Konten und Auf dem ersten Konto hat er derzeit 23,56 (mit einem Kreditrahmen von 50 ), auf dem zweiten Konto hat er 1200 (mit einem Kreditrahmen von 500. Hans-Peter Daab, wohnhaft in der Adalbert-Stifter-Str. 10, hat auf seinem Konto derzeit kein Geld (aber auh keine Schulden); Kredit hat er derzeit auch nicht. Vorteil: Nachteil: Daten beliebige Anwendung Texteditor

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Datenstruktur 2: Textdatei standardisiert Heike Boß wohnt in der Darmstädter Straße 46. Sie hat Konto mit einem Kontostand von 4560,00 und einem Kreditrahmen von Sie hat Konto mit einem Kontostand von 2398,78 und einem Kreditrahmen von Friedrich Coy wohnt im Siedlerweg 17. Er hat Konto mit einem Kontostand von 23,56 und einem Kreditrahmen von 50. Er hat Konto mit einem Kontostand von 1200 und einem Kreditrahmen von 500. Hans-Peter Daab wohnt in der Adalbert-Stifter-Str. 10. Er hat Konto mit einem Kontostand von 0 und einem Kreditrahmen von 0. Vorteil: Nachteil: Daten beliebige Anwendung Texteditor

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs (noch) Datenstruktur 2: Textdatei standardisiert mit expliziter Strukturdefinition Name wohnt in Strasse. Sie/Er hat Konto Kontonummer mit einem Kontostand von Kontostand und einem Kreditrahmen von Kreditrahmen. Sie/Er hat Konto Kontonummer mit einem Kontostand von Kontostand und einem Kreditrahmen von Kreditrahmen. (und so weiter) Vorteil: Nachteil: Daten beliebige Anwendung Texteditor Struktur- info Validator

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs (immer noch) Datenstruktur 2: Textdatei standardisiert mit expliziter Strukturdefinition (BNF) Bank ::= Eintrag ::= Konten ::= Inhaber ::= wohnt in. Konto ::= (Sie|Er) hat Konto mit einem Kontostand von und einem Kreditrahmen von. Strasse ::= Zeichenfolge ::= Zeichen::= (A|B|C … Z) Kontonummer ::= Ganzzahl::= Ziffer::= (0|1|2 … 9) Kreditrahmen ::= … Daten beliebige Anwendung Texteditor Struktur- info Validator

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Datenstruktur 3: Strukturdatei (selbstverständlich standardisiert; Vorbild: Lochkarte) IHeike Boß Darmstädter Straße 46 K , K , IFriedrich Coy Siedlerweg 17 K ,56 50 K IHans-Peter DaabAdalbert-Stifter-Str. 10 K Vorteil: Nachteil: Daten beliebige Anwendung Daten- erfassung Struktur- info

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Datenstruktur 3: Strukturdatei (comma separated value; CSV) I;Heike Boß;Darmstädter Straße 46 K;200004;4560,00 ;2000 K;200005;2398,78 ;2000 I;Friedrich Coy;Siedlerweg 17 K;20000;23,56 ;50 K;200002;1200 ;500 I;Hans-Peter Daab;Adalbert-Stifter-Str. 10 K;200006;0 ;0. Vorteil: Nachteil: Daten beliebige Anwendung Daten- erfassung Struktur- info

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Noch Datenstruktur 3: Strukturdatei (comma separated value; ohne Zeilenstruktur) I;Heike Boß;Darmstädter Straße 46;K;200004;4560,00 ;2000 ;K;200005; 2398,78 ;2000 ;I;Friedrich Coy;Siedlerweg 17;K;20000;23,56 ;50 ;K; ;1200 ;500 ;I;Hans-Peter Daab;Adalbert-Stifter-Str. 10;K;200006;0 ;0. Vorteil: Nachteil: Daten beliebige Anwendung Daten- erfassung Struktur- info

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Noch Datenstruktur 3: Strukturdatei (Binärformat; anderes Beispiel) - nicht für das menschliche Auge bestimmt - Vorteil: Nachteil: AttributDatentyp Mannschaftsnamechar [20] Spiele gespieltint Sätze gewonnenint Sätze verlorenint Punkte gewonnenint Punkte verlorenint Daten beliebige Anwendung Daten- erfassung Struktur- info

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Datenstruktur 4: Datenbank mit Data Dictionary Daten in irgendeinem internen Format; Strukturbeschreibung: in irgendeiner DDL Beispiel (SQL-DDL): CREATE TABLE Konto ( Kontonummer integer; Kontostand integer; Kreditrahmen integer; Inhaber integer; PRIMARY KEY (Kontonummer); FOREIGN KEY (Inhaber) REFERENCES Inhaber;); CREATE TABLE Inhaber ( Nr integer; Name varchar (50); Strasse varchar (50); PRIMARY KEY (Nr);); Vorteil: Nachteil: Data Diction. Daten beliebige Anwendung DDL Interface

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Zwischenfazit: Unstrukturierte Daten: Textdatei ohne explizite Strukturierung; Semantik erschließt sich aus der Textinterpretation Strukturierte Daten: Erst wird eine bindende Struktur festgelegt (-> Semantische Datenmodellierung), dann werden Daten entsprechend dieser Struktur eingegeben (Anwender benötigt spezielle Schnittstelle, da er die Struktur nicht kennt resp. kennen soll). Die Struktur ist weitgehend statisch; Änderungen (Schema Evolution) machen Mühe.

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Wie geht der Nicht-Informatiker vor? Er nimmt keine semantische Datenmodellierung vor (kann/will er nicht...). Er erhebt zunächst seine Daten und strukturiert sie (vielleicht) anschließend. Er vertraut auf geeignete Werkzeuge, die ihm die Auswertung ermöglichen. Beispiel: F&A (für eigene Datensammlungen) Beispiel: Google (für fremde Datensammlungen) Vorgehen stößt an Grenzen (s.o.) Ausweg: Der Anwender ergänzt die Daten um syntaktisch/semantische Zusätze (Tags).

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Datenstruktur 5: Textdatei mit Tags (zunächst nur Idee) Heike Boß wohnt in der Darmstädter Straße 46. Sie hat Konto mit einem Kontostand von 4560,00 und einem Kreditrahmen von Sie hat Konto mit einem Kontostand von 2398,78 und einem Kreditrahmen von Friedrich Coy wohnt im Siedlerweg 17. Er hat Konto mit einem Kontostand von 23,56 und einem Kreditrahmen von 50. Er hat Konto mit einem Kontostand von 1200 und einem Kreditrahmen von 500. Hans-Peter Daab wohnt in der Adalbert-Stifter-Str. 10. Er hat Konto mit einem Kontostand von 0 und einem Kreditrahmen von 0. Vorteil: Nachteil: Name Kontonummer Straße Kontostand Kreditrahmen

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Nochmals Datenstruktur 5: Textdatei mit Tags (nun aber – fast – richtig) Inhaber Heike Boß wohnt in der Straße Darmstädter Straße 46. Sie hat Konto Kontonummer mit einem Kontostand von 4560,00 und einem Kreditrahmen von Sie hat Konto Kontonummer mit einem Kontostand von 2398,78 und einem Kreditrahmen von Friedrich Coy wohnt im Siedlerweg 17. Er hat Konto mit einem Kontostand von 23,56 und einem Kreditrahmen von 50. Er hat Konto mit einem Kontostand von 1200 und einem Kreditrahmen von 500. Hans-Peter Daab wohnt in der Adalbert-Stifter-Str. 10. Er hat Konto mit einem Kontostand von 0 und einem Kreditrahmen von 0. Vorteil: Nachteil:

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Nochmals Datenstruktur 5: Textdatei mit Tags (nochmals besser) Anfang_Inhaber Anfang_Name Heike Boß Ende_Name wohnt in der Anfang_Straße Darmstädter Straße 46 Ende_Straße Ende_Inhaber. Sie hat Anfang_Konto Anfang_Kontonummer Ende_Kontonummer mit einem Anfang_Kontostand von 4560,00 Ende_Kontostand und einem Anfang_Kreditrahmen von 2000 Ende_Kreditrahmen Ende_Konto. Sie hat Anfang_Konto Anfang_Kontonummer Ende_Kontonummer mit einem Anfang_Kontostand von 2398,78 Ende_Kontostand und einem Anfang_Kreditrahmen von 2000 Ende_Kreditrahmen Ende_Konto. Friedrich Coy wohnt im Siedlerweg 17. Er hat Konto mit einem Kontostand von 23,56 und einem Kreditrahmen von 50. Er hat Konto mit einem Kontostand von 1200 und einem Kreditrahmen von 500. Hans-Peter Daab wohnt in der Adalbert-Stifter-Str. 10. Er hat Konto mit einem Kontostand von 0 und einem Kreditrahmen von 0. Was fehlt in dieser Datenstruktur? Was ist zuviel?

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Nochmals Datenstruktur 5: Textdatei mit Tags (XML) Heike Boß Darmstädter Straße , Friedrich Coy wohnt im Siedlerweg 17. Er hat Konto mit einem Kontostand von 23,56 und einem Kreditrahmen von 50. Er hat Konto mit einem Kontostand von 1200 und einem Kreditrahmen von 500. Hans-Peter Daab wohnt in der Adalbert-Stifter-Str. 10. Er hat Konto mit einem Kontostand von 0 und einem Kreditrahmen von 0.

Unstrukturierte, semistrukturierte und strukturierte Daten H.E. Erbs Fazit: Unstrukturierte Daten: Textdatei ohne explizite Strukturierung; Semantik erschließt sich aus der Textinterpretation Semistrukturierte Daten: Die Strukturinformation ist Teil der Daten (implizit oder explizit). Die Struktur weist Variationen auf. Neue von der bisherigen Struktur abweichende Daten sind jederzeit einfügbar (keine Schema-Evolution nötig). Strukturinformation (Schema) lässt sich nachträglich aus den Daten gewinnen. Strukturierte Daten: Erst wird eine bindende Struktur festgelegt (-> Semantische Datenmodellierung), dann werden Daten entsprechend dieser Struktur eingegeben (Anwender benötigt spezielle Schnittstelle, da er die Struktur nicht kennt resp. kennen soll). Die Struktur ist weitgehend statisch; Änderungen (Schema Evolution) machen Mühe.