Eine Biografie aus ADB/NDB als XML Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Bilal Erkin.

Slides:



Advertisements
Ähnliche Präsentationen
Erfolgsstrategien auf internationalen Märkten
Advertisements

Extensible Markup Language
Worzyk FH Anhalt Datenbanksysteme für FÜ WS 2004/2005 XML - 1 XML Extensible Markup Language.
Anwendungen des OODM auf die ADB / NDB
DTD XML-Technik Dino Azzano. Definition Document Type Definition Beschreibung der Regeln zum Aufbau aller XML-Dokumente, die zu einer Dokumentklasse.
Webstandards Leinwandbindung Jeder Kettfaden liegt abwechselnd unter bzw. über dem Schußfaden Köperbindung Die Bindungspunkte am diagonalen Köpergrat.
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
SVG und X3D Referentin: Gergana Ivanova
Ein Entity Relationship Diagramm zur ADB/NDB
Das Entity-Relationship-Modell
Untersuchung und szenariobasierte Entwicklung von Websites zur Orientierung in Universitätsstudiengängen unter Berücksichtigung von Prinzipien des Web.
Datenbanken 2 - WML - Prof. Dr. Stefan Böttcher - WS 2000/01 Wireless Markup Language (WML) Quelle: Ziel: Daten aus dem Internet an.
Standortfaktoren INTERN - Ausdrucksstark präsentieren.
XML - Aufbau und Struktur - mit Einsatz im B2B
Hands On – Einführung in XML
Seminar Autonome Systeme THEMA Ggf. Unterthema HAW Hamburg, SoSe 2011, Vorname Nachname Bild 1 zum THEMABild 2 zum THEMA.
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
HTML - Einführung Richard Göbel.
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
DOM (Document Object Model)
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Kann eine XML-Datenbank temporal sein? Universität zu Köln Hauptseminar: Datenbanken vs. Markup Dozent: Prof. Dr. Manfred Thaller Referentin: Cigdem Varol.
Wie wird eine XML DB eingabeintuitiv? Nachteile einer XML-Struktur: leicht entstehende Syntaxfehler mangelnde Übersicht.
HTML - Eine erste Annäherung
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 10: Einführung in XML.
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
Modularization of XHTML™
Überblick XML: Extensible Markup Language Entwickelt, um Informationen bereitzustellen, zu speichern und zu übertragen Im Gegensatz zu HTML keine vordefinierten.
SQL/XML. © Prof. T. Kudraß, HTWK Leipzig 2 2 Motivation Speicherung von XML in allen großen kommerziellen DBMS vorhanden proprietäre Lösungen für die.
XML Standardisierungen und Abfragesprachen
Einführung XML XML Einführung Andreas Leicht.
Kapitel 19 Astronomie Autor: Bennett et al. Unsere Galaxis, die Milchstraße Kapitel 19 Unsere Galaxis, die Milchstraße © Pearson Studium 2010 Folie: 1.
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Xindice Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Seyda Kurt.
Was versteht man unter XML Schema?
Übung 2: XML / XQuery Übung 2: XML / XQuery.
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
Normdaten und Metadaten Die Idee eines Internationalen Authority File Christel Hengel Die Deutsche Bibliothek META-LIB-Workshop, 22. Oktober 2002, Die.
Vortrag HTML, XHTML, DHTML
Hypertext Markup Language
Entwicklung verteilter Anwendungen I, WS 13/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 12 Folie 2 Web Services (1)
Integration heterogener verteilter Systeme mit WS-BPEL – ein Praxisbeispiel Dr. Wolf-Dieter Heinrichs.
Einsatzgebiete und Anwendungen
Cedric Heid, Lukas Burkhardt
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Java für Fortgeschrittene
Tutorium zur LV Online Research Ein Computerprogramm tut, was Du schreibst, nicht was Du willst.
Auslegung eines Vorschubantriebes
Datenbanken Datenstrukturen.
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Schulungsunterlagen der AG RDA Vertretungen der Öffentlichen Bibliotheken.
XML (Extensible Markup Language)
Pflanzenlernkartei 3 Autor: Rudolf Arnold. Pflanze 1 Gattung Merkmale Schädigung Bekämpfung.
Pflanzenlernkartei 2 Autor: Rudolf Arnold. Pflanze 1 Gattung Merkmale Schädigung Bekämpfung.
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
- Warum: Das HTML-Dilemma
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Peter Brezany Institut für Softwarewissenschaften Universität Wien
XML Schema Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung WS2011/2012 Hist.-kult.wiss. Informationsverarbeitung (Teil.
Geoinformation3 Geoinformation III XML Grundlagen und Dokumentspezifikation Vorlesung 12b.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Dr. Thomas H. Kolbe Geoinformation III XML Grundlagen und Dokumentspezifikationen Vorlesung.
Geoinformation3 Geoinformation III XML Grundlagen, Namensräume und Hyperlinks Vorlesung 12b.
Die Publikations- datenbank des AIT Karl Riedling.
1 Java und XML Stephan Baldes Warum XML? In welchem Format wurden die Daten gespeichert? Bernd;Thomas;3;5;1987;Freiburg;Karlsruhe Peter;Maier;7;9;1980;Karlsruhe;Freiburg.
 Präsentation transkript:

Eine Biografie aus ADB/NDB als XML Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Bilal Erkin

XML – (eXtensible Markup Language) Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten Namen der Elemente und Attribute sind frei wählbar Dateistruktur durch DTD oder XML Schema definierbar Heute: Metasprache in Text (TEI, XHTML), Grafik (SVG, X3D), Geodaten, Video (SMIL), Webservices (SOAP, WSDL), Datenbanken (Xquery) … 2

Vorteile von XML Für Mensch und Maschine verständliche Informationen (semantic Web) Lizenzfreiheit Plattformunabhängigkeit Medienneutralität Einsatz in verschiedenen Systemen Konvertierung in andere Dateiformate 3

Quelle für die Auszeichnung Biografie aus ADB / NDB am Beispiel von Curt GoetzADB / NDB Grafik Ohne OCR (Texterkennung) Deshalb nicht durchsuchbar Große Dateigröße 4

Ziel der Auszeichnung in XML Druchsuchbarer Text (geringe Dateigröße und suchmaschinenkonform) Verlinkungen innerhalb des Textes für schnelle Navigation (Evtl. Kopplung an die Originalgrafik bei älteren Texten) Schnelle Konvertierung in andere Formate (PDF, Datenbanken, CD-ROM) Semantische Struktur Für jede Personenbiografie eine Datei 5

Das wichtigste Element: Element ist das Kernstück einer Biografie Alle vorkommenden Personen werden damit ausgezeichnet und bekommen eine eindeutige ID Berufe und Personenbeschreibungen werden an die ID gekoppelt. Für die inter-biografische Verbindung wichtig! 6

Beispiel des Elements Attribute geschlecht = (männlich | weiblich) ID besteht aus Nachname_Vorname_Zahl Die Zahl in der ID soll verschiede Personen mit gleichem Vor- und Nachnamen unterscheiden Dateinamen sind identisch mit Person ID (Goetz_Curt_1.xml) 7

Analyse der Kurzinfo Name, Vorname Beruf Geburtsdatum / -ort; Sterbadatum / -ort Konfession Orthographisch: Hervorhebungen (fett bei Goetz; kursiv bei Curt) Entities (Stern, Kreuz ) 8

Auszeichnung der Kurzinfo Name wird hervorgehoben Entities werden eingefügt († für Kreuz) Beruf wird an person gekoppelt durch person_ref Beruf bekommt eine Kategorie 9

Absätze im Original Absätze werden durch... gekennzeichnet 10

Analyse der Familie Vater Mutter Ehepartner(in) Kinder Ineinander verschachtelte Personenbeschreibungen (teilweise sehr komplex) Symbole, für die es keine Entities gibt (Eheringe) 11

Auszeichnung des Vaters Abschnitt innerhalb Personen bekommen ID Nähere Beschreibungen in mit Referenz an die Person ID durch Attribut person_ref 12

Auszeichnung der Mutter Komplexe Verschachtelung Struktur Nur noch im Strukturbaum ersichtlich 13

Auszeichnung des Ehepartners Eheringe als Bilddatei! Mehrere möglich kann eingefügt werden (bei Goetz nicht nötig) Kinder als 14

Analyse der eigentlichen Biografie Durchgehender Text Weitere Personen kommen vor In anderen Biografien: Studium, Institut und Studienjahre Mehrere Absätze 15

Auszeichnung der eigentlichen Biografie Wird von umschlossen Personen werden ausgezeichnet mittels ID 16

Analyse der Werke Kategorie (Werkstyp) Titel Erscheinungsjahr Sonstige Bemerkungen 17

Auszeichnung der Werke bekommt Attrribute typ und jahr Titel in Sonstiges innerhalb 18

Seitenumbrüche im Original Seitenumbrüche werden in der XML repräsentiert durch Übergang von einer Seite zur anderen durch | Auch Seitenzahlen nach anderem Format möglich (XV|XVI; 10a|10b; 45.1|45.2 …) Vorteil: PDF wird 1:1 repräsentiert 19

Analyse des Literaturnachweises Autor Titel Erscheinungsjahr Verlag oder Seitennummer Literaturnachweise getrennt durch Semikolon Querverweise zu anderen Personen (Wilhelm Rocco) 20

Auszeichnung des Literaturnachweises Einzelne Einträge in Sinvoll in autor, titel, jahr usw. zu trennen? Kopplung der Einträge an ID (wegen W. Rocco) ? 21

Analyse des Fundstelle Werk Autor Seitenzahlen Bandnummer Mehrere Funstellen möglich Unterscheidung zwischen Haupteintrag und Nebeneintrag 22

Auszeichnung der Fundstelle Am Anfang der Datei in hat alle Angaben als Attribute und als Text Autor separat in getaggt mit persönlicher ID 23

Standartisierung der Struktur Für eine einheitliche Struktur für alle Einträge in der ADB / NDB: Mehrere verschiedene Strukturtypen taggen Eine DTD oder ein XML-Schema definieren Dokumentation der DTD Welche Elemente können in welchen enthalten sein? 24

25