XML Grundlagen, Namensräume & Hyperlinks

Slides:



Advertisements
Ähnliche Präsentationen
Extensible Markup Language
Advertisements

verweis-sensitive Grafiken
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
Hands On – Einführung in XML
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
HTML - Einführung Richard Göbel.
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
DOM (Document Object Model)
Seminar XML und Datenbanken Sven Wiegelmann SS 2002.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
Eine Biografie aus ADB/NDB als XML Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Bilal Erkin.
HTML - Eine erste Annäherung
XML-basierte Techniken
XML-Parser Manuel Röllinghoff.
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
XHTML 1.1 C. Nimz Abstrakte Module XHTML 1.1 C. Nimz Was ist ein abstraktes Modul? Definition eines XHTML-Moduls in spezieller leichter.
Modularization of XHTML™
Überblick XML: Extensible Markup Language Entwickelt, um Informationen bereitzustellen, zu speichern und zu übertragen Im Gegensatz zu HTML keine vordefinierten.
XML Standardisierungen und Abfragesprachen
Einführung XML XML Einführung Andreas Leicht.
Vorlesung: 1 Betriebliche Informationssysteme XML © 2002 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme.
Geoinformation III Vorlesung 13b XML-Schema.
DVG Kommentare1 Kommentare. DVG Kommentare 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht.
DVG Kommentare 1 Kommentare. 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht bis zum Ende der Zeile.
Tobias Högel & Dennis Böck,
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Was versteht man unter XML Schema?
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
Formale Sprachen und Automaten
Hyperlinks und Anker Links notieren
XML eXtensible Markup Language
Fortsetzung DTDs, UML  XML
Erzeugen von Karten, Layern und Legenden
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Java für Fortgeschrittene
Information und ihre Darstellung: XHTML & CSS
Windows Presentation Foundation, Vorlesung Wintersemester 2013/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 2 Folie 2 XAML (1) s.a.
Web-Publishing: HTML im Rahmen des PS aus Elektronischer Datenverarbeitung (Rechnerpraktikum)
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
XML (Extensible Markup Language)
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 1 Version 1.0a XML EXTENSIBLE MARKUP LANGUAGE.
HTML Hypertext Markup Language
1 Tagesüberblick 5 Lösung Hausaufgabe/Fragen Assoziative Felder Funktionen zu Variablenbehandlung.
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
- Warum: Das HTML-Dilemma
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
Peter Brezany Institut für Softwarewissenschaften Universität Wien
(Syntax, Strings/Zahlen, Variablen, Arrays)
XML Schema Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung WS2011/2012 Hist.-kult.wiss. Informationsverarbeitung (Teil.
Geoinformation3 Geoinformation III XML Grundlagen und Dokumentspezifikation Vorlesung 12b.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Dr. Thomas H. Kolbe Geoinformation III XML Grundlagen und Dokumentspezifikationen Vorlesung.
Geoinformation3 Geoinformation III XML Grundlagen, Namensräume und Hyperlinks Vorlesung 12b.
Java-Kurs Übung Besprechung der Hausaufgabe
Geoinformation3 Geoinformation III XML-Schema Vorlesung 13a.
JAVA und XML Programmierpraktikum XML 1.0 / Namespaces Von Markus Lucht & Timo Stollenwerk.
Seminar : XML und Datenbanken Die Auszeichnungssprache XML Lutz GarsteckiJena, 27.Mai 2004.
XML - Warum: Das HTML-Dilemma HTML, SGML, XML - Wie: Syntax, Konzepte, Sprachelemente Basics Wohlgeformte XML-Dokumente (ohne DTD) Gültige XML-Dokumente.
XML - Warum: Das HTML-Dilemma HTML, SGML, XML - Wie: Syntax, Konzepte, Sprachelemente Basics Wohlgeformte XML-Dokumente (ohne DTD) Gültige XML-Dokumente.
1 Java und XML Stephan Baldes Warum XML? In welchem Format wurden die Daten gespeichert? Bernd;Thomas;3;5;1987;Freiburg;Karlsruhe Peter;Maier;7;9;1980;Karlsruhe;Freiburg.
Einführung in XML - Teil 1
8.November 2006 ― 1Elektronisches Publizieren: XML Namespaces Kodierung strukturierter Dokumente im Web — XML Namespaces —
Document Type Definitions (DTDs) Marko Harasic Freie Universität Berlin Institut für Informatik Netzbasierte Informationssysteme
XML. Überblick In Anlehnung an Sprachmerkmale Wie jede Sprache verfügen auch ML über –Syntax  Wohlgeformtheit –Grammatik  DTD, XML-Schema.
Fortsetzung DTDs, UML  XML
Validierung vom XML mit XML Schema
Fortsetzung DTDs, UML  XML
Dokumentenproduktion im Medienzentrum
 Präsentation transkript:

XML Grundlagen, Namensräume & Hyperlinks Geoinformation III Vorlesung 12a XML Grundlagen, Namensräume & Hyperlinks

Übersicht über den dritten Vorlesungsblock 1 Übersicht über den dritten Vorlesungsblock 1. Offene Systeme, Rechnernetze und das Internet Die eXtensible Markup Language XML 2. Grundlagen, Namensräume & Hyperlinks XML Schema Von UML nach XML Die Geography Markup Language GML: Grundlagen, Repräsentation räumlicher und nichträumlicher Objekte Geometrie und Topologie

Extensible Markup Language 2 Extensible Markup Language Eines der größten Hindernisse bzgl. der Interoperabilität von Systemen sind die vielen proprietären Datenformate, deren Struktur zudem oftmals nicht offengelegt ist. XML ist eine Meta-Sprache zur Definition eigener Datenformate in XML spezifizierte Dokumentenformate heißen XML-Anwendungen Beispiele für bekannte XML-Anwendungen: Scalable Vector Graphics SVG Synchronised Media Integration Language SMIL Geographic Markup Language GML vom OpenGIS Consortium XML-Dokumente sind sowohl maschinen- als auch menschenlesbar Struktur und Syntax von XML-Dokumenten ähnelt HTML Der Entwurf von XML ist formal und präzise Korrektheit von XML-Dokumenten kann zu großen Teilen bereits außerhalb des eigentlichen Anwendungsprogramms geprüft werden

Extensible Markup Language (XML) 1.0 3 Extensible Markup Language (XML) 1.0 W3C Recommendation (Feb. 1998) Das World-Wide-Web-Consortium (W3C) ist für die Entwicklung von Standards für das WWW zuständig Second Edition: W3C Recommendation (Okt. 2000) http://www.w3.org/TR/2000/REC-xml-20001006 In dem oben genannten Dokument werden XML-Dokumente und das Verhalten eines XML-Prozessors (Parser) definiert, der ein XML-Dokument liest und an eine Anwendung weiterreicht, die die Information verarbeitet: XML – Dokument XML–Prozessor (PARSER) Anwendung A 1x

HTML Carl F. Gauß Beispielanfrage: Welche Berufe hatte der alte Gauß? 4 HTML Beispielanfrage: Welche Berufe hatte der alte Gauß? paragraph (Absatz) bold (fett) Ergebnis Quelltext <p ><b>Carl F. Gauß</b></p> <ul> <li>1777 bis 1855</li> <li>Mathematiker</li> <li>Geodät</li> <li>Physiker</li> </ul> Carl F. Gauß 1777 bis 1855 Mathematiker Geodät Physiker List item Problem: für die Darstellung im Webbrowser geeignet, allerdings nicht für thematische Abfragen und Recherchen. Die Auszeichnungen (Tags) sagen nur etwas über die Formatierung, aber nicht über die Bedeutung (Semantik) des Textinhaltes aus. unnamed list A 9x

5 XML - Beispiel <?xml version=“1.0“ encoding=“ISO-8859-1“ standalone=“yes“?> <!DOCTYPE person SYSTEM “person.dtd“> <person> <name> <vorname>Carl</vorname> <vorname>F.</vorname> <nachname>Gauß</nachname> </name> <geburtsjahr>1777</geburtsjahr> <todesjahr>1855</todesjahr> <beruf>Mathematik</beruf> <beruf>Geodät</beruf> <beruf>Physiker</beruf> </person> So sähe die entsprechende XML-Datei zum Beispiel der vorigen Folie aus. Durch entsprechend definiertes Markup (Tags) werden aus einfachen Daten (maschinen-) interpretierbare Informationen. Die Syntax und Struktur ähnelt der von HTML. A 1x

Elemente, Tags und Zeichen 6 Elemente, Tags und Zeichen Der String Carl Friedrich Gauß und die Leerzeichen sind Zeichendaten <person> und </person> sind Auszeichnungen (Markup) Das Tag ist die gebräuchlichste Form der Auszeichnung in einem XML-Dokument für leere Elemente, also Elemente ohne Inhalt, kann folgende Syntax abkürzend verwendet werden <br/> anstatt <br></br> zwischen Groß- und Kleinschreibung wird unterschieden. z.B.: Person  person Element person Start-Tag <person> Carl Friedrich Gauß </person> Inhalt End-Tag A 5x

Kindelement von person Elternelement von vor- und nachname 7 XML – Dokumente sind Bäume Wurzelelement Kindelement von person person <person> <name> <vorname>Friedrich</vorname> <nachname>Gauß</nachname> </name> <beruf>Mathematiker</beruf> <beruf>Geodät</beruf> </person> beruf name Geodät Mathematiker Friedrich vorname nachname Gauß Geschwister Elternelement von vor- und nachname A 7x

XML-Dokumente mit gemischtem Inhalt 8 XML-Dokumente mit gemischtem Inhalt <biographie> <name><vorname>Carl Friedrich</vorname> <nachname>Gauß</nachname> </name> war einer der wichtigsten Geodäten und Mathematiker.<name> <nachname>Gauß</nachname></name> war außerdem ein anerkannter <beruf>Physiker</beruf>. Am<datum><Tag>23.</Tag><monat>Februar </monat><jahr>1855</jahr></datum> ist er gestorben. </biographie> Das Wurzelelement biographie enthält die Kindelemente name, beruf und datum und eine Menge roher, unstrukturierter Zeichendaten. Es enthält einen gemischten Inhalt.

9 Attribute Elemente können neben dem Inhalt auch noch Attribute besitzen Ein Attribut ist ein Paar aus einem Namen und einem Wert Die Zuweisung erfolgt im Start-Tag eines Elements Die Namen werden von den Werten durch Gleichheitszeichen und optional durch Leerzeichen getrennt Die Werte sind in einfache oder doppelte Anführungszeichen eingeschlossen <person geboren=“1777/04/30“ gestorben=“1855/02/23“> Carl Friedrich Gauß </person> entspricht <person geboren = ‘1777/04/30‘ gestorben = ‘1855/02/23‘> Carl Friedrich Gauß </person> A 1x

10 XML – Namen I XML-Namen (Element-, Attributnamen,...) dürfen folgende Zeichen enthalten: Buchstaben: A – Z ; a – z (englische Buchstaben) Nichtenglische Buchstaben und Ideogramme: ö, f, x, ç Ziffern: 0 – 9 Nur folgende Interpunktionszeichen: Unterstrich ( _ ), Bindestrich ( - ), Punkt ( . ) Doppelpunkt ist für Namensräume reserviert XML-Namen müssen mit Buchstaben, Ideogrammen oder Unterstrich beginnen Reserviert sind alle Namen die mit XML, xml, Xml, xMl ... beginnen <Carls_Geburtstag>30 4 1777</Carls_Geburtstag> <Monat/Tag/Jahr>21/01/2002</Monat/Tag/Jahr> <Vorname_Name>Carl Gauß</Vorname_Name> <téléphone>0190 666666</téléphone> <4-you>Ich mag dich</4-you> f f A 5x

11 XML – Namen II XML-Namen (Element-, Attributnamen,...) dürfen folgende Zeichen enthalten: Buchstaben: A – Z ; a – z (englische Buchstaben) Nichtenglische Buchstaben und Ideogramme: ö, f, x, ç Ziffern: 0 – 9 Nur folgende Interpunktionszeichen: Unterstrich ( _ ), Bindestrich ( - ), Punkt ( . ) Doppelpunkt ist für Namensräume reserviert XML-Namen müssen mit Buchstaben, Ideogrammen oder Unterstrich beginnen Reserviert sind alle Namen die mit XML, xml, Xml, xMl ... beginnen <Carl‘s_Geburtstag>30 4 1777</Carl‘s_Geburtstag> <Monat-Tag-Jahr>21/01/2002</Monat-Tag-Jahr> <Vorname Name>Carl Friedrich</Vorname Name> <_4-you>Ich mag dich</_4-you> <owoya>Melina Merkouri</owoya > f f A 5x

12 Entity-Referenzen XML reserviert einige Zeichen (<>&“‘/). Um diese dennoch verwenden zu können verwenden werden sie durch Entity-Referenzen ersetzt. XML gibt genau fünf Entities mit entsprechenden Entity-Referenzen vor: < Kleiner-als-Zeichen (<) & das Ampersand (&) > Großer-als-Zeichen (>) " geraden doppelten Anführungszeichen (“) &apos; Apostroph oder einfachen Anführungszeichen (‘) Bsp.: <Autor>Witte & Schmidt</Autor> bedeutet: <Autor>Witte & Schmidt</Autor> das & kann von Parsern nicht missverstanden werden Es können selber weitere Entities & Entity-Referenzen festgelegt werden.

13 CDATA-Abschnitte Um die aufwändige Nutzung der Entity-Referenzen zu umgehen gibt die Möglichkeit der CDATA-Abschnitte: CDATA-Abschnitte: Alles was sich zwischen <![CDATA[ und ]]> befindet, wird als reine Zeichenkette interpretiert. Es gibt keine Auszeichnungen, nur noch Zeichendaten. Beispiel: <![CDATA[ XML ist so komplex! <seufz> Sei´s drum! ]]> <seufz> ist hier kein Tag sondern nur ein Zeichenstring

14 Kommentare Kommentare benutzt man um den Quellcode für menschliche Leser verständlich zu machen. Kommentare beginnen mit <!-- und enden mit --> Bsp.: <!-- Hier beschreibe ich die Person Gauß -- > Die Regeln für Kommentare: -- sollte innerhalb eines Kommentars nicht auftreten ein 3-facher Bindestich als Teil des Schlusszeichens ---> ist verboten Kommentare sind niemals zwingend Sie dürfen nicht innerhalb von Tags oder andere Kommentaren stehen

15 Steueranweisungen XML-Dokumente sind normalerweise weitgehend unabhängig von den Programmen, die mit ihnen arbeiten In manchen Fällen kann es sinnvoll sein, Hinweise oder Befehle zum Lesen bzw. zur Bearbeitung in ein Dokument einzubauen Steueranweisungen (Processing Instructions) dienen der Übergabe von Informationen an bestimmte Anwendungsprogramme Steueranweisungen können eine beliebige Menge Text enthalten, der „ungeparsed“, d.h. ohne Konvertierungen oder Ersetzungen an die entsprechende Anwendung weitergereicht wird. Beispiel: <?robots index=“yes“ follow=“no“?> Beginn mit <? Ende mit ?> Name der Anwendung beliebiger Text A 4x

XML-Deklaration Die XML-Deklaration ist eine optionale Steueranweisung 16 XML-Deklaration Die XML-Deklaration ist eine optionale Steueranweisung steht als erste im Dokument gibt Auskunft über <?xml version=“1.0“ encoding=“ISO-8859-1“ standalone=“yes“?> <person> Carl Friedrich Gauß </person> Verwendete XML-Version Verwendeter Zeichensatz Eigenständige Datei Ja / Nein A 3x

17 Wohlgeformtheit I Alle XML-Dokumente müssen ohne Ausnahme wohlgeformt sein: 1. Jedes Start-Tag muss ein dazugehöriges End-Tag haben 2. Elemente dürfen einander nicht überschneiden 3. Attributwerte müssen in Anführungszeichen stehen <vorname>Friedrich</vorname> <name> <nachname>Gauß</nachname></name> <name> <nachname>Gauß</name></nachname> <person geboren=“1777/04/30“ gestorben=“1855/02/23“> Carl Friedrich Gauß </person>

18 Wohlgeformtheit II Alle XML-Dokumente müssen ohne Ausnahme wohlgeformt sein: 4. Element- und Attributbezeichner müssen XML-Namen sein 5. Ein Element darf nicht 2 Attribute mit gleichem Namen besitzen 6. Kommentare & Steueranweisungen dürfen nicht innerhalb Tags stehen <person geboren=“1777/04/30“ geboren=“1855/02/23“> Carl Friedrich Gauß </person> <person><!-- Hier bezeichne ich Personen--> Carl Friedrich Gauß </person> <person<!-- Hier bezeichne ich Personen-->> Carl Friedrich Gauß </person>

19 Wohlgeformtheit III Alle XML-Dokumente müssen ohne Ausnahme wohlgeformt sein: 7. In den Zeichendaten eines Elements oder Attributs dürfen keine ungeschützten <- oder &- Zeichen stehen. 8. Es muss genau ein Wurzelelement geben <Autor>Witte & Schmidt</Autor> <Autor>Witte & Schmidt</Autor> <person> <name> <vorname>Carl</vorname> </name> <beruf>Geodät</beruf> </person> <person> <beruf>Geodät</beruf> </person> <vorname>Carl</vorname>

Definition der Struktur von Dokumenten 20 Definition der Struktur von Dokumenten wohlgeformte Dokumente können zwar von jedem XML-Parser eingelesen werden, jedoch sagt die Wohlgeformtheit nichts darüber aus welche Elementnamen überhaupt vorkommen dürfen, in welcher Reihenfolge die Elemente im XML-Dokument erscheinen müssen, welches Element Kindelement eines anderen sein darf wie oft die Elemente im XML-Dokument erscheinen dürfen, welche Attribute in bestimmten Elementen verwendet werden dürfen Jede XML-Anwendung definiert die ihr bekannten bzw. von ihr akzeptierten Elemente sowie die Dokumentenstruktur mit Hilfe einer sog. Document Type Declaration (DTD, veraltet) eines XML-Schemas (aktuell, siehe Vorlesung nächste Woche)