Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1234567891011121314151617181920 Geoinformation3 Geoinformation III XML Grundlagen, Namensräume & Hyperlinks Vorlesung 12a.

Ähnliche Präsentationen


Präsentation zum Thema: "1234567891011121314151617181920 Geoinformation3 Geoinformation III XML Grundlagen, Namensräume & Hyperlinks Vorlesung 12a."—  Präsentation transkript:

1 Geoinformation3 Geoinformation III XML Grundlagen, Namensräume & Hyperlinks Vorlesung 12a

2 Geoinformation3 1 Übersicht über den dritten Vorlesungsblock 1. Offene Systeme, Rechnernetze und das Internet Die eXtensible Markup Language XML 2.Grundlagen, Namensräume & Hyperlinks 3.XML Schema 4.Von UML nach XML Die Geography Markup Language GML: 5.Grundlagen, Repräsentation räumlicher und nichträumlicher Objekte 6.Geometrie und Topologie

3 Geoinformation3 2 Eines der größten Hindernisse bzgl. der Interoperabilität von Systemen sind die vielen proprietären Datenformate, deren Struktur zudem oftmals nicht offengelegt ist. XML ist eine Meta-Sprache zur Definition eigener Datenformate –in XML spezifizierte Dokumentenformate heißen XML-Anwendungen –Beispiele für bekannte XML-Anwendungen: Scalable Vector Graphics SVG Synchronised Media Integration Language SMIL Geographic Markup Language GML vom OpenGIS Consortium XML-Dokumente sind sowohl maschinen- als auch menschenlesbar Struktur und Syntax von XML-Dokumenten ähnelt HTML Der Entwurf von XML ist formal und präzise Korrektheit von XML-Dokumenten kann zu großen Teilen bereits außerhalb des eigentlichen Anwendungsprogramms geprüft werden Extensible Markup Language

4 Geoinformation3 3 Extensible Markup Language (XML) 1.0 W3C Recommendation (Feb. 1998) Das World-Wide-Web-Consortium (W3C) ist für die Entwicklung von Standards für das WWW zuständig Second Edition: W3C Recommendation (Okt. 2000) In dem oben genannten Dokument werden XML-Dokumente und das Verhalten eines XML-Prozessors (Parser) definiert, der ein XML-Dokument liest und an eine Anwendung weiterreicht, die die Information verarbeitet: A 1x XML – Dokument XML–Prozessor (PARSER) Anwendung

5 Geoinformation3 4 A 9x HTML Carl F. Gauß 1777 bis 1855 Mathematiker Geodät Physiker Carl F. Gauß 1777 bis 1855 Mathematiker Geodät Physiker ErgebnisQuelltext paragraph (Absatz) bold (fett) unnamed list List item Problem: für die Darstellung im Webbrowser geeignet, allerdings nicht für thematische Abfragen und Recherchen. Die Auszeichnungen (Tags) sagen nur etwas über die Formatierung, aber nicht über die Bedeutung (Semantik) des Textinhaltes aus. Beispielanfrage: Welche Berufe hatte der alte Gauß?

6 Geoinformation3 5 XML - Beispiel Carl F. Gauß Mathematik Geodät Physiker A 1x So sähe die entsprechende XML-Datei zum Beispiel der vorigen Folie aus. Durch entsprechend definiertes Markup (Tags) werden aus einfachen Daten (maschinen-) interpretierbare Informationen. Die Syntax und Struktur ähnelt der von HTML. So sähe die entsprechende XML-Datei zum Beispiel der vorigen Folie aus. Durch entsprechend definiertes Markup (Tags) werden aus einfachen Daten (maschinen-) interpretierbare Informationen. Die Syntax und Struktur ähnelt der von HTML.

7 Geoinformation3 6 Elemente, Tags und Zeichen Der String Carl Friedrich Gauß und die Leerzeichen sind Zeichendaten und sind Auszeichnungen (Markup) Das Tag ist die gebräuchlichste Form der Auszeichnung in einem XML-Dokument für leere Elemente, also Elemente ohne Inhalt, kann folgende Syntax abkürzend verwendet werden anstatt zwischen Groß- und Kleinschreibung wird unterschieden. z.B.: Person  person A 5x Carl Friedrich Gauß End-TagStart-TagInhaltElement person

8 Geoinformation3 Geschwister Elternelement von vor- und nachname 7 XML – Dokumente sind Bäume Friedrich Gauß Mathematiker Geodät A 7x person Friedrich vornamenachname Gauß beruf name GeodätMathematiker Kindelement von person Wurzelelement

9 Geoinformation3 8 XML-Dokumente mit gemischtem Inhalt Carl Friedrich Gauß war einer der wichtigsten Geodäten und Mathematiker. Gauß war außerdem ein anerkannter Physiker. Am 23. Februar 1855 ist er gestorben. Das Wurzelelement biographie enthält die Kindelemente name, beruf und datum und eine Menge roher, unstrukturierter Zeichendaten. Es enthält einen gemischten Inhalt.

10 Geoinformation3 Attribute Elemente können neben dem Inhalt auch noch Attribute besitzen Ein Attribut ist ein Paar aus einem Namen und einem Wert Die Zuweisung erfolgt im Start-Tag eines Elements Die Namen werden von den Werten durch Gleichheitszeichen und optional durch Leerzeichen getrennt Die Werte sind in einfache oder doppelte Anführungszeichen eingeschlossen 9 A 1x Carl Friedrich Gauß Carl Friedrich Gauß entspricht

11 Geoinformation3 10 XML – Namen I XML-Namen (Element-, Attributnamen,...) dürfen folgende Zeichen enthalten: Buchstaben: A – Z ; a – z (englische Buchstaben) Nichtenglische Buchstaben und Ideogramme: ö, f, x, ç Ziffern: 0 – 9 Nur folgende Interpunktionszeichen: Unterstrich ( _ ), Bindestrich ( - ), Punkt (. ) Doppelpunkt ist für Namensräume reserviert XML-Namen müssen mit Buchstaben, Ideogrammen oder Unterstrich beginnen Reserviert sind alle Namen die mit XML, xml, Xml, xMl... beginnen A 5x /01/2002 Carl Gauß Ich mag dich f f

12 Geoinformation3 11 XML – Namen II A 5x /01/2002 Carl Friedrich Ich mag dich Melina Merkouri f f XML-Namen (Element-, Attributnamen,...) dürfen folgende Zeichen enthalten: Buchstaben: A – Z ; a – z (englische Buchstaben) Nichtenglische Buchstaben und Ideogramme: ö, f, x, ç Ziffern: 0 – 9 Nur folgende Interpunktionszeichen: Unterstrich ( _ ), Bindestrich ( - ), Punkt (. ) Doppelpunkt ist für Namensräume reserviert XML-Namen müssen mit Buchstaben, Ideogrammen oder Unterstrich beginnen Reserviert sind alle Namen die mit XML, xml, Xml, xMl... beginnen

13 Geoinformation3 12 Entity-Referenzen XML reserviert einige Zeichen (<> & “‘/). Um diese dennoch verwenden zu können verwenden werden sie durch Entity-Referenzen ersetzt. XML gibt genau fünf Entities mit entsprechenden Entity-Referenzen vor: & lt; Kleiner-als-Zeichen (<) & amp; das Ampersand (&) & gt; Großer-als-Zeichen (>) & quot; geraden doppelten Anführungszeichen (“) & apos; Apostroph oder einfachen Anführungszeichen (‘) Bsp.: Witte & amp; Schmidt bedeutet: Witte & Schmidt das & amp; kann von Parsern nicht missverstanden werden Es können selber weitere Entities & Entity-Referenzen festgelegt werden.

14 Geoinformation3 13 CDATA-Abschnitte Um die aufwändige Nutzung der Entity-Referenzen zu umgehen gibt die Möglichkeit der CDATA-Abschnitte: CDATA-Abschnitte: Alles was sich zwischen befindet, wird als reine Zeichenkette interpretiert. Es gibt keine Auszeichnungen, nur noch Zeichendaten. Beispiel: Sei´s drum! ]]> ist hier kein Tag sondern nur ein Zeichenstring

15 Geoinformation3 14 Kommentare Kommentare benutzt man um den Quellcode für menschliche Leser verständlich zu machen. Kommentare beginnen mit Bsp.: Die Regeln für Kommentare: -- sollte innerhalb eines Kommentars nicht auftreten ein 3-facher Bindestich als Teil des Schlusszeichens ---> ist verboten Kommentare sind niemals zwingend Sie dürfen nicht innerhalb von Tags oder andere Kommentaren stehen

16 Geoinformation3 15 XML-Dokumente sind normalerweise weitgehend unabhängig von den Programmen, die mit ihnen arbeiten In manchen Fällen kann es sinnvoll sein, Hinweise oder Befehle zum Lesen bzw. zur Bearbeitung in ein Dokument einzubauen Steueranweisungen (Processing Instructions) dienen der Übergabe von Informationen an bestimmte Anwendungsprogramme Steueranweisungen können eine beliebige Menge Text enthalten, der „ungeparsed“, d.h. ohne Konvertierungen oder Ersetzungen an die entsprechende Anwendung weitergereicht wird. Beispiel: A 4x Steueranweisungen Name der Anwendung Beginn mit

17 Geoinformation3 16 XML-Deklaration Die XML-Deklaration ist eine optionale Steueranweisung steht als erste im Dokument gibt Auskunft über Carl Friedrich Gauß A 3x Verwendete XML- Version Verwendeter Zeichensatz Eigenständige Datei Ja / Nein

18 Geoinformation3 17 Wohlgeformtheit I Alle XML-Dokumente müssen ohne Ausnahme wohlgeformt sein: 2.Elemente dürfen einander nicht überschneiden 3.Attributwerte müssen in Anführungszeichen stehen 1.Jedes Start-Tag muss ein dazugehöriges End-Tag haben Friedrich Gauß Carl Friedrich Gauß Gauß

19 Geoinformation3 18 Wohlgeformtheit II Alle XML-Dokumente müssen ohne Ausnahme wohlgeformt sein: 6.Kommentare & Steueranweisungen dürfen nicht innerhalb Tags stehen 5.Ein Element darf nicht 2 Attribute mit gleichem Namen besitzen Carl Friedrich Gauß > Carl Friedrich Gauß Carl Friedrich Gauß 4.Element- und Attributbezeichner müssen XML-Namen sein

20 Geoinformation3 19 Wohlgeformtheit III Alle XML-Dokumente müssen ohne Ausnahme wohlgeformt sein: 7.In den Zeichendaten eines Elements oder Attributs dürfen keine ungeschützten <- oder & - Zeichen stehen. Geodät Carl 8.Es muss genau ein Wurzelelement geben Witte & amp; Schmidt Carl Geodät Witte & Schmidt

21 Geoinformation3 20 Definition der Struktur von Dokumenten wohlgeformte Dokumente können zwar von jedem XML-Parser eingelesen werden, jedoch sagt die Wohlgeformtheit nichts darüber aus –welche Elementnamen überhaupt vorkommen dürfen, –in welcher Reihenfolge die Elemente im XML-Dokument erscheinen müssen, –welches Element Kindelement eines anderen sein darf –wie oft die Elemente im XML-Dokument erscheinen dürfen, –welche Attribute in bestimmten Elementen verwendet werden dürfen Jede XML-Anwendung definiert die ihr bekannten bzw. von ihr akzeptierten Elemente sowie die Dokumentenstruktur mit Hilfe einer sog. Document Type Declaration (DTD, veraltet) eines XML-Schemas (aktuell, siehe Vorlesung nächste Woche)


Herunterladen ppt "1234567891011121314151617181920 Geoinformation3 Geoinformation III XML Grundlagen, Namensräume & Hyperlinks Vorlesung 12a."

Ähnliche Präsentationen


Google-Anzeigen