Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.

Kopien: 1
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.

Ähnliche Präsentationen


Präsentation zum Thema: "Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte."—  Präsentation transkript:

1 Grundlagen von XML

2 © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte Strukturen Hypertext Extensible Markup Language (XML): Erweiterbares HTML Zusammenwachsen von SGML and HTML: – Stärke von SGML (Dokumentenbeschreibungs- sprache) – plus Einfachheit von HTML

3 © Prof. T. Kudraß, HTWK Leipzig HTML vs. XML HTML beschreibt das Aussehen eines Web- Dokuments, nicht den Inhalt. Daraus resultieren Beschränkungen des WWW: – Austausch von Informationen – Transformation von Dokumentformaten – Suche nach Informationen Idee von XML XML bridges the incompatibilities of computer systems, allowing people to search for and exchange scientific data, commercial products and multilingual documents with greater ease and speed (Jon Bosak & Tim Bray, XML and the Second- Generation Web, in: Scientific American, Mai 1999)

4 © Prof. T. Kudraß, HTWK Leipzig Was ist XML ? XML = EXtensible Markup Language zukünftiges universelles Datenformat (Teilmenge von SGML) XML ist eine Meta-Sprache, also eine Sprache zur Definition von Sprachen Tags im Vergleich zu HTML nicht vordefiniert Design von eigenen Tags Standard ist frei und erweiterbar XML,um Informationen zu – strukturieren – speichern – senden Datenaustausch im Web (auch B2B)

5 © Prof. T. Kudraß, HTWK Leipzig XML-Beispiel (Bücherliste) Milan Kundera Identity 1998 Richard Feynman The Character of Physical Law

6 © Prof. T. Kudraß, HTWK Leipzig XML-Grundbegriffe: Dokument Dokument – XML-Dokument impliziert nicht Dokument im herkömmlichen Sinn – Ein XML-Dokument besteht aus Prolog (optional) DTD (optional) dem Wurzelelement – Baum Kommentare und Processing Instructions sind an fast allen Stellen möglich – Im Sinne der Spezifikation wohlgeformte Daten XML Dokument – gültig, falls DTD vorliegt und Dokument dieser entspricht – physikalischer Aufbau aus Entities – logischer Aufbau aus Deklarationen, Elementen, Kommentaren,... Prolog –

7 © Prof. T. Kudraß, HTWK Leipzig XML-Grundbegriffe: Element XML-Element – hat ein Start-Tag und ein End-Tag mit seinem Namen – kann Attribute und Inhalt haben (PCDATA oder Elemente) Inhalt>/myElement> y 5 a – Attribute optional – ein leeres Element hat keinen Inhalt kurz: – mixed Content: Inhalt besteht aus PCDATA und Elementen XML-Speicherung mit Oracle von Kudrass Namensregeln – Buchstaben, Zahlen und andere Zeichen – nicht Zahl, _ bzw. xml am Anfang – keine Leerzeichen

8 © Prof. T. Kudraß, HTWK Leipzig XML-Grundbegriffe: Entity Parameter Entity (nur in der DTD verwendet) – nur in der DTD verwendet: % entity-name; Referenz: Character Entity (referenziert durch ) Predefined Entity (referenziert durch < > &qout; & ') Parsed (internal oder external) Entity Unparsed external Entity Name als Attributwert verwendet

9 © Prof. T. Kudraß, HTWK Leipzig Weitere XML-Grundbegriffe Kommentar – – kann (außerhalb von Markup) überall im Dokument vorkommen – nicht in DTD deklariert Processing Instruction – – kann (außerhalb von Markup) überall im Dokument vorkommen – nicht in DTD deklariert

10 © Prof. T. Kudraß, HTWK Leipzig XML Namespaces (Namensräume) Konflikte zwischen Elementnamen vermeiden Präfix (kein Namespace) – – z.B. – Problem: Präfixe nicht immer eindeutig Präfixe für Namespaces – – Default Namespaces – Attributwert " namespace " sollte URI sein Zweck: weltweit eindeutige Zeichenkette (selbst wenn dort nicht vorhanden)

11 © Prof. T. Kudraß, HTWK Leipzig XML PCDATA XML Parser behandeln alle Daten außer CDATA-Blöcke als PCDATA (Parsable Character Data) ungültige Zeichen < und & Zeichenersetzungen: < > less than > > greater than & & ampersand ' ' apostrophe " " quotation mark

12 © Prof. T. Kudraß, HTWK Leipzig CDATA-Abschnitte CDATA Abschnitt: – Interpretation: Hände weg! Das hier soll nicht interpretiert werden! – Textabschnitt wird nicht als mit Markups durchsetzt interpretiert Beispiel:

13 © Prof. T. Kudraß, HTWK Leipzig DTD Document Type Definition schematische Beschreibung des XML-Dokuments – und Definition von Entities Elemente dürfen verschiedene Eltern haben Schema kann auch rekursiv sein – Offenes Schema ist möglich (Kinder müssen aber deklariert sein) –

14 © Prof. T. Kudraß, HTWK Leipzig DTD (Forts.) DTD kann – extern sein – und/oder intern externe Definitionen werden überschrieben – oder fehlen Gültig: Dokumente, für die eine DTD definiert ist, heißen gültig (valid), wenn sie der in der DTD definierten Struktur entsprechen Wohlgeformt: Dokumente, die gemäß XML Empfehlung syntaktisch korrekt sind, heißen wohlgeformt (well-formed)

15 © Prof. T. Kudraß, HTWK Leipzig DTD Beispiel (intern) Tove Jani Reminder Don't forget me this weekend

16 © Prof. T. Kudraß, HTWK Leipzig DTD Beispiel (extern) Externe DTD zu XML Beispiel (note) Einbindung in note.xml

17 © Prof. T. Kudraß, HTWK Leipzig DTD Elemente Sequenz-Operator Oder-Operator optionales Element (child?) mindestens ein Vorkommen (child+) beliebig oft (child*) nur Text Gemischter Inhalt Beliebiger Inhalt (ANY) Kein Inhalt (leeres Element)

18 © Prof. T. Kudraß, HTWK Leipzig DTD Attribute mit !ATTLIST definiert (Default) e = element, a = attribute Beispiel-Definition 100 nicht explizit benötigt (implied) notwendig (required) festgelegt (fixed) Auswahlliste

19 © Prof. T. Kudraß, HTWK Leipzig DTD Notation Definition von z.B. Grafikformaten Entity zugehörige Notation

20 © Prof. T. Kudraß, HTWK Leipzig DTD Weiteres Beispiel

21 © Prof. T. Kudraß, HTWK Leipzig XML-Parser / data attr data XML-ParserXML-Dokument

22 © Prof. T. Kudraß, HTWK Leipzig Document Object Model (DOM) HTML und XML Plattform- und sprachunabhängig Dynamischer Zugriff und Manipulation von – Inhalt – Struktur Eigenes Strukturmodell – repräsentiert die Baumstruktur eines XML- Dokumentes – einschließlich Kommentaren und Processing Instructions Schnittstelle – nicht Implementierung

23 © Prof. T. Kudraß, HTWK Leipzig Spezifische Markup-Sprachen Entwicklung standardisierter DTDs für spezialisierte Domains erlaubt Datenaustausch zwischen heterogenen Quellen DTD definiert Markup-Sprache für branchen- und anwendungsspezifische Semantik Beispiel: Mathematische Markup Language (MathML) – Mathematische Sachverhalte im Web – In HTML: Nachteil: Mangelnde Flexibilität bei der Präsentation (Font- Größe, Hintergrund-Farbe) – In MathML Presentation Elements, Content Elements Beispiel: x y 2

24 © Prof. T. Kudraß, HTWK Leipzig XML-basierte Markup-Sprachen ECML - Electronic Commerce Modeling Language FpML - Financial Products Markup Language Chemical Markup Language (CML) Music Markup Language (MusikML) Weather Observation Definition Format Encoded Archival Description (EAD) Tutorial Markup Language (TML) Channnel Definition Format (CDF) WebDAV: Distributed Authoring and Versioning on the WWW Wireless Application Protocol (WAP)...

25 © Prof. T. Kudraß, HTWK Leipzig XML in Anwendungen XML Standards, Sprachen und Anwendungen: Web Publishing Electronic Commerce – Application-to-Application (A2A) – Business-to-Business (B2B) – Business-to-Consumer (B2C) Elektronic Data Interchange (EDI) Enterprise Application Integration (EAI)

26 © Prof. T. Kudraß, HTWK Leipzig XML in Anwendungen Vokabulare und Frameworks für XML-Entwicklung Electronic Business XML (ebXML) XML initiative (OASIS) BizTalk (Microsoft) cXML (Ariba) Rosetta Net XML/EDI Group

27 © Prof. T. Kudraß, HTWK Leipzig Datenaustausch - Schlüssel zum e-Commerce Company to Company (Supply Chain) EDI Punkt-zu-Punkt Lösung hoher Investitionsaufwand für Mittelstand ungeeignet Ablösung durch XML Standardisierte DTDs Können auch unilateral erweitert werden Standardwerkzeuge Kunde Lieferant Order Tracking

28 © Prof. T. Kudraß, HTWK Leipzig... und integriertes Content Management XML impliziert keine bestimmte Präsentationsform Unterschiedliche Präsentationen von XML-Dokumenten wird durch Style-Sheets ermöglicht Hohe Flexibilität Generischer Ansatz KundeLieferant Internet Suche CD/DVDPrint on Demand Katalog- Management

29 © Prof. T. Kudraß, HTWK Leipzig Was ist XSL ? eXtensible Stylesheet Language Stylesheet Sprache für XML, sieht aus wie XML! ausgeklügelter als CSS (aber auch CSS verwendbar) XSL noch im Entwicklungsstadium 2 Teile – Transformation von XML in eine andere Art von XML (Transformationssprache XSLT) – Vokabular für Formatierugsobjekte (Formatting Objects) Formatierungsobjekte – aus Textverarbeitung bekannte Konstrukte Blöcke, Grafiken, Linien, Tabellen – FOs formen einen Baum = Formatierungsobjektbaum als XML-Dokument – Vokabular z. Zt. noch in Entwicklung XPATH als Anfragesprache zum Zugriff auf Bestandteile des Dokuments


Herunterladen ppt "Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte."

Ähnliche Präsentationen


Google-Anzeigen