Controlled Vocabularies in XML Datenbanken vs. Markup – Prof. Dr. Thaller Mike Odenthal
Controlled Vocabularies allgemein Controlled Vocabularies dienen der Einschränkung und Kontrolle von Termini Es dürfen nur autorisierte Termini verwendet werden Anwendung z.B. bei digitalen Bibliotheken oder Suchmaschinen (in Form von z.B. Thesauri) Können Probleme wie Homographen oder Synonyme beheben (Fussball = [Gegenstand Sportart]) Für das Konzept des Semantic Web einsetzbar
Controlled Vocabularies in XML Problem: Wie kann man in XML eine sichere Wortschatzkontrolle bei Einträgen in eine XML-Datenbank realisieren? Idee: Die Kontrolle über die Einträge über XML-Schema mit Hilfe von simpleType Definitions realisieren.
Controlled Vocabularies in XML Simplifiziertes Beispiel der XML-Datei: Rühmann Heinz 1902 Schauspieler
Controlled Vocabularies in XML Die XML Schema-Datei:
Controlled Vocabularies in XML Die simpleType Definition:
Controlled Vocabularies in XML Möglichkeit der Auslagerung der simpleType Definiton TypBerufe als extrahierte.xsd in anderen XML Schema- Dateien verwendbar durch -Funktion Mehr Übersicht in der zentralen Schema-Datei Weitere Kontrollfunktionen über den reinen Wortschatz hinaus
Controlled Vocabularies in XML Die simpleType Definition für Geburtsdaten: Das pattern value besagt das die Jahreszahl nur 4 Ziffern haben kann
Controlled Vocabularies in XML Bei Nichteinhaltung der Vorgaben durch die XML Schema Datei wird die XML-Datei invalid Nachteil: Homographen können nicht erkannt werden Keine semantische Wortschatzkontrolle