1 Patrick Sahle Erfahrungen mit einem internationalen Standard zur Handschriftenbeschreibung: CEEC und MASTER.

Slides:



Advertisements
Ähnliche Präsentationen
Web-Content-Management-Systeme
Advertisements

Bernhard Assmann – Franz Fischer – Patrick Sahle
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
Prof. Dr. Günter Törner Dipl-Math. Thorsten Bahne
Typo3 Schulung.
Bibliothekskurs Sozialwissenschaften
Der Referent Patrick Sahle M.A.
Art der Arbeit (Projekt-/Studien-/Diplomarbeit/
Vorstellung von PaderWAVE Generierung von Web-Anwendungen aus visuellen Spezifikationen, SS04 Projektgruppe der AG Kastens.
Hands On – Einführung in XML
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
HTML - Einführung Richard Göbel.
Java: Objektorientierte Programmierung
DOM (Document Object Model)
AGXIS – Ein Konzept für eine generische Schnittstellenbeschreibung Dr.-Ing. Ulrich Hussels, RISA GmbH 07. Juni 2005 Workshop Umweltdatenbanken 2005.
Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.
CIDOC-CRM Universität zu Köln Historisch-kulturwissenschaftliche Informationsverarbeitung AM 2 Dozent: Prof. Dr. Manfred Thaller Referent: Nelson Marambio.
METS/MODS Referat im Rahmen des IT-Zertifikats f ü r Geisteswissenschaftler Leitung: P. Sahle Referentin: C. Ottnad.
HTML - Eine erste Annäherung
Der Umgang mit qualitativ erhobenen Daten: Strategien der Datenanalyse
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
Modularization of XHTML™
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
Einführung XML XML Einführung Andreas Leicht.
Sebastian Grahn Sebastian Kühn
MMQL – Multimedia Query Language Eine Anfragesprache für Multimedia-Ähnlichkeitsanfragen Christian Mantei.
Inhalt Struktur Gestaltung
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Austauschformate für Terminologie
Was versteht man unter XML Schema?
Data Documentation Initiative (DDI)
UML Begleitdokumentation des Projekts
METS (Metadata Encoding Transmission Standard). Wer und Was Digital Library Federation Vorgänger: MoA II (1997) Standard zur Beschreibung einer Teilmenge.
T E I [Text Encoding Initiative] IT-Zertifikat Kurs 4 :Daten und Metadaten Dozent: Patrick Sahle.
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
„Katalog und Bestell-Format
Typo3 Templates und TypoScript
Java für Fortgeschrittene
Vorgehensmodell mit Scrum-Elementen
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Tutorium PG Verbesserung Blatt 5 Beim instanziieren eines Fahrrades muss es möglich sein, alle benötigten Attribute dem Konstruktor zu übergeben.
Schulungsunterlagen der AG RDA Vertretungen der Öffentlichen Bibliotheken.
XML (Extensible Markup Language)
Kurzpräsentation von Herbert Schlechta
Version X des Programms: Datenaustausch-Probleme % ( ) (WIRBEL-BASISTEIL GR. 52) N1G29X150Y85I150J25 N2G0X150Y25 Version Y des Programms:
Stand der Normung um XML (eXtensible Markup Language) & die Aktivitäten des DIN (Stand: November 2000) Bernd Bösler, Referent im DIN/NBü DIN Deutsches.
ICT – Modul Textverarbeitung
IT-Zertifikat Kurs IV Gunther Sarling
Die Publikations- datenbank des AIT Karl Riedling.
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
Eike Schallehn, Martin Endig
Eike Schallehn, Martin Endig
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
Bern University of Applied Sciences Engineering and Information Technology Documentation generator for XML-based description standards Ausgangslage: Die.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Geoinformation3 Geoinformation III XML Grundlagen, Namensräume und Hyperlinks Vorlesung 12b.
TEI Die Text Encoding Initiative (TEI-Konsortium), 1987 gegründet - Dokumentenformat (zunächst SGML)‏
XML – Grundlagen und Anwendungen Teil 4: Modellierung von Datenmodellen mit XML-Schema Prof. Dr. Michael Löwe, FHDW Hannover.
Was gibt’s neues im Bereich Anpassung Fabian Moritz Consultant, Developer SharePointCommunity.de.
Semantic Markup für Zwecke der Langzeitarchivierung in digitalen Bibliotheken Neubiberg,
Seminar Digitale Bibliotheken Thema: Nutzen von digitalen Bibliotheken.
Digital Repository Auffindbare Publikationen. Was sind Repositorien ? Als Repositorium bezeichnet man eine Struktur in der Dokumente Organisiert abgelegt.
Technische Universität München Institute of Aeronautical Engineering Prof. Dr.-Ing. Horst Baier Presentation of the Institute (December 2009)
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
Leitfaden zur Erstellung eines Förderungsantrags für K- Projekte Teil A: inhaltlicher Teil Budiono Nguyen.
(Name of presenter) (Short title of presentation).
Thema Kraftfeld-Analyse
 Präsentation transkript:

1 Patrick Sahle Erfahrungen mit einem internationalen Standard zur Handschriftenbeschreibung: CEEC und MASTER

2 Grundlagen, Ziele, Verwendungsmöglichkeiten

3 MASTER - der Rahmen EU-Projekt Januar Juni 2001 Verschiedene Projektpartner und assoziierte Partner (Bibliotheken, Universitäten [Humanities Computing]) Hauptziel: Ermöglichung eines allgemeinen Handschriftenkataloges Definition eines Standards für maschinenlesbare Handschriften- beschreibungen Bereitstellung von Software zur Erstellung und Kontrolle (Validierung) dieser Katalogisate Tests mit Beispielkatalogisaten und deren Bereitstellung im Internet Schulung von Personal in den beteiligten Bibliotheken (und darüber hinaus)

4 MASTER - der Standard (allgemein I) Technische Grundlage: Textauszeichnungssprachen (SGML/XML) Internationaler, weitgehend etablierter Standard (ISO, W3C) Ermöglicht einfache und komplexe Beschreibungen (Inhomogene Daten) Erlaubt feldorientierte und textorientierte Daten Grundsätzlich hierarchische Struktur aus Elementen (die Struktur kann über einen Text gelegt werden) Die Beschreibung der Daten kann vom Allgemeinen zum Detail verlaufen (und dabei auf jeder Stufe stehen bleiben) Ziel: Möglichst allgemeine Verwendbarkeit nicht software- oder nutzungsspezifisch Möglichst hohe Kompatibilität zu anderen Standards vor allem: TEI (Text Encoding Initiative); gemeinsames Ergebnis

5 kein neues Katalogisierungskonzept, sondern... Integration (= Abstraktion) möglichst vieler bestehender Katalogisierungskonzepte unter einer allgemeinen Perspektive zwangsläufige Weichheit der Definitionen MASTER - der Standard (allgemein II) Inhaltlich

6 MASTER - die Verwendung des Standards Schaffung neuer Katalogisate (in welcher Tradition auch immer) Retrokonversion alter (gedruckter) Katlogisate Fernziel: Erstellung eines allgemeinen Handschriftenkataloges Aber: keine zentrale Leitung und Organisation zwingend erforderlich Möglichkeit dezentraler Handschriftenkataloge (CEEC) Möglichkeit der späteren Integration verschiedener Kataloge

7 MASTER - der Standard (technisch) Es ist eine DTD (Document Type Definition) Eine DTD beschreibt die Struktur eines bestimmten Typs von Dokument (Hier: des Typs Handschriftenkatalogisat) Durch die formale Definition der Struktur können die Daten mit der DTD geprüft (validiert) werden Die in der DTD formal definierten Elemente werden außerhalb der DTD sprachlich erläutert Interpretationsspielraum bei der Anwendung Beispiel: Handschrifteninhalt - msContents The element is used to describe the intellectual content of a manuscript or manuscript part. It comprises either a series of informal prose paragraphs or a series of more structured elements, each of which provides a more detailed description of a single item contained within the manuscript. Beispiel: Beschreibungskopf - msHeading The element may simply hold a short summary title, `heading', or `tombstone' specifying a supplied title or heading applicable to the whole of a manuscript, or this may be complemented with other elements. Beispiel: "Buchschmuck-Detail" - decoNote Contains a note describing either a decorative component of a manuscript, or a fairly homogenous class of such components.

8 MASTER - der Standard (inhaltlich, Grobstruktur) Handschriftenbeschreibung / Katalogisat Bibliographische Angaben (Liste) Geschichte der Handschrift Inhalte der Handschrift Äußere Beschreibung Allgemeine Angaben zur Handschrift Identifikation der Handschrift Signatur, Bestand, alte Signaturen etc. Entstehung, Besitzgeschichte, Erwerbung etc. Einzelne Texte und Teile Beschreibstoff, Umfang, Zusammensetzung, Layout, Schriften/Hände, Buchschmuck, Einband, Zustand, Foliierung etc. Titel, Autor, Entstehungsort, Entstehungszeit etc. Einzelne Literaturangaben

9 MASTER - der Standard (inhaltlich, Verästelungen) Verästelungen und Verfeinerungen der Datenstruktur Weitere hierarchische Untergliederung der Elemente Beispiel: msContents - msItem - msItem - decoNote Elemente können Attribute haben Beispiel: Die Elemente enthalten Text, der weiter ausgezeichnet werden kann Beispiel: Auf fol. 24r eine 4-zeilige I-Initiale, Bischof Hildebald darstellend.

10 Die Verwendung von MASTER in CEEC: Strategien und Praxis

11 Verwendung von MASTER in CEEC (grundsätzlich) Der MASTER-Standard wird als Richtlinie verwandt alle anderen Teile des MASTER-Projektes spielen für CEEC keine Rolle Verwendung bedeutet Anlehnung, nicht vollständige Übernahme der DTD. Ziel: Abbildung der Konzepte der vorliegenden Kataloge in MASTER, soweit dies möglich ist Grundunterschiede: In CEEC wird kein neuer Katalog erstellt Keine kodikologische Arbeit, keine Integration der Informationen in einem neuen Katalog Problem: parallele Informationen verschiedener Kataloge, die sich nicht vollständig ersetzen Lösung: Erhaltung aller Kataloge und Verwaltung der Informationen über die Zuweisung von Autoritäten

12 Verwendung von MASTER in CEEC (praktische Vorgehensweise) Entwurf eines allgemeinen Modells in Anlehnung an MASTER Interpretation der MASTER-Dokumentation Überführen der Kataloge in die Datenstruktur (bzw. umgekehrt) dabei: Veränderungen unserer Interpretationen; neue Konzepte Reduktion des allgemeinen Modells (der DTD) auf die Realität unserer Daten Zweck: Kontrolle der Konsistenz der Daten In Zukunft ggf. Erweiterungen des Modells (der DTD) Einführung neuer Elemente, Attribute (z.B. Typologien) Veränderung der Regeln (welches Element ist wo erlaubt?)

13 MASTER & CEEC (praktische Probleme - I) Erweiterungen der MASTER-DTD Neue Elemente Andere Regeln Andere Namen / Konzepte Zusätzliche Verfeinerungen Attribute, Typologien, Normalisierte Angaben Effekte: Divergenz der DTDs (MASTER, CEEC) Offenes Ende der Datenaufbereitung

14 MASTER & CEEC (praktische Probleme - II) Trotz der Weichheit des Standards läßt er sich nicht immer zu 100% auf einen Katalogtext anwenden Problem: Integration der Kataloge in die Datenstruktur führt zu einer Desintegration der ursprünglichen Katalogtexte Lösung: Es wird teilweise eine parallele Textfassung angeboten

15 MASTER & CEEC (praktische Probleme - IIIa) Wie kommen die Kataloge in den Computer? Ausgangspunkt: Elektronische Fassung des Textes Verwendung eines angepaßten Editors (MASTER) Automatische Interpretation von Layout- und Textstrukturen als strukturelle und inhaltliche Informationen Nacharbeiten und Kontrollen Spätere Verfeinerungen (teils automatisch, teils von Hand)

16 MASTER & CEEC (praktische Probleme - IIIb) Automatische Interpretation von Layout- und Textstrukturen als strukturelle und inhaltliche Informationen 966 Sign.: Cod. 3. Origines: Opera selecta Pergament, 182 Bll., 24,2 x 18 cm 9. Jh. - fol. 1r-94r Homiliae XVI in Genesim; fol. 94v leer; fol. 95r-182v Homiliae XIII in Exodum - Cum dicit de salvatore et rogabant eum daemonia Explicit Liber Exodi Textausgabe: GCS 29. Origines Werke. Bd. 6, S Lit.: Jaffé/Wattenbach, S Schlüsselwort Sign.: Cod.: Cod. 3. ist die Signatur; Umformung zu: Cod. 3. Die letzte Zifferngruppe vor dem Seitenumbruch: Eine Seitenzahl Fett gedruckter Text nach der Signatur: Dies muß der Titel sein. Später werden alle Titel nach einem Doppelpunkt durchsucht, der den Titel noch in Autor und Titel differenziert. Umsetzung zu: Origines Opera selecta

17 MASTER & CEEC (praktische Probleme - IIIc) Automatische Interpretation von Layout- und Textstrukturen als strukturelle und inhaltliche Informationen 966 Sign.: Cod. 3. Origines: Opera selecta Pergament, 182 Bll., 24,2 x 18 cm 9. Jh. - fol. 1r-94r Homiliae XVI in Genesim; fol. 94v leer; fol. 95r-182v Homiliae XIII in Exodum - Cum dicit de salvatore et rogabant eum daemonia Explicit Liber Exodi Textausgabe: GCS 29. Origines Werke. Bd. 6, S Lit.: Jaffé/Wattenbach, S

18 MASTER & CEEC (praktische Probleme - IIIc)... Jaffé/Wattenbach, S. 2. Cod Origenes Opera selecta 9. Jh. Pergament 182 Bll. 24,2 x 18 cm Fol. 1r-94r Homiliae XVI in Genesim Fol. 94v leer Fol. 95r-182v Homiliae XIII in Exodum (Textausgabe: GCS 29. Origenes Werke. Bd. 6, S ) Cum dicit de salvatore et rogabant eum daemonia Explicit Liber Exodi