Die Verwendung in der DDB und im Archivportal-D EAD(DDB) in der Praxis Die Verwendung in der DDB und im Archivportal-D
Umsetzung Objektseiten Suchfilter Normdaten Verlinkung und Binärcontent Identifier Ingestprozess Ausblick
Objektseiten Unterschiedliche Anzeige je Verzeichnungsstufe Archivportal-D Objektseiten analog zur DDB
Hierarchien Nicht alle Stufen haben eine Objektansicht
Strukturierung der Beschreibungen durch Absätze wichtig: Absätze im Freitext in </lb> umwandeln
Suchfilter Zeit: ISO-8601 („YYYY-TT-MM“) Sprache: ISO 639-2 („ger“) Bereinigungsprozess in der DDB Sprache: ISO 639-2 („ger“) Medientyp: fixes Vokabular Sparte / Datenlieferant: aus der Registrierung befüllt Person / Ort / Stichwort: Indexbegriffe + Urheber/Provenienz und Archivalientyp Archivalientyp-Vokabular sollte normalisiert angegeben werden sinnvoll Einträge doppelt anzugeben
Verlinkung und Binärcontent Links zurück ins Findmittelsystem zu einem Viewer zum Findbuch Binärcontent Link zum „freistehenden“ Digitalisat Direkte Mitlieferung der Digitalisate - Angabe der relativen Pfade
Normdaten Personen-Seite GND Wikipedia GND: Zentrales Element zur Vernetzung der Inhalte Entitätenseiten als zusätzlicher Einstieg Anreicherung mit externen Inhalten Möglich Normdaten anzugeben für Indexbegriffe, Provenienz und Urheber Personen-Seite DDB First step: Connect German National Authority File with DDB system initially Persons, later Places GND has more than 10 million authority entries Persons, corporate bodies, geografic names, topics, ... Aligned to VIAF, German Wikipedia accessible as Linked Open Data 8
Stabile Identifier DDB interner Identifier baut auf IDs aus EAD(DDB) auf Zum Überschreiben alter Datensätze bei Neulieferungen Um Verlinkung zwischen Tektonik und Findbuch zu gewährleisten Zum Abgleich der Datenlieferung bei verschiedenen Lieferwegen Stabile Objektreferenz in myDDB Grundlage für Persistent Identifier Systeme
Anforderungen Nicht sprechende technische Identifikatoren Eindeutigkeit (Findbuch und Tektonik) innerhalb der Institution zentral (nicht nur innerhalb der Datei) Auch für Gliederungsstufen und Binärcontent Wird nicht erst beim Export erzeugt Stabilität bei Neulieferungen muss gewährleistet sein Muss auch bei einem Software-Umstieg stabil bleiben Im besten Falle beruhen auch die Links auf den Identifiern (Permalink-System)
Umsetzungsbeispiele LABW: aid: zusammengesetzt aus einem Archividentifier und der scope-id (eindeutige ID in scope für jeden Datensatz) Beispiel: 1-2951896 LAV: weltweit eindeutige Identifier (UUIDs/GUIDs) werden pro Verzeichnisebene vergeben Beispiel: 936DA01F-9ABD-4D9D-80C7-02AF85C822A8
Ingestprozess Datenlieferanten schicken Testdaten Kontrolle anhand des Schemas Laden in ein Testsystem (inhaltliche Kontrolle) Im Moment: Anpassungen vor dem Ingest von der Fachstelle Archiv zukünftig standardisiertes EAD(DDB) von zentraler Bedeutung Plan 2014: Fachstelle Archiv: Standardisierung der Export-Schnittstellen
Ausblick METS: Nutzen eines gemeinsamen Viewers Spezifischere Rechteauszeichnung je Digitalisat Persistent Identifier-Systeme: stabile Links in der DDB Rollen: spezifischere Auszeichnung der Personen Geo-Koordinaten: Kartenanwendungen OAI-PMH: Protocol for Metadata Harvesting
Valides EAD(DDB) Die Schemata
Valides EAD(DDB) Änderungen in EAD 1.1 Dokumentation Zweck der Schemata Schemata Normiertes Vokabular Mögliche Probleme bei der Validierung Anforderungen an die Exportschnittstellen
EAD(DDB) 1.1 Geringe Erweiterungen Einfachere Unterscheidung zwischen Findbuch und Tektonik Datei Angaben zum Archiv und zur Überorganisation besser getrennt Mehr Möglichkeiten zur Einbindung von Normdaten In der Format-Definition in Excel ausgezeichnet rot: Änderungen grün: Ergänzungen
http://www.landesarchiv-bw.de/ead (Version 1.1) Dokumentation Jeweils pro Tektonik und Findbuch-Datei Beschreibende Informationen in Word: erläuternde Informationen Dokumentation in Excel-Form Überblick über Struktur von EAD(DDB) und den Verpflichtungsgrad der Elemente Testdateien in einer minimalen und maximalen Ausprägung Schemata Verfügbar unter http://www.landesarchiv-bw.de/ead (Version 1.1)
Zweck der Schemata EAD 2002 ermöglicht eine sehr breite Verwendung aller Elemente Reduktion der Möglichkeiten Hilfestellung bei der Erstellung von Schnittstellen Kontrollfunktion beim Import Weiterlieferung an das Archivportal Europa mit einem Mapping ermöglichen
Schemata Unterscheidung zwischen Tektonik- und Findbuch-Schema Zwei Versionen: XSD 1.1 (Referenzversion) XSD 1.0 (für ältere XML-Software ungenauer) kein Zusammenhang mit EAD(DDB) 1.0! Kein dtd vorgesehen! Sehr eng gehalten, um Abweichungen möglichst schnell zu entdecken Basiert auf großem EAD: EAD(DDB) ist valide zu EAD EAD(DDB) 1.1 Validierung möglich mit dem DPT von APEx
Kontrollierte Vokabulare Bundesland (offizielle Bezeichnungen) Archivtyp (VDA-Fachgruppen) Medientyp (TEXT, BILD, AUDIO, VIDEO) Archivalientyp: normiertes Vokabular Datum: ISO-8601 ISIL: z.B.: DE-1951 @xlink:role: für Linktyp/Digitalisatstyp 21
Mögliche Validierungsprobleme 1 Richtigen Namespace verwenden ead-namespace muss ausgezeichnet sein! Die Reihenfolge der Elemente ist in vielen Abschnitten von EAD zentral bedingt durch das große EAD Schema Manche Elemente dürfen nicht ohne Unterelemente erzeugt werden Elemente und Attribute sollen nur dort erlaubt sein, wo dies vorgesehen ist Einfache Kontrolle, ob das Mapping richtig ist Elemente sollen je nach Definition im oder nicht im Gruppierungselement (<did>) verwendet werden
Mögliche Validierungsprobleme 2 Header / Angaben zum Archiv Keine c01-c12 Elemente sonder nur c-Elemente Es sollen keine Überschriften (<head>) ohne Inhalt (<p>) erzeugt werden Die IDs sollten der Ansetzung von XML-IDs entsprechen z.B.: dürfen nicht mit Namen anfangen, dürfen nicht leer sein Das normalisierte Datumsfeld sollte ISO-8601 konform sei, soweit dies gewährleistet werden kann
Anforderungen an die Schnittstellen Nichtvalides EAD sollte vom Nutzer nicht erzeugt werden können Basis EAD(DDB)-Export sollte ohne Konfiguration möglich sein
Notwendigkeiten Stabile Identifier sind zentral! Verknüpfung zwischen Findbuch und Tektonik muss gewährleistet sein! Links zurück ins Findbuchsystem und auf „freistehende“ Digitalisate sollen, so fern vorhanden, mitgeliefert werden
Vielen Dank für Ihre Aufmerksamkeit Fragen? Hinweise? Anregungen? Martin Reisacher Tel.: 0711/212-4298 Email: martin.reisacher@la-bw.de