Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Archivierung von Digitalisaten

Ähnliche Präsentationen


Präsentation zum Thema: "Archivierung von Digitalisaten"—  Präsentation transkript:

1 Archivierung von Digitalisaten
Prozess der Archivierung von Digitalisaten im Göttinger Digitalisierungszentrum Markus Enders, SUB Göttingen

2 Digitalisat Allgemeiner Aufbau des Digitalisats:
Datei mit Meta- und Strukturdaten (entweder RDF/XML oder METS/XML) Imageordner (Imageset) (Präsentation) tif, tif etc. Imageordner (Imageset) (Master) tif, tif etc. wird nicht aus RDF/XML heraus referenziert Sonstiges - (Pica-Download-Dateien, Konfig-Dateien) Volltexte (TEI/XML) (setzt METS/XML voraus)

3 Digitalisat Produktion Modulares Workflow-Tool GOOBI
verwaltet Workflow für Digitalisierung Modul für Langzeitarchiverung in Entwicklung als letzter Schritt des Digitalisierungsworkflows soll Mitarbeiter die Langzeitarchivierung anstoßen Langzeitarchiverung erfolgt nach erfolgreichen Import in das Repository LZA-System als Dark-Archive; eigenes DMS enthält Meta- und Strukturdaten sowie Präsentations-Version der Images

4 Asset Archivpaket des Digitalisats: Asset-Deskriptor
METS/XML ohne Strukturdaten, mit DC-Metadaten Preservation-Metadaten technische Metadaten der Contentfiles Contentfiles Masterimages Präsentationsimages RDF/XML bzw. METS/XML Datei Volltext-Datei

5 Ingestprozeß Ingestprozeß angestoßen durch Hotfolder
keine direkte Rückmeldung an Workflow-Tool, ob Ingest erfolgreich war schwierig zu implementieren, da Digitalisierungsmitarbeiter keine technische Kompetenz im Bereich Langzeitarchivierung besitzen.

6 Ingestprozeß Ingestprozeß Sammeln aller Contentfiles
überflüssige Dateien (Pica-Downloads) werden nicht ins Asset aufgenommen; Prüfung d. Groß/Kleinschreibung Validierung der Contentfiles Validierung mittels JHOVE, ob Dateien auch standardkonform sind. Ggfs. automatische Korrektur der fehlerhaften Dateien Generierung der URN persistent Identifier Extraktion der technischen Metadaten die mittels JHOVE gewonnen techn. Metadaten werden in den Asset-Deskriptor aufgenommen

7 Ingestprozeß Ingestprozeß Extraktion der deskriptiven Metadaten
inkl. Konvertierung aus Meta- und Strukturdaten Datei nach DublinCore simple Pica+ Record aus OPAC METS Builder inkl. UTF8 Kontrolle Archiv generieren ZIP oder TAR Archiv Test ob schon vorhanden XORed Checksumme aller Contentfiles-Checksummen DIAS ingest Abfrage, ob neues Asset unter URN vorhanden

8 Ingestprozeß Ingestprozeß Prozeß besteht aus vielen kleinen Schritten
Jeder Schritt wird durch spezielle Software durchgeführt  wäre sinnvoll, Information über Software (inkl. Version) zu speichern. Ggfs. ist manuelles eingreifen erforderlich Sollte dies dokumentiert werden? Wie kann dies dokumentiert werden?

9 Ingestprozeß Fehlerhandling Fehler nur in Log-Dateien
zentrales Logging aller Schritte in Kolibri Logdatei Logging des DIAS Systems  keine Rückmeldung an Nutzer des Workflow Systems

10 Disseminationprozeß Gründe für Dissemination:
Repository muß neu aufgebaut werden bspw. bei Totalverlust aller Daten auf Online-Systemen und Backups. Master-Daten werden benötigt bspw. hochaufgelöste Images für Reprints Daten müssen "geupdated" werden Fehlerkorrektur: Fehler in Metadaten, fehlerhafte oder fehlende Images (Änderung von Contentfiles) Datenupdates wird der häufigste Grund sein, auf das Archivsystem zuzugreifen...

11 Disseminationprozeß Versionierung:
externes Updaten von Daten muß bei Versionierung berücksichtigt werden bedeutet für Dissemination: interne ID der Version sowie URN muß im Dissemination-Asset enthalten sein. Nach Aufarbeitung werden Daten zum Ingest gegeben modifizierter Ingestprozeß notwendig, da bspw. keine URN generiert/geholt wird innerhalb des Korrkturworkflows müssen Daten aus dem Archivsystem erhalten bleiben Workflowtool benötigt nur die Contentfiles

12 Disseminationprozeß Versionierung:
Workflowtool muß Änderungen dokumentieren Dokumentation muß von Ingestprozeß interpretierbar sein, um in Asset-Deskriptor integriert werden zu können Prinzipielle Frage: Wer muß dies dokumentieren? Wie detailliert? Gibt es geeignete Masken für Anwender im Workflowtool? Änderungen werden in Modulen durchgeführt; Module haben keinen direkten Kontakt untereinander; jedoch muß das Archivmodul wissen, was im Meta- und Strukturdatenmodul geändert wurde... Derzeit angedacht ist lediglich eine Klassifizierung: Metadaten geändert, Image geändert, Image hinzugefügt...

13 Metadaten Preservationmetadaten im Workflow: Digitalisierungsprozeß
Dokumentation der Scanschritte (welche Hardware/Software?), Dokumentation der Metadatenerfassung (welche Person?, woher übernommen? mit welchem Tool?) derzeit nur in Workflowdatenbank; nicht in Preservation MD Ingestprozeß Dokumentation der Validierungs- und Korrekturschritte werden derzeit nicht erfasst Dissemination/Ingestprozeß Versionierungsinformation werden derzeit nicht erfasst

14 Metadaten Preservationmetadaten im Workflow: Repositoryinformationen
Beschreibung der Umgebung, welches ein komplexes Content-Package präsentieren kann derzeit nicht erfasst


Herunterladen ppt "Archivierung von Digitalisaten"

Ähnliche Präsentationen


Google-Anzeigen