Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Prozess der Archivierung von Digitalisaten im Göttinger Digitalisierungszentrum Markus Enders, SUB Göttingen

Ähnliche Präsentationen


Präsentation zum Thema: "Prozess der Archivierung von Digitalisaten im Göttinger Digitalisierungszentrum Markus Enders, SUB Göttingen"—  Präsentation transkript:

1 Prozess der Archivierung von Digitalisaten im Göttinger Digitalisierungszentrum Markus Enders, SUB Göttingen

2 Digitalisat Datei mit Meta- und Strukturdaten (entweder RDF/XML oder METS/XML) Allgemeiner Aufbau des Digitalisats: Imageordner (Imageset) (Präsentation) tif, tif etc. Sonstiges - (Pica-Download-Dateien, Konfig-Dateien) Volltexte (TEI/XML) (setzt METS/XML voraus) Imageordner (Imageset) (Master) tif, tif etc. wird nicht aus RDF/XML heraus referenziert

3 Digitalisat Modulares Workflow-Tool GOOBI verwaltet Workflow für Digitalisierung Produktion Modul für Langzeitarchiverung in Entwicklung als letzter Schritt des Digitalisierungsworkflows soll Mitarbeiter die Langzeitarchivierung anstoßen Langzeitarchiverung erfolgt nach erfolgreichen Import in das Repository LZA-System als Dark-Archive; eigenes DMS enthält Meta- und Strukturdaten sowie Präsentations-Version der Images

4 Asset Asset-Deskriptor METS/XML ohne Strukturdaten, mit DC-Metadaten Preservation-Metadaten technische Metadaten der Contentfiles Archivpaket des Digitalisats: Contentfiles Masterimages Präsentationsimages RDF/XML bzw. METS/XML Datei Volltext-Datei

5 Ingestprozeß angestoßen durch Hotfolder Ingestprozeß keine direkte Rückmeldung an Workflow-Tool, ob Ingest erfolgreich war schwierig zu implementieren, da Digitalisierungsmitarbeiter keine technische Kompetenz im Bereich Langzeitarchivierung besitzen.

6 Ingestprozeß Sammeln aller Contentfiles überflüssige Dateien (Pica-Downloads) werden nicht ins Asset aufgenommen; Prüfung d. Groß/Kleinschreibung Ingestprozeß Generierung der URN persistent Identifier Validierung der Contentfiles Validierung mittels JHOVE, ob Dateien auch standardkonform sind. Ggfs. automatische Korrektur der fehlerhaften Dateien Extraktion der technischen Metadaten die mittels JHOVE gewonnen techn. Metadaten werden in den Asset-Deskriptor aufgenommen

7 Ingestprozeß Archiv generieren ZIP oder TAR Archiv Ingestprozeß Test ob schon vorhanden XORed Checksumme aller Contentfiles-Checksummen DIAS ingest Abfrage, ob neues Asset unter URN vorhanden Extraktion der deskriptiven Metadaten inkl. Konvertierung aus Meta- und Strukturdaten Datei nach DublinCore simple Pica+ Record aus OPAC METS Builder inkl. UTF8 Kontrolle

8 Ingestprozeß Prozeß besteht aus vielen kleinen Schritten Ingestprozeß Jeder Schritt wird durch spezielle Software durchgeführt wäre sinnvoll, Information über Software (inkl. Version) zu speichern. Ggfs. ist manuelles eingreifen erforderlich Sollte dies dokumentiert werden? Wie kann dies dokumentiert werden?

9 Ingestprozeß Fehler nur in Log-Dateien zentrales Logging aller Schritte in Kolibri Logdatei Logging des DIAS Systems keine Rückmeldung an Nutzer des Workflow Systems Fehlerhandling

10 Disseminationprozeß Repository muß neu aufgebaut werden bspw. bei Totalverlust aller Daten auf Online-Systemen und Backups. Gründe für Dissemination: Master-Daten werden benötigt bspw. hochaufgelöste Images für Reprints Daten müssen "geupdated" werden Fehlerkorrektur: Fehler in Metadaten, fehlerhafte oder fehlende Images (Änderung von Contentfiles) Datenupdates wird der häufigste Grund sein, auf das Archivsystem zuzugreifen...

11 Disseminationprozeß externes Updaten von Daten muß bei Versionierung berücksichtigt werden bedeutet für Dissemination: interne ID der Version sowie URN muß im Dissemination-Asset enthalten sein. Versionierung: Nach Aufarbeitung werden Daten zum Ingest gegeben modifizierter Ingestprozeß notwendig, da bspw. keine URN generiert/geholt wird Workflowtool benötigt nur die Contentfiles innerhalb des Korrkturworkflows müssen Daten aus dem Archivsystem erhalten bleiben

12 Disseminationprozeß Workflowtool muß Änderungen dokumentieren Dokumentation muß von Ingestprozeß interpretierbar sein, um in Asset-Deskriptor integriert werden zu können Versionierung: Prinzipielle Frage: Wer muß dies dokumentieren? Wie detailliert? Gibt es geeignete Masken für Anwender im Workflowtool? Änderungen werden in Modulen durchgeführt; Module haben keinen direkten Kontakt untereinander; jedoch muß das Archivmodul wissen, was im Meta- und Strukturdatenmodul geändert wurde... Derzeit angedacht ist lediglich eine Klassifizierung: Metadaten geändert, Image geändert, Image hinzugefügt...

13 Metadaten Ingestprozeß Dokumentation der Validierungs- und Korrekturschritte werden derzeit nicht erfasst Preservationmetadaten im Workflow: Digitalisierungsprozeß Dokumentation der Scanschritte (welche Hardware/Software?), Dokumentation der Metadatenerfassung (welche Person?, woher übernommen? mit welchem Tool?) derzeit nur in Workflowdatenbank; nicht in Preservation MD Dissemination/Ingestprozeß Versionierungsinformation werden derzeit nicht erfasst

14 Metadaten Preservationmetadaten im Workflow: Repositoryinformationen Beschreibung der Umgebung, welches ein komplexes Content-Package präsentieren kann derzeit nicht erfasst


Herunterladen ppt "Prozess der Archivierung von Digitalisaten im Göttinger Digitalisierungszentrum Markus Enders, SUB Göttingen"

Ähnliche Präsentationen


Google-Anzeigen