SIP-Val & SIPBrowser 4. Erfa-Anlass Staatsarchiv Bern, 14. Juni 2011.

Slides:



Advertisements
Ähnliche Präsentationen
Mu - Linux.
Advertisements

6. Termin Teil A: Mischlogik, Dateien, Betriebssysteme
Fragedateien für „Wer wird Millionär“ selbst erstellen
Pflege der Internetdienste
PowerPoint-Makros für DScript
Parser generieren Yet Another Compiler – Compiler YACC.
HTML - Einführung Richard Göbel.
Dateihandles Um in Perl eine bestimmte Datei zum Lesen, Schreiben oder Anhängen zu öffnen, benötigt man so genannte Dateihandles. Ein Dateihandle ist der.
AGXIS – Ein Konzept für eine generische Schnittstellenbeschreibung Dr.-Ing. Ulrich Hussels, RISA GmbH 07. Juni 2005 Workshop Umweltdatenbanken 2005.
HTML - Eine erste Annäherung
XML-Parser Manuel Röllinghoff.
I. SEITENAUFRUF II. ANMELDUNG / LOGIN Anmeldename = Matrikelnummer (z.B ) Passwort = Vorname_Nachname (z.B. Max_Meier oder Hans-Jörg_von Hannover)
Praxis-Repetitorium JAVA zusätzliche, ergänzende Lehrveranstaltung
Rigi und Web2Rsf vorgestellt von Tobias Weigand. Inhalt Ziel von Web2Rsf und Rigi Vorstellung des Parsers Web2Rsf Vorstellung des Werkzeugs Rigi Analyse.
OC-Pro ermöglicht, ohne Installation zusätzlicher Software, die benutzerfreundliche Kalkulation von Netzhautdicke und Flächen intra-/subretinaler Flüssigkeitsansammlungen.
Batch-Programmierung Grundlagen
DVG Kommentare1 Kommentare. DVG Kommentare 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht.
DVG Kommentare 1 Kommentare. 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht bis zum Ende der Zeile.
Wismar Business School
DFG-Projekt Ausbau des Netzwerks SED-Archivgut zu einer Referenzanwendung für ein Archivportal Deutschland Präsentation des ersten Prototypen Erfurt, 16.
TUTOS zum managen von Projekten und Terminen TUTOS.
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
Welche Funktion hat die php.ini? -Beinhaltet wichtige Einstellungen für PHP. Genannt seien hier u.a. der Speicherort von Cookies, Parameter der Kompilierung,
Einleitung Suse Linux (System- und Software-Entwicklung) Allgemein:
Synergieeffekte durch softwaregestützte Prozessmodelle
MS Excel, Open-/LibreOffice Calc Die Menüs I Office-Logo (Excel2007) bzw. Datei (andere): die Standard-Datei- und Druckoperationen; bei MS Excel hier auch.
G.Meininghaus, Konstanz1 Bilder / Fotos per verschicken.
Sicherer Zugang zu internen Terminalservern von öffentlichen PCs
University of Applied Sciences Übung Objektorientierte Programmierung II Dipl.-Inf. (FH) Markus Vogler.
Was ist Orthofix® und wobei wird es angewandt?
Was ist ein Betriebssystem?
PDF-Datei erstellen Wir wollen nicht auf Papier drucken, sondern in eine PDF-Datei. (Portable Document Format) Wir öffnen das heruntergeladene Dokument.
Online-Systematiken im Netz
TWS/Graph HORIZONT Produkt-Präsentation Software für Rechenzentren
EasyDiet Team C Team C1. Das Team Projektdetails Systemvoraussetzungen Funktionsüberblick Showcase Team C2 Agenda.
Test-Checker: Lehrer Version Manual Programm von Martin Schügerl.
Warum brauche ich ein CMS – Content Management System?
Kostenlose Alternative zu Microsoft Office
Präsentation von Sonja Pathe
Manfred Lindert, Marketing-Kommunikation,
Copyright 2011 Bernd Brügge, Christian Herzog Grundlagen der Programmierung TUM Wintersemester 2011/12 Kapitel 11, Folie 1 2 Dr. Christian Herzog Technische.
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Ganzheitliches Projekt-, Ressourcen- und Qualitätsmanagement 1 Reports und AddOns Auf den folgenden Seiten wird Ihnen die Funktionsweise der Reports und.
Einführung in 2 Betriebssysteme
Kapitel A: Auswahl (Graf, Steinke, Huth) *A2 Definition: Das digitale Langzeitarchiv und der Produzent müssen die wesentlichen Eigenschaften (significant.
Hilfe Dokumente.
Vortrag: Visual Basic Neuerungen Autor : Dennis Hoyer
Archivierung von Digitalisaten
Kommandozeile und Batch-Dateien Molekulare Phylogenetik – Praktikum
XJustiz XJustiz_XML XJustiz_Schema Fachmodul Wertelisten
Backup der FTP-Daten mit BYSU (Back Your Space Up von George Ruinelli) Eine mögliche Variante, um FTP- Daten bei dem Provider „All-Inkl“ zu sichern.
12. September 2007Autor: Walter Leuenberger Computeria Urdorf Treff vom 12. September 2007 Print Lösungen II Zwei interessante «Helferlein»
Dokumente meistern Dokumente anlegen Dokumente speichern
AUDIO im WEB HTML & AUDIO WEB_0302 WEBDESIGN MODUL 03 h.huetter 1 Sound-Dateien können, ebenso wie Video-Dateien, auf mehrere Arten in HTML-Dateien integriert.
Abschlussprojekt.  Wahl eines beliebigen Themas (z.b. Hobby)  eigenständige Ausarbeitung des gewählten Themas in Form einer Website Abschlussprojekt.
WINDOWS 2003 Server. Standart Varianten für 32 Bit: Web Edition: Unterstützt Single(1)- oder Dual(2)-Prozessor-Systeme und bis zu 2 GB RAM 32-Bit Standard.
Greenstone. Theoretischer Teil Entstehung: Entwickelt vom New Zealand Digital Library Project an der Universität von Waikato Kooperation mit der UNESCO.
Releasworkshop 1.80 Installation & Administration Siegen 1. Juli 2009.
E-Archiv Durch die Präsentation führt sie: Jack Kraus ScanView ist ein Produkt der Allgeier IT GmbH (Feb 2010)
Installationsanleitung Kumpan-electric_Controller Software und Treiber
csv2siard Version 1.7 csv2siard erlaubt die Konvertierung von CSV-Datei Sammlungen in eine SIARD-Datei. Die Vorteile einer solchen Konvertierung: 1.einzelne.
Sinn und Zweck der Formaterkennung und deren Grenzen
SAP – Installation auf Windows Server 2008 R2 Enterprise
Formaterkennung: FIDO
Formaterkennung: DROID
General Download Finder
Formatvalidierung: KOST-Val
für das Herunterladen von Filmen
Abschlusspräsentation Bern,
 Präsentation transkript:

SIP-Val & SIPBrowser 4. Erfa-Anlass Staatsarchiv Bern, 14. Juni 2011

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 2 KOST Agenda 1.Begrüssung 2.Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 3.Einführung in SIP-Val 4.Einführung in SIPBrowser 5.Fragen und Anregungen zu den KOST.tools

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 3 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val SIP-Val liest ein SIP und validiert die folgenden Punkte aus der SIP-Spez des BAR v1.0 (MUSS): 1.Paket- und XML- Konsistenz 2.Datei-Konsistenz 3.Dateiformat- und Datums-Konsistenz SchrittBezeichnung (Stepname) 1aLesbarkeit 1bprimäre Verzeichnisstruktur 1cVerzeichnis- und Dateinamen 1dSchemavalidierung metadata.xml 1eSIP-Typ ermitteln 1fPrimärdateien im Verzeichnis 2aFehlende Primärdateien 2bPrüfsummen-Validierung 2cZusätzliche Primärdateien 2dVerzeichnung GEVER-Primärdateien 3aFormaterkennung 3bZusätzliche Formate 3cFormatvalidierung 3dZeitraum-Validierung

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 4 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val Das Gesamtergebnis der Validierung wird ebenfalls ausgegeben und im exit-Status des Programms sichtbar. 0 alles OK 1 fehlerhafte Angaben 2 Validierung nicht bestanden cmd: ECHO return code %errorlevel%

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 5 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 1aKann das SIP fehlerfrei geöffnet werden? Implementierte Container-Formate: - Ordner - ZIP & ZIP64  [A_2.6-2] Die Dateien dürfen nicht passwortgeschützt sein  [T_6.1-1] Alle Containerformate sind für den Transfer erlaubt, müssen jedoch vorgängig mit dem Archiv vereinbart werden.  Weitere Containerformate sind vorderhand nicht geplant und müssen vorgängig manuell entpackt werden

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 6 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 1bBesteht eine korrekte primäre Verzeichnisstruktur? ∙ [SIP]/header/metadata.xml + [SIP]/content ∙ [SIP].zip/header/metadata.xml + [SIP].zip/content ∙ [SIP].zip/[SIP]/header/metadata.xml + [SIP].zip/[SIP]/content  Die Spez erlaubt das Wiederholen des Toplevel-Ordners in einer ZIP-Datei. [SIP] muss jedoch immer gleich sein (Variante 3).

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 7 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 1cEntsprechen die Verzeichnis- und Dateinamen den Einschränkungen in der Spezifikation? - Zeichensatz (A-Z a-z 0-9 ! # $ % ( ) +, - _. [ ] { } ~ SPACE) - SIP-Name (SIP_[1-2][0-9]{3}[0-1][0-9][0-3][0-9]_\\w{3}) - Secondlevel-Ordner - Header-Ordner - XSD-Ordner - Pfadlänge - Länge der Ordner & Dateien  Bei den Längen zählt auch der Toplevel-Ordner. Dieser ist im SIP-Val immer ein.zip. Dies bedeutet teilweise 4 zusätzliche Zeichen.

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 8 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 1dEntspricht metadata.xml den Schemadateien in /header/xsd?  Das Schema arelda_v xsd hat im Bereich von Pruefalgorithmus und Pruefsumme (Zeile 924 und 925) einen Fehler. Diese Elemente sind gemäss der SIP-Spezifikation v1 obligatorisch und sollten entsprechend den Eintrag minOccurs=“1“ enthalten. Dieser Fehler wird durch das BAR behoben werden. Bis dahin beanstandet SIP-Val das Fehlen dieser beiden Elemente nicht.

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 9 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 1eWelcher SIP-Typ liegt vor? (metadata.xml ->ablieferungstyp) - GEVER - FILE 1fSind Primärdateien im /content vorhanden? - GEVER-SIP: nicht obligatorisch (Archivierung einer Ordnerstruktur) - FILE-SIP: obligatorisch  [M_4.2-2] Zwei Ablieferungstypen: GEVER oder FILES  SIP-Val überprüft nicht die zusätzlichen Vorgaben zum Sub- Ablieferungstyp ″FILES SIP mit integrierter Dokumentation″. Dies ist nicht einfach zu realisieren, da dieser Typ in metadata.xml nicht klar ersichtlich ist.

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 10 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 2aSind alle in metadata.xml paket/inhaltsverzeichnis referenzierten Dateien vorhanden? 2bStimmen die Prüfsummen überein? 2cSind zusätzliche Primärdateien im SIP vorhanden, welche nicht in metadata.xml verzeichnet sind?  2a kontrolliert in der Version nur, ob alle Dateien im SIP und nicht in Bezug auf den Ordner vorhanden sind.  SIP-Val kann aktuell nur MD5-Prüfsummen überprüfen, noch nicht die weiteren Prüfalgorithmen SHA1 und SHA256, welche gemäss der SIP-Spez v1 erlaubt sind.  SIP-Val überprüft nur auf zusätzliche Primärdateien und nicht auf zusätzliche Primärordner.

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 11 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 2dSind bei GEVER-SIP alle in (metadata.xml) /paket/inhaltsverzeichnis/content referenzierten Dateien auch in (metadata.xml) /paket/ablieferung/ordnungsystem verzeichnet? /content 2a 2c 2d /inhaltsverzeichnis /ordnungsystem  Das Gegenteil von 2d wird nicht überprüft, da diese Dateien kassiert wurden.

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 12 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 3aStimmen die erkannten Formate mit den erlaubten Formaten überein? 3bAlle Dateien in nicht erlaubten Formaten (gemäss 3a) mit entsprechenden Formatangaben auflisten  Die Formaterkennung erfolgt mit DROID und PRONOM.  Vorsicht: Die Erkennung von PDF/A ist bei DROID fehlerhaft. PDF/A (fmt/95) rangiert bei der Erkennung korrekt vor PDF 1.4 (fmt/18), sollte aber auch vor PDF rangieren (fmt/19, fmt/20, fmt/276). Entsprechend muss auch das Element angepasst werden.  Diese Angaben sind in der DROID_SignatureFile enthalten und in der Version V49-kc durch die KOST angepasst.

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 13 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 3cSind die enthaltenen Formate auch valid? - JHOVE-> TIFF, JPEG2000, WAVE - PDFTRON -> PDF/A  Die Formatvalidierung für TIFF, JPEG2000 und WAVE erfolgt mit JHOVE. JHOVE ist ein Opensource-Programm und erkennt nicht alle Fehler.  Für die Validierung von PDF/A (fmt/95) sollte ein spezielles Programm verwendet werden. Wir haben den PDF/A-Manager von PDFTron implementiert. Die Trialversion ermöglicht einen sehr guten Einblick in dessen Funktionalitäten. Die Vollversion kostet 699$.  JHOVE und PDF-Well-formed: A PDF file is well-formed if it meets the criteria defined in Chapter 3 of the PDF Reference 1.6 (5th edition, 2004)

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 14 KOST Die SIP-Spezifikation des BAR und ihre Umsetzung in SIP-Val 3dStimmen die verschiedenen Entstehungszeiträume überein? - Ablieferung [von bis] - Dossier bis von - Dokument [von ---- bis]  Verletzt ein Element mindestens eines der nachfolgenden Kriterien, wird es (und der Zeitraums-Validierungsschritt) als invalid eingestuft:  „Bis“ muss grösser oder gleich als „Von“ sein, und keines der beiden darf in der Zukunft liegen.  Die Zeitangaben eines Elements müssen innerhalb des Entstehungszeitraums des übergeordneten Elements liegen. heute

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 15 KOST Zusammenfassung SIP-Val Konsolenausgabe: Validierungsschritte (mit Bezeichnung wenn invalid) Ergebnisse valid oder invalid Gesamtergebnis Pfade (SIP und Log-Datei) Weitere Informationen, insbesondere die Fehlermeldungen, werden in die Log-Datei geschrieben.

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 16 KOST Installation SIP-Val & Systemvoraussetzungen Installation: Extrahieren von SIP-Val.zip Erstellen der Logverzeichnisse Extrahieren von jhove-1_5.zip, pdfa.zip, (jre6.zip) Systemvoraussetzungen Microsoft Windows 98, ME, NT, 2000, XP, VISTA oder Windows 7 Mindestens 128 MB RAM (512 MB oder mehr empfohlen) Mindestens 20 GB Festplattenspeicher Java Runtime Environment (JRE) Version 6 oder neuer cmd: java -version

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 17 KOST Konfiguration von SIP-Val Sipvalidator.conf.xml möglicherweise anpassen xml-TagBeschreibung Erlaubte maximale Anzahl Zeichen in Pfadlängen Erlaubte maximale Anzahl Zeichen in Dateinamen Vorgaben zum Aufbau des SIP-Namens Pfadangabe zu PDFTRON Pfadangabe zum Outputverzeichnis von PDFTRON Pfadangabe zu JHOVE Pfadangabe zur Konfigurationsdatei von JHOVE Pfadangabe zum Outputverzeichnis von JHOVE Pfadangabe zum temporären Arbeitsverzeichnis des SIP-Validators Pfadangabe zur verwendeten DROID-Signaturdatei Auflistung der erlaubten xsd-Dateien bestehend aus Untertags mit Detailinformationen Auflistung der erlaubten Dateiformate bestehend aus Untertags mit Detailinformationen Auflistung der zu validierenden Dateiformate mit JHOVE oder PDFTRON

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 18 KOST cmd_Script-Example '_Start.cmd' Validiert alle vorhandenen SIPs, welche sich im Ordner "Workshop_SIP-Val\SIPS" befinden '_Start_+3c_+3d.cmd' Wie '_Start.cmd', aber mit zusätzlicher Formatvalidierung (3c) und Zeitraumvalidierung (3d) 'manuelle_Eingabe.cmd' Vereinfachter Aufruf für die manuelle Eingabe 'neues_logs_verzeichnis.cmd' Legt neue Log-Verzeichnisse "logs", "logs\pdftron" und "logs\jhove" an

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 19 KOST SIPBrowser

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 20 KOST SIPBrowser: Programm starten

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 21 KOST SIPBrowser: Metadaten browsen

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 22 KOST SIPBrowser: Unterlagen einsehen

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 23 KOST Fragen und Anregungen zu den KOST.tools

Präsentation SIP-Val & SIPBrowser Martin Kaiser, Claire Röthlisberger 24 KOST KOST.tools SIP-Val Offene Punkte: Ausdeutschen der Logausgabe im Bezug auf die PUID (3a – 3c) Prüfsummenvalidierung (2b) mit SHA1 und SHA256 ergänzen Zusätzliche Primärdateien (2a) inkl. korrekten Ordner Fortschrittsanzeige oder "Windrad", damit man sieht, dass das Programm noch läuft und nicht abgestürzt ist SIPBrowser