A6)..." - Oder alternativ: A6 hier vorziehen, da sowohl A4 als auch A5 darauf verweisen.] -- gbuechlergbuechler -verschiedenen Metadatenarten und ihren Sinn zu erläutern. - B3 könnte man auch hier reinziehen. -- jludwigjludwig"> A6)..." - Oder alternativ: A6 hier vorziehen, da sowohl A4 als auch A5 darauf verweisen.] -- gbuechlergbuechler -verschiedenen Metadatenarten und ihren Sinn zu erläutern. - B3 könnte man auch hier reinziehen. -- jludwigjludwig">

Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Kapitel A: Auswahl (Graf, Steinke, Huth) *A2 Definition: Das digitale Langzeitarchiv und der Produzent müssen die wesentlichen Eigenschaften des primären.

Ähnliche Präsentationen


Präsentation zum Thema: "Kapitel A: Auswahl (Graf, Steinke, Huth) *A2 Definition: Das digitale Langzeitarchiv und der Produzent müssen die wesentlichen Eigenschaften des primären."—  Präsentation transkript:

1 Kapitel A: Auswahl (Graf, Steinke, Huth) *A2 Definition: Das digitale Langzeitarchiv und der Produzent müssen die wesentlichen Eigenschaften des primären Informationsobjekts definieren. Ausführung: Information und Erscheinungsbild hängen eng miteinander zusammen. Bei vielen Informationsobjekten sind Darstellungsform, Struktur und Information untrennbar. Bei Tabellen muss beispielsweise die Ordnung der Zeilen und Spalten erhalten bleiben. Bei Landkarten sind Farbnuancen Informationen. Das Archiv muss definieren, welche Eigenschaften Teil der dauerhaften Information sind und welche Eigenschaften nicht. - englische Begriffe verwenden? Content, Context, Structure (gemäss ICA), zusätzlich allenfalls noch Appearance, Behaviour (gemäss Digital Preservation Testbed). -- gbuechler 2008-03-11 10:05:01]gbuechler - zwischen Eigenschaften (d.h. alle Eigenschaften) und signifikanten Eigenschaften (d,.h. das, was auch nach einer Migration noch erhalten sein soll) unterscheiden. Signifikante Eigenschaften wären dann eine Teilmenge von Eigenschaften. - Der Text zur Ausführung müsste auf das Problem der Migration verweisen. ckeitel, 2008-03-17]

2 Kapitel A: Auswahl (Graf, Steinke, Huth) A3 Definition: Das digitale Langzeitarchiv und der Produzent müssen ausgehend von A1 und A2 die Datenobjekte identifizieren, welche die primären Informationsobjekte repräsentieren. Ausführung: Informationsobjekte können durch eine bis zu x Dateien repräsentiert werden. Für den dauerhaften Erhalt des Informationsobjekts mitsamt seinen wesentlichen Eigenschaften ist es notwendig, dass alle zur Darstellung des Informationsobjektes notwendigen Dateien an das digitale Langzeitarchiv übermittelt werden. [...] - eine oder mehrere Dateien -- gbuechler 2008-03-11 10:05:01]gbuechler - [in einer Datei können auch mehrere Informationsobjekte enthalten sein -- jludwig 2008-03-25]jludwig

3 Kapitel A: Auswahl (Graf, Steinke, Huth) * A4 Definition: Das digitale Langzeitarchiv und der Produzent müssen definieren, welche Metadaten zu den primären Informationsobjekten benötigt werden. Ausführung: Zur langfristigen, authentischen Darstellung der primären Informationsobjekte sind Informationen zu den in A6 notwendigen technischen Mitteln und den strukturellen Zusammenhängen der Dateien des Datenobjektes notwendig. Informationen zur Beschreibung des semantischen Inhalts und Kontextes des Informationsobjektes kommen hinzu. - lieber eine Formulierung wie "...zu den notwendigen technischen Mitteln (- -> A6)..." - Oder alternativ: A6 hier vorziehen, da sowohl A4 als auch A5 darauf verweisen.] -- gbuechlergbuechler -verschiedenen Metadatenarten und ihren Sinn zu erläutern. - B3 könnte man auch hier reinziehen. -- jludwigjludwig

4 * A5 Definition: Das digitale Langzeitarchiv und der Produzent müssen sich darüber einigen, von wem die benötigten Metadaten bereit gestellt werden. Ausführung: Nicht alle unter A4 identifizierten notwendigen Informationen [hier und im folgenden würde ich von "Metadaten" statt von "Informationen" sprechen, S.Graf], müssen vom Produzenten bereitgestellt und somit an das digitale Langzeitarchiv übermittelt werden. Die Beschreibung der in A6 definierten technischen Mittel ist eine Information, die sinnvoller Weise vom Archiv bereitgestellt werden sollte. Zu diesem Zweck sollte eine Liste (Musterliste vielleicht in der AG entwickeln und in den Anhang des Leitfadens einfügen) sowohl der verfügbaren als auch der noch zu erzeugenden Informationen und Daten erstellt werden. - Musterliste? Bitte nicht noch ein Metadatenkatalog!! -- gbuechler gbuechler - Metadaten statt Informationen (Frau Graf) Kapitel A: Auswahl (Graf, Steinke, Huth)

5 * A6 Definition: Das digitale Langzeitarchiv und der Produzent müssen ausgehend von A3 die zur Archivierung der primären Informationsobjekte nötigen technischen Mittel (technische Umgebung) identifizieren und ermitteln, ob die Anwendung der definierten technischen Mittel im Bereich der Möglichkeiten des Archivs liegt. - "ihrer Möglichkeiten liegen", S.Graf Ausführung: Dateien alleine stellen noch keine für den Menschen les- und interpretierbaren Informationsobjekte dar. Sie enthalten codierte Informationen, die von der passenden Hardware/Software-Umgebung korrekt interpretiert und dargestellt werden müssen. Die zur Darstellung notwendigen technischen Mittel können für bestimmte Informationsobjekte sehr aufwendig sein. Dies kann sich auf die Kosten zur Anschaffung der notwendigen technischen Mittel, die Aufrechterhaltung des technischen Betriebs und die zeitlich begrenzte Verfügbarkeit der technischen Mittel beziehen. Sollte das digitale Langzeitarchiv langfristig keine Möglichkeit sehen, die Darstellung der Informationsobjekte in der in A5 definierten Form zu garantieren, müssen Archiv und Produzent über Alternativen bei den Formaten der Datenobjekte verhandeln, siehe A7. -Immer Digitales Langzeitarchiv und Produzent S. Graf -Anforderung auf Metadaten zu den Informationsobjekten ausweiten. Büchler Kapitel A: Auswahl (Graf, Steinke, Huth)

6 *A7 Definition: Wenn die Datenobjekte in der vorliegenden Form nicht archiviert werden können, müssen sie entsprechend ergänzt oder verändert werden (beispielsweise durch Migration). Das digitale Langzeitarchiv und der Produzent müssen ausgehend von A1, A2 und A3 Datenobjekte identifizieren, welche die primären Informationsobjekte repräsentieren. -[Wurde das nicht schon in A3 erledigt? -- gbuechler 2008-03-10 15:40:26 ]gbuechler Diese Datenobjekte müssen in ein Format migriert werden, welches dem Langzeitarchiv im Sinne von A6 eine langfristige Darstellung der Informationsobjekte mit den im Archiv möglichen technischen Mitteln erlaubt. Das digitale Langzeitarchiv und der Produzent müssen unter Berücksichtigung von A2 Vereinbarungen treffen, in welches Zielformat (ggf. Zielformate) die in A3 definierten Datenobjekt migriert werden sollen. Das digitale Langzeitarchiv und der Produzent müssen sich darüber einigen, wer die Migration technisch durchführt, welche technischen Hilfsmittel verwandt werden und wer die Kosten trägt. - Müssen wir allenfalls auch die Emulation erwähnen? Ich bin da allerdings skeptisch. -- gbuechlergbuechler

7 Kapitel B: Verpackung (Ludwig) Archiv und Produzent müssen sich für die Daten, die die zu archivierenden Informationsobjekte darstellen, auf ein angemessenes Paketformat für die Übertragung einigen. Mit einem solchen Paketformat wird beschrieben, was für Datenobjekte und Metadaten als eine Einheit übermittelt werden und in welcher Beziehung die einzelnen Bestandteile zueinander stehen. Ein Beispiel für die Archivierung von Webseiten könnte sein, dass alle Dateien und Metadaten einer Webseite in einer komprimierten ZIP-Datei mit einer XML-Datei, die die Inhalte beschreibt, gebündelt übermittelt werden. Wichtig ist die Festlegung des Paketformats, weil Archiv und Produzenten sehr wahrscheinlich intern nicht auf die gleiche Art Datenobjekte verwalten. Für den Transfer wird deshalb eine gemeinsame Definition dessen benötigt, was eine einzelne Einheit darstellt, die transferiert wird. Häufig haben (LZA-)Archive schon Vorgaben bezüglich des Paketformats. Im strikten Sinne müssen die Daten und Metadaten nicht in einem Paket (SIP im Sinne des OAIS) enthalten sein, sondern nur von diesem referenziert und dadurch verfügbar sein. - Muss ein Paket zwingend durch einen Transferprozess übertragen werden - Muss dass Paket eine physische Einheit bilden? (Keitel)

8 B1: Das Verhältnis zwischen einem Informationsobjekt und einem Paket bzw. mehreren Paketen muss festgelegt werden. Beispiele: [...] Innerhalb des METS-Standards sind Zeiger auf andere METS-Dokumente vorgesehen. - [Mir ist die Bedeutung dieses Beispiels nicht klar -- gbuechler gbuechler Kapitel B: Verpackung (Ludwig)

9 B3: Es muss definiert sein, welche weiteren Metadaten im Paket enthalten sein müssen und sollen. (Eigenes Kapitel in Ingestempfehlungen?) Ausführung: Es sind eine Reihe von Metadatenarten zu erwägen, die vom Produzenten auch nach eigenem Bedarf mitgeliefert werden. Neben den üblichen deskriptiven und den bereits erwähnten strukturellen Metadaten können dies auch technische und Verwaltungsmetadaten sein. -Wie verhält sich dieser Punkt zu A4 (eher mit A5 konform) - die beiden Einträge müssen aufeinander abgestimmt werden. -- gbuechlergbuechler Kapitel B: Verpackung (Ludwig)

10 B4: Die Identifizierung des Pakets durch den Lieferanten [Produzenten? -- gbuechler 2008-03-10 15:48:31 ] und das dLZA muss gewährleistet sein.gbuechler Kapitel B: Verpackung (Ludwig)

11 Kapitel C: Transfer (Huth) Allgemeine Einführung in das Kapitel C: Der [physische (zur Abgrenzung gegenüber dem gesamten Ingestprozess -- gbuechler 2008-03-11 10:33:10] Transfer der Datenobjekte vom Produzenten zum digitalen Langzeitarchiv ist ein kritischer Prozeß. [...]gbuechler

12 Kapitel C: Transfer (Huth) * C5 Definition: Der Produzent und das digitale Langzeitarchiv setzen den in C4 definierten Transfer-Prozess technisch um. Ausführung: Die vereinbarten technischen Werkzeuge müssen in die Systeme der Partnerinstitutionen implementiert und aufeinander abgestimmt werden. - das kann auch als Durchführung des Transfers gelesen werden, ckeitel

13 C7 Definition: Nach positivem Verlauf von C6 werden der Transfer-Prozess und die technische Implementierung in einem für beide Partner nachvollziehbarem Papier dokumentiert. - [der Ingest-Vereinbarung, -- gbuechler 2008-03-10 15:56:24]gbuechler - [ich würde hier nicht von Papier, sondern von Dokument sprechen. -- jludwig 2008-03-25]jludwig Kapitel C: Transfer (Huth)

14 C8 Definition: Nach positivem Verlauf von C4 startet der Produzent, nach Absprache mit dem Archiv, den ersten Transfer. - [Sollte hier noch erwähnt werden, dass beim Transfer eine Rückmeldung an den Produzenten über den Empfang der Dateien erfolgen muss?-- jludwig 2008- 03-25]jludwig - [Wieso C4? Eher "Nach dem Abschluss von C7"? -- gbuechler 2008-03-10 15:56:24] gbuechler Kapitel C: Transfer (Huth)

15 Kapitel D: Validierung (Keitel) Auf das Ganze Kapitel bezogene Punkte: Kapitelname eher Prüfungen als Validierungen Was bringt die Unterteilung der Validierungsklassen in D1 in Bezug auf den Ingest (Ratgeberfunktion) Erst- und Zweit-Validierung. Legen wir damit fest, dass ein Ingest nur 2 Validierungsprozesse hat?

16 Kapitel D: Validierung (Keitel) Aufgrund der leichten Manipulierbarkeit digitaler Dokumente sollte nach jeder Übertragung - an eine andere Einrichtung, in ein neues Format, auf einen neuen Datenträger - überprüft werden, ob diese noch das enthalten, was von ihnen erwartet wird. Validierungsprozesse sind während der Übernahme und Archivierung eines digitalen Objekts immer wieder erforderlich, sie können automatisiert oder manuell erfolgen. - Anstelle von "manuell" würde ich den Begriff "durch Ansicht" bevorzugen.] -- khuthkhuth

17 Kapitel D: Validierung (Keitel) D1: Vor einer Validierung ist der anzustrebende Validierungstyp festzulegen. Validierung ist stets ein Vergleich. Ziel des Vergleichs ist es, die Glaubwürdigkeit des Objekts (das Objekt entspricht dem, was es vorgibt zu sein) und seine Funktionsfähigigkeit zu belegen. Beispiele: Grundsätzlich lassen sich zwei Klassen von Vergleichszielen unterscheiden: Das zu validierende Objekt wird anhand seines Eltern-Objekts überprüft (Bsp.: Nach einer Migration wird die Zieldatei mit der Ausgangsdatei verglichen). Das zu validierende Objekt wird auf formale oder inhaltliche Vorgaben überprüft (Bsp.: Ein Dateiformat wird mit der Beschreibung für dieses Format verglichen). -erstes Beispiel hinzufügen ein solcher Vergleich kann nur durch das menschliche Auge durchgeführt werden.– khuthkhuth -- Die Zahl der Zeilen oder Datensätze kann schon automatisiert geprüft werden. Entscheidend ist hier, ob das Vergleichsziel in einem Vorgängerobjekt oder in einer externen Norm liegt, ckeitel

18 Kapitel D: Validierung (Keitel) D2: Die bei einer Validierung beteiligten Personen und Hilfsmittel werden definiert. Vor einer Validierung muss zunächst geklärt werden, wer welche Aufgaben übernimmt. Die Validierung klärt auch, in welchem Maße bei der Produktion bestimmte Vorgaben eingehalten wurden. Die Vorgaben können in diesem Kontext als ein Teil der signifikanten Eigenschaften verstanden werden. Aus diesem Grund sollten die bei der Validierung eingesetzten Prozeduren auch dem Hersteller der digitalen Objekte bekannt sein. Die schriftliche Beschreibung dieser Prozesse und der Bewertungsregeln kann der Ingest-Vereinbarung angehängt werden. Darüber hinaus ist es aus methodischen Gründen erforderlich, bei der Validierung andere Methoden und Softwaretools zu verwenden als bei der Produktion, um methoden- oder toolbedingte Fehler erkennen zu können. - Tue mich mit dem gesamten Absatz schwer. Die beiden Typen von Validation werden nicht voneinander abgegrenzt. khuth

19 Kapitel D: Validierung (Keitel) D3: Erst-Validierung. Nach der Übernahme der Objekte ins Archiv ist zu klären, ob die Objekte grundsätzliche Anforderungen erfüllen. Fallen zu diesem Zeitpunkt Abweichungen vom erwarteten Ergebnis auf, sollte die Übernahme der Objekte abgelehnt Beispiele Enthält die Lieferung alle vereinbarten Objekte? Sind die Objekte integer (entsprechen sie zuvor ermittelten Hashwerten)? [Sollte hier statt Erst-Validierung von der Validierung der Korrektheit des Transfers und der Übernahmekriterien gesprochen werden? Die Unterscheidung zwischen formaler und inhaltlicher Korrektheit bringt uns hier nicht weiter, oder? -- jludwigjludwig

20 D4: Zweit-Validierung. Nach der Erst-Validierung kann eine tiefergehende Validierung erfolgen. Häufig entsprechen dann die Ergebnisse nicht mehr vollständig den an sie gerichteten Erwartungen. Manchmal können Ausgangs- und Zielobjekt gar nicht vollständig übereinstimmen (z.B. bei Migrationen des Dateiformats). Auch die vollständige Umsetzung einer Norm ist nur schwer zu erreichen. [Dieser Satz sollte nach Möglichkeit konkreter gefasst sein, ist sehr abstrakt, S. Graf] Das Archiv muss daher definieren, welchen Grad an Abweichung es noch toleriert und ab welchem Punkt es das digitale Objekt zurückweist. Kapitel D: Validierung (Keitel) -Dies kann nicht nur einzelne digitale Objekte betreffen, sondern auch eine Kollektion von Objekten, z.B. eine Ablieferung von Unterlagen aus Geschäftsverwaltungssystemen: Ab welchem Prozentsatz fehlerhafter Unterlagen wird die gesamte Ablieferung zurückgewiesen? – gbuechlergbuechler -Bei der Zweit-Validierung könnte der/ein Unterschied zwischen Wohlgeformtheit und Validität erwähnt werden. jludwig

21 D5: Ergebnisse der Validierung. Validierungen sind grundsätzlich zu protokollieren. Eine gescheiterte Validierung sollte zur Vorlage eines neu hergestellten Zielobjekts führen, das dann erneut zu validieren ist. [Sollte hier wie beim Transfer noch erwähnt werden, dass eine Rückmeldung an den Produzenten erfolgen muss? Wir brauchen eigentlich auch einen kapitelübergreifenden Verweis darauf, dass ein Rückmelde- und Fehlerbehandlungsverfahren etabliert werden muss. -- jludwig 2008-03-25] jludwig Kapitel D: Validierung (Keitel)

22 Kapitel E: Quantifizierung (Büchler) E1: Ein wesentlicher Faktor für die Machbarkeit und die Kosten des Ingestprozesses sind die Datenmengen, die archiviert werden sollen, und die notwendige Rechenkapazität und -zeit. Diese müssen unter verschiedenen Aspekten quantifiziert werden. Die Quantifizierung der Datenmengen muss zu einer Schätzung der damit verbundenen Kosten führen. Das Resultat dient als Input für den Arbeitsschritt "Konsequenzen für das Archiv": Die Kostenschätzung für Datentransfer, temporäre und permanente Speicherung fliesst in die Gesamtberechnung der Kosten ein. Die Volumen-, Kapazitäts- und Kostenschätzungen müssen im Schritt Konsequenzen für das Archiv zur Evaluierung der Machbarkeit des Ingestprozesses herangezogen werden. - Ich würde diesen Abschnitt ganz zu F ziehen. Etwas problematisch finde ich die Verwendung des Begriffs Ingestprozess, der manchmal vielleicht auf den Transferprozess beschränkt werden kann,ckeitel,

23 Kapitel F: Konsequenzen für das Archiv (Büchler) Zum Abschluss der Ingest-Planung müssen die Auswirkungen der einzelnen Schritte des Ingestprozesses auf Archiv und Produzenten gesamthaft analysiert werden. Dabei müssen zwei Aspekte getrennt betrachtet werden: die Kosten und Risiken des Ingestprozesses und die langfristigen Konsequenzen der Datenübernahme oder -nichtübernahme für das Archiv. [In welchem Kapitel erwähnen wir, dass der Service Level, die vom Archiv zu erbringenden Dienstleistungen definiert sein muss? In Recht und Vertrag? -- jludwigjludwig

24 Kapitel G: Recht und Vertrag Grundsätzliche Punkte: Kapitel muss aus der Archivsicht gegengelesen und bearbeitet werden


Herunterladen ppt "Kapitel A: Auswahl (Graf, Steinke, Huth) *A2 Definition: Das digitale Langzeitarchiv und der Produzent müssen die wesentlichen Eigenschaften des primären."

Ähnliche Präsentationen


Google-Anzeigen