Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM2 (Hauptseminar): Digitale Langzeitarchivierung Referentin: Lilli Hahn 17.11.2011 Introduction.

Slides:



Advertisements
Ähnliche Präsentationen
Audio & Videoformate Max Rennhofer.
Advertisements

Zur SCORM-Fähigkeit konventioneller XML-unterstützender eLearning Developer Tools im Projekt I-can-EIB OFFIS Oldenburger Forschungs- und Entwicklungsinstitut.
Anwendung von Standards vor dem Hintergrund der Langzeitarchivierung
Dateiformate Tobias Rolle IT takes more than systems …
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik Vertiefung.
Von digitalen Bibliotheken zu Online-Shops mit digitalen ProduktenDietrich BolesSeite 1 Von digitalen Bibliotheken zu Online-Shops mit digitalen Produkten.
Komplexpraktikum Medieninformatik „Implementierung eines Präsentationstools für das Reformprojekt ProblemOrientiertes Lernen“ Nebenfachausbildung Gesundheit.
Angebote zur digitalen Langzeitarchivierung
Gegen die Vergänglichkeit digitaler Informationen Susanne Kurz AWV Sitzung Daten- und Speichermanagement, Köln,
Leistungszentren für Forschungsinformation II – Sicherung und Bereitstellung von Textquellen und Primärdaten DINI – AG Informationsmanagement Essen, 17.
Eigenschaften und Pflichten vertrauenswürdiger digitaler Archive
Literaturverwaltung und Wissensorganisation
Präsentation zum Thema Netzwerk Von Jan Metz.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Kann eine XML-Datenbank temporal sein? Universität zu Köln Hauptseminar: Datenbanken vs. Markup Dozent: Prof. Dr. Manfred Thaller Referentin: Cigdem Varol.
Virtuelle Forschungsumgebungen Hintergrundbeitrag: HTML5: Video Player und VideoJS Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung.
CIDOC-CRM Universität zu Köln Historisch-kulturwissenschaftliche Informationsverarbeitung AM 2 Dozent: Prof. Dr. Manfred Thaller Referent: Nelson Marambio.
METS/MODS Referat im Rahmen des IT-Zertifikats f ü r Geisteswissenschaftler Leitung: P. Sahle Referentin: C. Ottnad.
METS / MODS. METS – Metadata Encoding and Transmission Standard – 2002 veröffentlicht – XML Schema – Reale Objekte digital abbilden – hierarchische Struktur.
Der Geo-Guide als ein Modul für eine Virtuelle Fachbibliothek Virtuelle Fachbibliothek: Wofür & Was Zentrale Anlaufstelle für den Fachwissenschaftler zur.
Access 2000 Datenbanken.
ENOVIA SmarTeam CATIA Integration
Dokumenten- und Archivsystem auf Basis kommerzieller Software Verband der Bibliotheken des Landes Dokumenten-
UML Begleitdokumentation des Projekts
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
Preservation Metadata. OAIS Reference Model Diese und folgende Quellen:
METS (Metadata Encoding Transmission Standard). Wer und Was Digital Library Federation Vorgänger: MoA II (1997) Standard zur Beschreibung einer Teilmenge.
Citavi im Prozess der wissenschaftlichen Arbeit
Einführung in die App- Programmierung Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Medien zwischen Technik und Gesellschaft.
Warum brauche ich ein CMS – Content Management System?
Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Softwaretechnologie II (Teil I): Simulation und 3D Programmierung Prof.
Typo3 Templates und TypoScript
Intelligente Dateisysteme
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
Sesame Florian Mayrhuber
- 1 Förderprogramm eTEN Call Mai bis 10. September 2003.
Copyright, 2002 © Josef Fürst Neue Funktionen im Digitalen Hydrologischen Atlas Österreichs (digHAO) J. Fürst T. Hörhan Institut.
Seminar: Entwicklung verteilter eingebetteter Systeme WS05/06 Betreuer: Info:
Publikation auf Knopfdruck Judith Riegelnig Michael Grüebler 19. Oktober 2010 / Statistiktage Neuenburg.
Archiv Def: Siehe Digitales Langzeitarchiv.
Jede Präsentation beginnt mit dieser Seite
Integration existierender digitaler Bibliotheken in Lernumgebungen LEBONED (Learning Environment Based On Non Educational Digital Libraries) Dipl.-Inform.
KOOP-LITERA Tagung 2003, 8. / 9. Mai 2003 Archivierung digitaler Dokumente Problemstellung - kooperative Lösungsansätze - Aktivitäten der Österreichischen.
ECM-Informationstag auf der Kieler Woche
Ist das DANRW vertrauenswürdig? Manfred Thaller Universität zu Köln Köln, Die Herausforderung der Elektronischen Archivierung 16. Januar 2013.
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
Multimedia in Java Thomas Witschel, Kerstin Steinert & Erik Reinhard.
© Computer- und Medienservice, Humboldt-Universität zu Berlin Qualitätssicherung und Authoringtools Uwe Müller Peter Schirmbacher Matthias Schulz.
BADI – Barrierefreie Aufbereitung Digitaler Inhalte
Digitale Langzeitarchivierung Sustainability of Digital Formats Universität zu Köln Historisch-kulturwissenschaftliche Informationsverarbeitung Hauptseminar.
Bern University of Applied Sciences Engineering and Information Technology Documentation generator for XML-based description standards Ausgangslage: Die.
Zielgruppe Inhalte Layout Technik: Zielgruppe,Produktion Allgemeines Kosten Rolle der FH Konkretes Konzepte Publikation in Neuen Medien.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Fedora by C. Göpfert.
Netzhochschule Mögliche Ziele Punktuelle multimediale Ergänzung von Vorlesungen Multimediale Vorlesungsteile Multimediale Vorlesungen „Multimediale Vorlesungen“
Greenstone. Theoretischer Teil Entstehung: Entwickelt vom New Zealand Digital Library Project an der Universität von Waikato Kooperation mit der UNESCO.
Die digitale Langzeitarchivierung Referentin: Marietta Steinhöfel Seminar: Digitale Langzeitarchivierung Prof. Dr. Manfred Thaller
Zitat-management-System Meilenstein 1
Vertretungen der Öffentlichen Bibliotheken Schulungsunterlagen der AG RDA.
Interoperabilität in Digitalen
Vertretungen der Öffentlichen Bibliotheken Schulungsunterlagen der AG RDA.
COLLADA II Digital Asset Schema Release Anike Schulz Reusable Content in 3D und Simulationssystemen Prof. Thaller.
Was gibt’s neues im Bereich Anpassung Fabian Moritz Consultant, Developer SharePointCommunity.de.
made by Aberer, Spiegel & Tschegg
Seminar Digitale Bibliotheken Thema: Nutzen von digitalen Bibliotheken.
Das OAIS Modell Manfred Thaller Universität zu Köln
Physik für Mediziner : Die Rolle der Bibliothek Vortrag zum Workshop “Audiovisuelle Wissensmedien online“ am in Göttingen Projektidee Dr. Joachim.
Digitale Langzeitarchivierung Internet Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM 2: Digitale Langzeitarchivierung Referentin:
Annotationssysteme ____________________________________________________________________ Universität zu Köln | Historisch-kulturwissenschaftliche Informationsverarbeitung.
 Präsentation transkript:

Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM2 (Hauptseminar): Digitale Langzeitarchivierung Referentin: Lilli Hahn Introduction to Digital Formats of Library of Congress Collections

Digitale Formate: Eine fortlaufende Arbeit. Digital Formats Website: Informationen über Formate mit digitalem Inhalt Online seit 2004, seitdem ständiges Hinzufügen von aktualisierten/ausgedehnten Analysen und Quellen. Weiterentwicklung digitaler Formate → Weiterentwicklung Website

Unterstützung des strategischen Plans zur Langzeit- Sicherung digitaler Inhalte durch Library of Congress Bestandsliste mit Informationen über gegenwärtige u. auftauchende Formate Identifizierung/Beschreibung vielversprechender Formate Identifizierung/Beschreibung nicht vielversprechender Formate Gesamte Analyse gehört zur Durchführung des Plans: Verwaltung/Bewahrung digitalen Inhaltes  Bewahrung des technischen Formats Ziele

Bereich. Analyse der technischen Aspekte der digitalen Formate: Website behandelt Formate mit medien-unabhängigem (intangible) digitalen Inhalt (→ Files) Außerachtlassen von Formaten mit medien-abhängigem (tangible) digitalen Inhalt (→ Formate untrennbar vom physischen Medium, z.B.: DVD, CD, Videoformat wie DigiBeta)

Typische Fragen Bevorzugte Formate der Bibliothek? Welche Formate müssen unterstützt werden? Technische Voraussetzungen? Welche technischen Metadaten sind wichtig? Softwaretools für Validierung/Erschließung der Metadaten? Verfügbare Informationen über Empfehlungen zur Unterstützung eines Formats?

Was ist ein Format? „packages of information that can be stored as data files or sent via network as data streams (aka bit streams, byte streams)“ Dateiformate: Erkennbar an Endung (z.B. mp3) Internet Media Type (z.B. text/html) Weiterentwickelte Versionen Verfeinerungen für engeren Anwendungsbereich (z.B. TIFF/EP ↔ TIFF/IT) Andere optionale Besonderheiten, die für die Datenzukunftsfähigkeit eine Rolle spielen

Was ist ein Format? Bitstream Verschlüsselungen: Liegen bestimmten Dateiformaten zu Grunde Sind spezifisch oder allgemein Klassen verwandter Formate Dabei wichtig: familiäre Charakteristika Wrapper und Bündelungsformate Wrapper:  kapselt seine einzelnen Bitstreams ein  Spezifisch für Inhaltskategorie, Teil einer allgemeineren Klasse Einfache bundling Formate:  Kapseln ihre einzelnen Dateien ein  Beschreiben nicht Inhalt/Beziehungen zwischen Dateien  Meist eher allgemein

Was ist ein Format? Selbst beschreibende Bündelungsformate:  Repräsentieren Bündel von Dateien, die eine komplexe digitale Arbeit erfassen  Information über Bestandteile u. Beziehungen (structural metadata)  Beinhalten oft technische Details über jede Komponente Beziehung zu OAIS Informationspaketen:  OAIS Reference Model: Information soll an den unterschiedlichen Stellen des Inhaltslebenszyklus' (content lifecycle) verpackt werden  Submission Information Packages ↔ Dissemination Information Packages; bestehen an der Berührungsfläche zw. OAIS Speicher und Produzenten/Konsumenten d. Inhalts

Was ist ein Format? Wrapping/bundling v. Inhalten für Lieferung/Austausch auf physikalischen Medien: – Medien-abhängige Bündelungsspezifikationen sollen Benutzern das Erstellen einer privaten „Bibliothek“ ermöglichen – Kann auch genutzt werden um gewerblich verbreitete Inhalte zu formen – Bei Erfolg: mögliche Entwicklung zu Strukturen, die für medien- unabhängige Inhalte genutzt werden können – Bündelungsformate können wahrscheinlich wichtig werden für den Erhalt digitaler Inhalte

Beziehungen zwischen Formaten Format-Name allein ist nicht ausreichend Empfehlungen bzgl. Qualität/beschreibende o. Technische Metadaten Kostengünstigere Vorbereitung auf Zukunftsfähigkeit Einfachere Integration in Systeme Dokumentation v. Beziehungen zwischen/innerhalb Formaten notwendig Praktische Nutzung Versionen WAVE Wrapper unterschiedlicher Bitstreams Einbettung von Metadaten Subtyp von RIFF; kann Linear PCM, µ-law, A-law beinhalten; hat die Subtypen Broadcast WAVE (Linear PCM + EBU metadata) und AES (BWF + cart metadata)

Beziehungen zwischen Formaten PDF Dateiformat, Wrapper, Bündelungsformat beinhaltet Versionen 1.3; 1.4; 1.5; 1.6; 1.7 Kann TIFF, JPEG, JPEG2000, usw. beinhalten. Beinhaltet die Subtypen Tagged PDF; Accessible PDF; PDF/X; PDF/A Klassifizieren von Subtypen hat hohen Wert Subtypen können andere Funktionen/Besonderheiten aufweisen Eine Datei kann zu mehr als einer Subtyp-Klasse gehören

Zu berücksichtigende Faktoren bei der Bewertung eines digitalen Formats 1. Disclosure Grad, bis zu dem Spezifikationen/Werkzeuge für Validierung technischer Integrität besteht Wichtig: Existenz einer vollständigen Dokumentation 2. Adoption Grad, bis zu dem das Format bereits von Erstellern, Verbreitern, Benutzern von Informationsquellen genutzt wird Nutzung als Masterformat, Lieferung zum Endnutzer, Austausch zwischen Systemen 3. Transparency Grad, bis zu dem die digitale Repräsentation für die direkte Analyse mit basic tools verfügbar ist. z.B. Leserlichkeit für Menschen via Texteditor

Zu berücksichtigende Faktoren bei der Bewertung eines digitalen Formats 4. Self-documentation Daten beinhalten beschreibende, technische, administrative Metadaten 5. External Dependencies Grad, bis zu dem ein bestimmtes Format von best. Hardware/Bedienungssystem/zukünftigen Entwicklungen abhängt 6. Impact of Patents Grad, bis zu dem Archive fähig sind, Inhalte zu sichern, deren Format patentiert ist 7. Technical Protection Mechanisms Einbindung von Mechanismen wie Kodierung, die Bewahrung von Inhalt verhindern

Zu berücksichtigende Faktoren bei der Bewertung eines digitalen Formats Ausbalancieren der Faktoren Präferenzen zwischen den Formaten resultieren aus Gleichgewicht der 7 Faktoren Die Fähigkeit eines Formats spezielle Funktionalitäten zu unterstützen kann die Zukunftsfähigkeits-faktoren ausgleichen Kanal, durch den digitaler Inhalt erhalten werden kann Adoption

Zu berücksichtigende Faktoren bei der Bewertung eines digitalen Formats Qualitäts- und Funktionalitätsfaktoren Gehören zu Fähigkeit des Formats signifikante Charakteristika eines Inhalts für Benutzer zu repräsentieren „Normal rendering“ Grundlinie für Verhalten des Inhalts bei Präsentation für Nutzer Beispiele: Qualitäts- und Funktionalitätsfaktoren für ausgesuchte Inhaltstypen Unbewegte Bilder:  Clarity (Unterstützung für hohe Bildqualität)  Color maintenance (Unterstützung Farbmanagement)  Unterstützung Grafikeffekte, Typographie

Zu berücksichtigende Faktoren bei der Bewertung eines digitalen Formats Ton:  Tonwiedergabe (Unterstützung hoher Tonqualität)  Unterstützung mehrerer Tonspuren; herunterladbarer/ benutzerdefinierter sounds/samples/patches Text:  Unterstützung Integrität: Dokumentstruktur/-navigation; layout, font, design features  Unterstützung rendering: Mathematik, Formeln, Diagramme, etc. Bewegte Bilder:  Clarity (Bildauflösung)  Tonwiedergabe (Audioqualität)  Unterstützung mehrerer Tonspuren

Zu berücksichtigende Faktoren bei der Bewertung eines digitalen Formats Beyond normal rendering Bei best. Formaten: dienen den Bedürfnissen von Benutzern mit spez. Interesse in best. Inhaltstypen Bsp: Vektorbasierte Bilder → malleable (veränderbar) Rich-data content (funktioneller Aspekt):  Ein Element soll als „Master“ dienen  Bsp.: Bildtiefe – extended data range  Bsp.: Tonaufnahmen/bewegte Bilder  Zusätzliche Daten = umfangreichere Verarbeitungsmöglichkeiten  Rich-data content = gute Wahl für Langzeitarchivierung

Rahmen für die Entscheidungsfindung Library of Congress eignet sich Inhalte auf verschiedenen Wegen an Copyright Gesetz Einkauf, Austausch, Lizenzvergabe, Spenden Projekte: Veterans History Project; Minerva Project Belange der Firmenpolitik „Sind die Farbwerte eines Bildes so wichtig, dass die Farbverwaltung unterstützt werden muss?“ „Benötigt der Forscher von morgen den Surround-Sound einer Musikaufnahme?“

Rahmen für die Entscheidungsfindung Anfangs-, Mittel- und Endstadium von Formaten Gesammelte Inhalte sind oft veröffentlichte Endfassungen kreativer Prozesse Auch Werke in anderen Stadien werden gesammelt  Creative process: Manuskripte, Entwürfe, Rohmaterialien Mittleres Stadium nimmt in Händen d. Veröffentlicher ihre Form an  PDF/X, TIFF/IT → Designer, digital Art  Musik mit Metadaten um endgültige Produktion zu mixen Herausgeber nutzen Mittelstadium für eigene Archive Am besten für Archivierung (höhere Qualität, einfacher zu handhaben), jedoch: verbreitetes gegenwärtiges Vorgehen = Auswählen d. Besten Ausgaben (Copyright) → Endstadium

Rahmen für die Entscheidungsfindung Der Wert der Aufbewahrung mehrerer Versionen einer Arbeit Mehrere Versionen in unterschiedlichen Formen sind erwünscht → um die Verwaltung während des gesamten Inhaltslebenszyklus zu ermöglichen Entstehung einer gewissen Spannung bei Identifizierung d. Besten Formats Komprimierte Versionen von Bildern oder Tonaufnahmen bieten mühelosen Zugriff, während deren unkomprimierte Gegenstücke zukunftsfähiger sind.

Projekt-Bereich Bevorzugte und nicht-bevorzugte Formate Library of Congress muss ständig auf Updates der Format- präferenzen vorbereitet sein Technische Unterstützung für bevorzugte/annehmbare Formate Identifizierung/Bereitstellen von Informationen über andere Formate Get process = intensive Arbeit