Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Internet Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM 2: Digitale Langzeitarchivierung Referentin: Rasa Sommer.

Ähnliche Präsentationen


Präsentation zum Thema: "Internet Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM 2: Digitale Langzeitarchivierung Referentin: Rasa Sommer."—  Präsentation transkript:

1 Internet Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM 2: Digitale Langzeitarchivierung Referentin: Rasa Sommer

2 Definition des Internet Das Internet (von englisch interconnected network), kurz das Netz, ist ein weltweites Netzwerk, bestehend aus vielen Rechnernetzwerken, durch das Daten ausgetauscht werden. Es ermöglicht die Nutzung von Internetdiensten wie E-Mail, Telnet, Dateiübertragung, WWW und in letzter Zeit zunehmend auch Telefonie, Radio und Fernsehen. Der Datenaustausch zwischen den einzelnen Internet-Rechnern erfolgt über die technisch normierten Internetprotokolle. Wikipedia

3

4 Methoden der Web-Archivierung ● „Domain Harvesting“ ● „Selektives Harvesting“ ● „Event Harvesting“

5 ● Domain Harvesting ● - Sammlung von Startseiten (sog. Seed – URLs) nationalen Webspace ● - nationale gesamte Top-Level Domain ● (z.B. „.de“ für Deutschland) ● - Andere Top-Level Domains mit Deutschland Bezug ● (z.B..com,.org,.net, etc.) ● - Software z.B. Crawler HERITRIX ● -Durchführung im Halbjahres- oder Jahresrhythmus ● Nachteil: ● - Nur Zeitschnitte einer Webseite

6 ● Selektives Harvesting ● - Ausgewählte Seiten, die häufigen Änderungen unterliegen ● - Harvesting in geeigneten Intervallen ● (z.B. täglich, wöchentlich etc.) ● - Inhalte: ● ○ Medien national und regional; ● ○ Gesellschaft, Wirtschaft, Kultur; ● ○ Wissenschaft/Universitäten etc.; ●

7 ● Event Harvesting ● - Spezielle Anläse und Großereignisse ● - Webseiten, die nur für den Zeitraum des Ereignisses ● zur Verfügung stehen ● (z.B. Nationalratswahl, Bundespräsidentenwahl, Olympische Spiele )

8 Webarchivierungs-Projekte Internet Archive ● Anfänge der Webarchivierung Brewster Khale 1996 (USA) ● Ziel → „Bibliothek des Internet“ ● Archiviert werden Momentaufnahmen von Webseiten, Filme, Tonaufnahmen, Bücher, Software ● Open Source Software „Heritrix“ durchsucht und ● archiviert Webseiten ● Zugriff auf archivierte Seiten → Wayback Maschine ● Gespeicherte Daten im Archiv ca. 3 Petabyte ● Nachteile: ● Inhalte bleiben erhalten, die Autoren nicht mehr vertreten, sowie rechtswidrige Inhalte ● Wird nicht alles gesichert z.B. Bilder

9 Deutsche Nationalbibliothek ● Deutschen Nationalbibliothek hat Aufgabe Publikationen zu sammeln, archivieren und zugänglich zu machen ● Am 22. Juni. 2006 Neufassung des Gesetzes DNBG Sammelauftrag auf Netzpublikationen erstreckt ● Die Deutschen Nationalbibliothek verfolgt Ziele: ● - Automatische Erschließung der Netzpublikationen ● - Einsatz von Persistent Identifiern (PI)

10 ● Australische Nationalbibliothek „Pandora“ ● The Library of Congress „National Digital Information Infrastructure“ ● Nationalbibliothek in Schweden etc.


Herunterladen ppt "Internet Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM 2: Digitale Langzeitarchivierung Referentin: Rasa Sommer."

Ähnliche Präsentationen


Google-Anzeigen