Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

SCAPE Informationstag und Demo-Event Österreichische Nationalbibliothek Max Kaiser Leiter Abteilung Forschung und Entwicklung Österreichische Nationalbibliothek.

Ähnliche Präsentationen


Präsentation zum Thema: "SCAPE Informationstag und Demo-Event Österreichische Nationalbibliothek Max Kaiser Leiter Abteilung Forschung und Entwicklung Österreichische Nationalbibliothek."—  Präsentation transkript:

1 SCAPE Informationstag und Demo-Event Österreichische Nationalbibliothek Max Kaiser Leiter Abteilung Forschung und Entwicklung Österreichische Nationalbibliothek max.kaiser@onb.ac.at @maxkaiser Österreichische Nationalbibliothek 5. Mai 2014

2 @maxkaiser 13:30Max Kaiser, ÖNB: Begrüßung 13:40Sven Schlarb, ÖNB: Einleitende Worte über das SCAPE-Projekt 14:00Rainer Schmidt, AIT: Die SCAPE-Plattform 14:30 Sven Schlarb, ÖNB: SCAPE an der Österreichischen Nationalbibliothek 15:00 Kaffeepause 15:20Roman Graf, AIT: Das Matchbox-Tool 15:50 Kresimir Đuretec, TUW: Preservation Planning und Watch 16:30Ende

3 @maxkaiser SCAPE Scalable Preservation Environments Skalierbare Lösungen für digitale Langzeitarchivierung

4 @maxkaiser Digitale Bestände der ÖNB und digitale Langzeitarchivierung

5 @maxkaiser Abteilung Digitale Archivierung Abteilung Forschung und Entwicklung Digitale Langzeitarchivierung

6 @maxkaiser Digitale Bestände Pflichtablieferung (Legal Deposit) Webarchivierung Digitalisierung

7 @maxkaiser Pflichtablieferung Novelle Mediengesetz 2009: Anbietungspflicht für digitale Publikationen Bestand Online-Publikationen Ende 2013: ~ 12.000 Vorbereitung erneute Novellierung Mediengesetz

8 @maxkaiser Web@archiv Österreich

9 @maxkaiser Web@archiv Österreich 1999–2002: Erstes Pilotprojekt (AOLA) 2007: Machbarkeitsstudie 2008: Pilotprojekt 2009: Rechtliche Grundlage (Novelle Mediengesetz) Seit 2009: Standardprozess der ÖNB

10 @maxkaiser Web@archiv Österreich Datenmenge (Status 2013): 1,5 Milliarden Objekte 21,5 TB Daten (komprimiert, de-dupliziert) 1,7 TB Metadaten

11 @maxkaiser

12 Sammlungsstrategie Kombination aus Domain Harvesting Selektives Harvesting Eventbasiertes Harvesting

13 @maxkaiser Digitalisierung

14 @maxkaiser Zugang für alle von überall 24/7

15 @maxkaiser +10 Mio. Seiten historische Zeitungen & Gesetzestexte

16 @maxkaiser

17 ~500.000 Bilder

18 @maxkaiser ~100.000 Plakate

19 @maxkaiser Papyri…

20 @maxkaiser Austrian Books Online

21 @maxkaiser Digitalisierung des gesamten historischen Buchbestands der Österreichischen Nationalbibliothek

22 @maxkaiser Eine der 5 bedeutendsten historischen Büchersammlungen weltweit

23 @maxkaiser 600.000 Bände 200 Mio Seiten

24 @maxkaiser 16. Jahrhundert Zweite Hälfte 19. Jahrhundert

25 @maxkaiser Google Bücher Digitale Bibliothek Österreichische Nationalbibliothek

26 @maxkaiser Wo steht das Projekt heute?

27 @maxkaiser ~215.000 Bände digitalisiert März 2013

28 @maxkaiser ~68,5 Mio. Seiten März 2013

29 @maxkaiser Jahrhunderte… Austrian Books Online Datenbestand: 200.000 Bücher

30 @maxkaiser Sprachen… Austrian Books Online Datenbestand: 200.000 Bücher

31 @maxkaiser Datenmenge Durchschnitt pro Datenpaket (~Buch): 101 MB 101 MB * 600.000 = 60 TB

32 @maxkaiser Datenspeicherung & Access Datenspeicherung: inhouse Daten redundant gespeichert Access-Kopien aus JPEG2000 Master Files on-the-fly generiert

33 @maxkaiser Download und Speicherung ADOCO JPEG2000 HOCR METS TXT ABO NAS-Speicher Pair Tree-Algorithmus ca. 60 TB

34 @maxkaiser Big Data

35 @maxkaiser Technologien aus EU-kofinanzierten FP7 Projekten: SCAPE (Scalable Preservation Environments) http://www.scape-project.eu/ IMPACT (Improving Access to Text) http://www.impact-project.eu/

36 @maxkaiser ÖNB Hadoop- Cluster

37 @maxkaiser Qualitäts- kontrolle

38 @maxkaiser Automatisierte Routinen Repräsentative Stichproben EDV-unterstütztes Finden von Fehler- Clustern Fehler-Kandidaten manuell überprüft Suche nach systematischen und kritischen Fehlern

39 @maxkaiser Durchscheinen nicht-kritisch

40 @maxkaiser Schnitt-Fehler kritisch!

41 @maxkaiser Qualitätskontrolle via Sampling Re-Processing Re-Download

42 @maxkaiser Fehler behoben

43 @maxkaiser Access

44 @maxkaiser Katalog / Quick Search Volltextsuche ABO Book Viewer ANNO Zeitungsportal

45 @maxkaiser

46

47

48 Volltextsuche

49 @maxkaiser

50 mobiler Viewer

51 @maxkaiser Kritische Masse an digital verfügbaren Texten und (Meta-)Daten Neue Fragestellungen an Textmaterial?

52 @maxkaiser Metadaten Digitalisierte Bestände Daten Server Daten- verarbeitung Tool Datenspeicher Daten-verarbeitung Digital Humanities Forschungsfragen Projekte DH - Bibliotheken

53 @maxkaiser 13:30Max Kaiser, ÖNB: Begrüßung 13:40Sven Schlarb, ÖNB: Einleitende Worte über das SCAPE-Projekt 14:00Rainer Schmidt, AIT: Die SCAPE-Plattform 14:30 Sven Schlarb, ÖNB: SCAPE an der Österreichischen Nationalbibliothek 15:00 Kaffeepause 15:20Roman Graf, AIT: Das Matchbox-Tool 15:50 Kresimir Đuretec, TUW: Preservation Planning und Watch 16:30Ende

54 @maxkaiser Danke! max.kaiser@onb.ac.at www.onb.ac.at twitter.com/maxkaiser www.linkedin.com/in/maxkaiser plus.google.com/+maxkaiser1


Herunterladen ppt "SCAPE Informationstag und Demo-Event Österreichische Nationalbibliothek Max Kaiser Leiter Abteilung Forschung und Entwicklung Österreichische Nationalbibliothek."

Ähnliche Präsentationen


Google-Anzeigen