Digitale Zukunft – Von der Digitalisierung zur Dokumentverfügbarkeit Dipl. Sozw. Ralf Stockmann (SUB Göttingen)
Orientierung an den Praxisregeln der DFG Formate TIFF, PDF, TEI Qualität 600/300 dpi Volltexte TEI / XML Schnittstellen OAI Verfügbarkeit DFG-Viewer Persistent Identifier Metadaten (METS/MODS) Bibliographische, Struktur, technische
“es war eine gute Idee…“
Orientierung an den Praxisregeln der DFG Formate TIFF, PDF, TEI Qualität 600/300 dpi Volltexte TEI / XML Schnittstellen OAI Verfügbarkeit DFG-Viewer Persistent Identifier Metadaten (METS/MODS) Bibliographische, Struktur, technische
Ablauf eines Digitalisierungsprojektes Zielsetzung Auswahl des Materials Benchmarking / Standards Produktionsorganisation / Logistik Arbeitsvorbereitungen (AV) Digitalisierung Qualitätskontrolle (QK) Bildoptimierung / Verarbeitung OCR / Volltextgenerierung Metadatengenerierung Präsentation / Verwertung Zugang / Evaluation (Langzeit) Archivierung PRODUCTION PRESENTATION
Modularer Aufbau
Produktionsumgebung
Nutzermanagement Personen Gruppen Rollen Projekte
“to-do” Listen für jede MitarbeiterIn
Workflowstatus auf Werkstückebene
METS Editor
METS Export zu ZVDD, DFG-Viewer, Europeana, DDB, …
Integrierter Image Viewer (AJAX) OCR Integration
Statistik und Controlling
Präsentationsumgebung
Präsentationsebene: TYPO 3 / Lucene Design und Funktionen online anpassbar
Volltextsuche
OCR Renderfarm beim GBV ABBYY Recognition Server Vorletze Nacht: 300.000 Seiten NICHT: Fraktur Wortkordinaten Volltexte mit TEI Strukturierung
DFG Praxisregeln zu OCR Es sei aber ausdrücklich vor der Gefahr gewarnt, dass Nutzer bei mangelnder Dokumentation zu falschen Ergebnissen geführt werden. Auf die Suchbedingungen sollte an deutlich sichtbarer Stelle hingewiesen werden. Vorteilhaft ist auch, den Text – selbst bei mäßiger Qualität – nicht zu verstecken, damit sich der Nutzer selbst ein Bild von der Qualität seiner Recherchebasis machen kann.
Anzeige des (TEI) Volltextes
OCR Layer über Image
OCR Layer über Image
OCR “Leselupe”
Auf OCR aufsetzende Funktionen Named entity recognition Personen Orte Ereignisse Semantische Suche Historische „Plagiatsfälle“ (nach C. Mahnke)
Digitales Inhaltsverzeichnis mit Seitenzahlen
PDF download (auch Unterkapitel)
Projectcounter.org Nutzungsstatistiken Hier EXCEL Screenshot machen mit Grafik
RSS feeds, OAI (konfigurierbar)
Integration des DFG-Viewers
Open Source Entwicklergemeinschaft im Aufbau
Partner
Goobi Homepage www.goobi.org