Workfloworchestrierung Grundlage für effiziente und qualitativ hochwertige (Massen)Digitalisierung Dipl. Sozw. Ralf Stockmann (SUB Göttingen)
Laufende Projekte (Auszug) SSG Digitalisierung (Mathematik) VD17 / VD18 EZOOLO 2 Rezensionszeitschriften DigiWunschbuch > 5 Mio. Seiten Unterschiedliche Erschließung
Öffnungswinkel
Orientierung an den Praxisregeln der DFG Formate –TIFF, PDF, TEI Qualität –600/300 dpi Volltexte –TEI / XML Schnittstellen –OAI Verfügbarkeit –DFG-Viewer –Persistent Identifier Metadaten (METS/MODS) –Bibliographische, Struktur, technische
Lösungsansätze Zerlegung des Produktionsprozesses in wieder verwendbare Workflows Bibl. Autopsie welcher Workflow angemessen ist Spezialisierung von Personal auf einzelne Bearbeitungsschritte Steuerung durch zentrale Software Controlling und Qualitätskontrolle
PRODUCTION PRESENTATION Ablauf eines Digitalisierungsprojektes 1.Zielsetzung 2.Auswahl des Materials 3.Benchmarking / Standards 4.Produktionsorganisation / Logistik 5.Arbeitsvorbereitungen (AV) 6.Digitalisierung 7.Qualitätskontrolle (QK) 8.Bildoptimierung / Verarbeitung 9.OCR / Volltextgenerierung 10.Metadatengenerierung 11.Präsentation / Verwertung 12.Zugang / Evaluation 13.(Langzeit) Archivierung
Modularer Aufbau
Produktionsumgebung
Webbasiert
Workflows DigiWunschbuch Rezensionszeitschriften RusDML
Nutzermanagement Personen Gruppen Rollen Projekte
Organisation, Rechte und Personen
to-do Listen für jede MitarbeiterIn
Flexibilität und Übersicht
METS Editor
METS Export zu ZVDD, DFG-Viewer, Europeana, DDB, …
Integrierter Image Viewer (AJAX) OCR Integration
Statistik und Controlling
Präsentationsumgebung
Präsentationsebene: TYPO 3 / Lucene Design und Funktionen online anpassbar
Volltextsuche
OCR Renderfarm beim GBV ABBYY Recognition Server 80 Seiten pro Minute NICHT: Fraktur Wortkoordinaten Volltexte mit TEI Strukturierung
DFG Praxisregeln zu OCR Es sei aber ausdru ̈ cklich vor der Gefahr gewarnt, dass Nutzer bei mangelnder Dokumentation zu falschen Ergebnissen gefu ̈ hrt werden. Auf die Suchbedingungen sollte an deutlich sichtbarer Stelle hingewiesen werden. Vorteilhaft ist auch, den Text – selbst bei mäßiger Qualität – nicht zu verstecken, damit sich der Nutzer selbst ein Bild von der Qualität seiner Recherchebasis machen kann.
Anzeige des (TEI) Volltextes
OCR Layer über Image
OCR Leselupe
Auf OCR aufsetzende Funktionen Named entity recognition –Personen –Orte –Ereignisse Semantische Suche Historische Plagiatsfälle (nach C. Mahnke)
Digitales Inhaltsverzeichnis mit Seitenzahlen
PDF download (auch Unterkapitel)
Projectcounter.org Nutzungsstatistiken
RSS feeds, OAI (konfigurierbar)
Integration des DFG-Viewers
Open Source Entwicklergemeinschaft im Aufbau
Partner
Goobi Homepage