Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Matthias SchulzeBernhard Tempel RusDML Ein digitales Archiv russischer mathematischer Zeitschriften DMV-Jahrestagung 2006 Minisymposium 29 – Information,

Ähnliche Präsentationen


Präsentation zum Thema: "Matthias SchulzeBernhard Tempel RusDML Ein digitales Archiv russischer mathematischer Zeitschriften DMV-Jahrestagung 2006 Minisymposium 29 – Information,"—  Präsentation transkript:

1 Matthias SchulzeBernhard Tempel RusDML Ein digitales Archiv russischer mathematischer Zeitschriften DMV-Jahrestagung 2006 Minisymposium 29 – Information, Kommunikation und Bibliotheken für die Mathematik

2 Matthias SchulzeBernhard Tempel Gliederung Die Idee von RusDML –Relevanz der russischen mathematischen Zeitschriften –Lizenzen –Inhaltliche Erschließung Die Umsetzung von RusDML –RusDML-Application Profile –RusDML-Workflow –RusDML-Tool –Transliteration –RusDML-Archiv –Zugänge zum RusDML-Archiv Fazit

3 Matthias SchulzeBernhard Tempel RusDML – Die Idee Relevanz der russischen Mathematik (Indiz: Übersetzungszeitschriften) Aufbau eines digitalen Archivs bedeutender russischer Mathematikzeitschriften Vorbereitung des russischen Teils der World Digital Mathematics Library (WDML) Erschließung durch Metadaten aus dem Zentralblatt MATH Zusätzlich Verbesserung der Metadaten des Zentralblatt MATH und Verlinkung auf Artikel in RusDML

4 Matthias SchulzeBernhard Tempel Ein russisch-deutsches Projekt Partner: –TU Berlin (Projektleitung) –SUB Göttingen –TIB Hannover –GPNTB Moskau Förderung durch DFG (09/ /2007) und RFBR Partner außerhalb der Projektförderung: –Russische Akademie der Wissenschaften, Moskau –Steklov Institut für Mathematik, Moskau RusDML im Internet:

5 Matthias SchulzeBernhard Tempel Lizenzen (1) Ursprüngliche Planung: –Digitalisierung aller mathematischer Publikationen aus Russland und Staaten früheren Sowjetunion –Kernarchiv mit ca. 70 Zeitschriften –Später Erweiterung auf Monographien, Sammelwerke und bei VINITI deponierte Artikel Aktueller Stand: –Lizenzen für 10 Zeitschriften, darunter: Algebra i logika ( ) Sibirskij matematiceskij zurnal ( ) Matematiceskij sbornik ( ) –Das Steklov Institut hat Lizenzen für Matematiceskie zametki und Trudy matematiceskogo instituta steklova

6 Matthias SchulzeBernhard Tempel Lizenzen (2) Gegenstand der Lizenzvereinbarung (Beispiel Sibirskij matematiceskij zurnal): –Digitalisierung und elektronische Wiederveröffentlichung (freier Zugang über das RusDML-Archiv) –Lizenzgeber erhält eine voll funktionsfähige Kopie der digitalisierten Version seiner Zeitschrift zur eigenen Verwendung (Integration in das Archiv der bereits elektronisch erzeugten neueren Jahrgänge) –Lizenzgeber erhält das Recht, die digitalisierte Fassung z.B. auf CD-ROM zum Verkauf anzubieten (der freie Zugang über das RusDML-Archiv bleibt davon unberührt)

7 Matthias SchulzeBernhard Tempel Lizenzen (3) Einwerbung weiterer Lizenzen schwierig: –Verlage/Herausgeber wollen jetzt doch selbst digitalisieren –Rechte für freien Zugriff würden kostenpflichtige Vermarktung behindern Konsequenz für RusDML: –Technische Infrastruktur für Import extern erstellter Digitalisate gewinnt an Bedeutung

8 Matthias SchulzeBernhard Tempel Inhaltliche Erschließung Erfolgt nicht im Rahmen des Projekts, sondern durch –Übernahme der Klassifikation nach MSC vom Zentralblatt MATH –Eintragung der Notationen nach UDK (Universale Dezimal- Klassifikation) in die Metadaten (durch GPNTB) –Übertragung vorhandener englischer oder russischer Schlagwörter Durch Verlinkung auf den Eintrag im Zentralblatt MATH ist ggf. auch das Abstract verfügbar

9 Matthias SchulzeBernhard Tempel RusDML – Die Umsetzung RusDML-Application Profile RusDML-Workflow RusDML-Tool Transliteration RusDML-Archiv Zugänge zum RusDML-Archiv

10 Matthias SchulzeBernhard Tempel RusDML-Application Profile (1) Application Profile (AP): Dokumentation / Definition des für eine lokale Anwendung benötigten Sets an Metadatenelementen Verständigung unter den RusDML-Projektpartnern auf ein Kernset von Metadatenelementen = RusDML AP Kategorien der RusDML-Metadatenelemente sind: –Identifier: Article –Journal (identifier, journal title, publisher...) –Volume –Issue –Article: Structure (author, pages...) –Article: Content (article title, abstract, classifications...)

11 Matthias SchulzeBernhard Tempel RusDML-Application Profile (2)

12 Matthias SchulzeBernhard Tempel RusDML-Application Profile (3) Die aktuelle Version des RusDML-AP ist online abrufbar:

13 Matthias SchulzeBernhard Tempel RusDML-Workflow (1): Allgemeine Übersicht Lizenz: Einwerben und Verwalten (1) Projektleitung/-partner Bestandsaufnahme gedruckte Version (2) SUB ZDB-Aufnahme (3) SUB Bibl. Aufnahme in lokalen OPAC (4) SUB Normierung der Zeitschriftentitel (5) TIB / UB Anlegen eines Prozesses im Workflowtool, für je- den Band (6) SUB TIFF-Header erstellen (7) SUB Scannen der Images (8) SUB / GDZ Qualitätskontrolle (9) SUB / GDZ Imagenachbearbeitung (10) SUB / GDZ Imaging Vollständigkeitsprü- fung Artikelebene (11) TUB Aufbereitung / Import Zentralblattdaten (12) TUB Prüfung / Korrektur bibliogr. Daten (13) TUB Import kyrillische Metadaten (14) GPNTB Endkontrolle eines Bandes (18) TIB / UB Metadaten Transliterieren (15) TIB / UB Erfassung der Strukturdaten (16) SUB Korrektur des Zen- tralblattimports (17) TUB Generierung der SICI (für Artikel) (19) SUB Metadatenproduktion Datenexport in METS mit Images (20) SUB Import in lokale Re- positories/DMS (21) Eigenleistung Rückmeldung der PURLs (22) SUB + TUB + TIB/UB Import in Repositories Application Profile erstellen Projektpartner Workflowverwaltung programmieren SUB Importfilter für Importformate SUB Erfassungtools für Metadaten SUB Exportschnittstellen SUB PURL-Generierung SUB Imagehandling im Workflow SUB Pflege der Erfassungstools SUB Administration Ablaufplan des kooperativen Workflows im Projekt RusDML (in Klammern die Nummer des Arbeitsschrittes) ProduktionEntwicklung 1

14 Matthias SchulzeBernhard Tempel Der kooperative RusDML-Workflow SUB Göttingen Tool-Entwicklung Scannen (GDZ) Erstellung der Strukturmetadaten Online-Präsentation (Suchmaschine) TU Berlin (Zentralblatt) Projektmanagement Erstellung der bibliographischen Metadaten (Zentralblatt MATH) TIB/UB Hannover Metadaten-Bearbeitung Transliteration GPNTB Moskau Erstellung der russischen (kyrillischen) Metadaten

15 Matthias SchulzeBernhard Tempel RusDML-Workflow (3): Arbeitsschritte 1-10 I) Vorbereitende Tätigkeiten (verschiedene Partner) 1) Lizenzeinwerbung (TU Berlin, GPNTB Moskau) 2) Bestandsaufnahme der gedruckten Version (jeweiliger Standort, Koordination SUB Göttingen, GPNTB) 3) ZDB-Aufnahme (TIB Hannover) 4) Bibliothekarische Aufnahme für den lokalen OPAC (SUB, GPNTB) 5) Normierung der Zeitschriftentitel (TIB) II) Anlegen eines Prozesses und Digitalisierung (SUB) 6) Anlegen eines Prozesses auf Bandebene 7) TIFF-Header erstellen 8) Scannen der Images 9) Qualitätskontrolle 10) Imagenachbearbeitung

16 Matthias SchulzeBernhard Tempel RusDML-Workflow (4): Arbeitsschritte III) Import von Metadaten in das Tool (TUB und GPNTB) 11) Prüfung der Vollständigkeit auf Artikelebene der Zentralblattdaten (TUB) 12) Import / Lieferung der Zentralblattdaten (TUB) 13) Prüfung und Korrektur der bibliographischen Daten im Tool (TUB) 14) Import / Lieferung der russischen Metadaten (GPNTB) IV) Metadatenbearbeitung und -ergänzung (SUB, TIB, TUB) 15) Metadaten transliterieren (TIB) 16) Erfassung der Strukturmetadaten (SUB) 17) Korrektur des Zentralblattimports (TUB) 18) Bandweise Endkontrolle und Freigabe aller Metadaten (TIB) V) Abschluss und Onlinestellung (SUB, bzw. lokal alle Partner) 19) Automatische Generierung der SICI (SUB) 20) Export der Daten in XML/METS-Format inklusive der Images (SUB) 21) Import in die lokalen DMS bzw. Repositories (GPNTB, SUB, TIB) 22) Rückmeldung der neu hinzugekommenen PURLs

17 Matthias SchulzeBernhard Tempel RusDML-Tool (1) Organisation des komplexen Workflows mit Hilfe des im Rahmen des Projektes entwickelten Softwarepakets (RusDML-Tool) Im Folgenden eine kurze Skizze des Tools –Anforderungen an das Softwarepaket und –Aufgaben, die mit Hilfe des Tools erledigt werden

18 Matthias SchulzeBernhard Tempel RusDML-Tool (2): Anforderungen Plattform-Unabhängigkeit, da Partner weltweit auf das Tool zugreifen müssen Einsatz von Java-Technologie stellt die Plattformunabhängigkeit sicher und auch, dass mittels der Unicode-Kodierung sowohl west- als auch osteuropäische Zeichensätze (inklusive Kyrillisch) innerhalb des Tools Verwendung finden können Zentrale Metadatenverwaltung, d.h. Katalogisieren und Vervollständigung der Metadaten von verschiedenen Standorten aus (z.B. Erstellung der russischen Metadaten in Moskau, Transliterationen in Hannover)

19 Matthias SchulzeBernhard Tempel RusDML-Tool (3): Aufgaben Zentrale Verwaltung der Digitalisate (Images) Import- und Exportschnittstellen für Metadaten (z.B. aus dem Zentralblatt MATH) und für den Import externer Digitalisate Controlling-Mechanismen: welcher Partner ist wie weit mit seinen Arbeiten, welche Zeitschrift ist in welchem Bearbeitungsstadium etc. Integration von Komponenten eines verteilten Workflowmanagements zur Gewährleistung der Verwaltung einer verteilten Produktion und zur Kommunikation zwischen den Partnern: Ablauf der Prozeßschritte, Abbildung von Korrekturschleifen

20 Matthias SchulzeBernhard Tempel RusDML-Tool (4): Aufgaben Komfortable Erfassung und Bearbeitung der Informationen zu den einzelnen Werken: allgemeine Metadaten, hierarchische Strukturdaten der Bände (Jahrgang, Hefte, Artikel) sowie das Matching von logischen (aufgedruckten) und physikalischen (tatsächlichen) Seitenzahlen. Metadatenimport aus unterschiedlichen Quellen auf der Basis des Dateiformates XML z.B. aus dem „Zentralblatt MATH“ sowie dem „Jahrbuch über die Fortschritte der Mathematik (JFM)“ Abspeicherung der erfassten bzw. bearbeiteten Daten - im Hinblick auf eine optimale Archivierbarkeit - im Metadata Encoding and Transmission Standard (METS)- Format (standardisierte Exportmöglichkeiten sind zudem die Formate PICA und UNIMARC)

21 Matthias SchulzeBernhard Tempel RusDML-Tool (5) Der Workflow abgebildet im Tool: Die 22 Arbeitsschritte

22 Matthias SchulzeBernhard Tempel RusDML-Tool (6): Weiterentwicklung Zusammenführung der Entwicklungen im Bereich “Digitale Bibliothek” zu einer modularen Software-Suite Nachnutzung aus folgenden DFG-Projekten: –RusDML (Workflowtool, Metadatentool) –Rise of modern Constitutionalism (Access-Tool, Benutzerstatistik-Tool, Volltextsuche) –DigiZeitschriften (Typo3-Integration) –zvdd (Schnittstellen zum GBV) Sowie –kopal (Langzeitarchivierung- BMBF) –ProPrint (Print on Demand - BMBF) –DigiWunschbuch (Digitization on Demand – SUB)

23 Matthias SchulzeBernhard Tempel TOOLSSERVICESCORE ARCHITECTURE PRODUCTION USAGE G oo bi. META METS-EDITOR / LOGICAL-STRUCTURE / OCR G oo bi. COUNTER PROJECTCOUNTER.ORG / LOGGING / SFX G oo bi. ACCESS IP-RANGES / USER-MANAGEMENT / SHIBBOLETH G oo bi. SEARCH BROWSING / FULLTEXT / HIGHLIGHTING G oo bi. FLOW WORKGROUP-MANAGEMENT / CONTROLLING G oo bi. VISUAL TYPO3 / PDF / CSS / ACCESSIBILITY G oo bi. ARCHIVE METS / TEI / XML Göttingen online-objects binaries G oo bi. PRESERVATION KOPAL / EROMM / EDL G oo bi. PRINT PROPRINT / PRINT ON DEMAND G oo bi. COLLABORATE WEB 2.0 / WIKIPEDIA / DIGITAZATION ON DEMAND G oo bi. PRODUCER SCANNING / IMPORT / WEBDAV

24 Matthias SchulzeBernhard Tempel RusDML-Tool (8): Perspektiven Zielsetzung: eine nutzerfreundliche und alltagstaugliche Softwareumgebung für wesentliche Bereiche der (Massen-)Digitalisierung und der „Digitalen Bibliothek“ –Automatische Importmöglichkeit in die European Digital Library (EDL, TEL) –Zertifizierungsmöglichkeiten des Workflows der Digitalisierung und der digitalen Objekte (Qualität der Scans, der Metadaten etc.) –Open Source (Möglichkeit, eine verteilte Entwickler- community aufzubauen) Derzeitiger Einsatz der Module: –Johannes a Lasco Bibliothek Emden –Universitätsbibliothek Mannheim –Sächsische Landesbibliothek - Staats- und Universitätsbibliothek (SLUB) Dresden

25 Matthias SchulzeBernhard Tempel Transliteration (1) Aufgabe des Partners TIB Im Original in kyrillischer Schrift vorliegende Titel werden transliteriert (Zuordnung Buchstabe zu Buchstabe) Im Zentralblatt MATH wurde immer auch transliteriert, aber nach wechselnden Transliterationstabellen Für RusDML Ergänzung durch Transliteration nach DIN 1460 und ISO 9, so dass im RusDML-Archiv über bis zu drei verschiedene Transliterationsvarianten gesucht werden kann

26 Matthias SchulzeBernhard Tempel Transliteration (2) Verfahren: –anfangs manuell –später mit Transliterationstool als Standalone-Anwendung:

27 Matthias SchulzeBernhard Tempel Transliteration (3) –Inzwischen Integration in das RusDML-Tool; für entsprechende Felder Transliteration auf Knopfdruck:

28 Matthias SchulzeBernhard Tempel Transliteration (4) Warum keine vollautomatische Transliteration? –Teil der Qualitätskontrolle für die erstmals erfassten kyrillischen Metadaten Warum nicht Transliteration erst bei Suche im RusDML- Archiv? –Transliteration kyrillischer Schrift ist keine bijektive Abbildung –Indexierung der bereits transliterierten Daten beschleunigt Suche

29 Matthias SchulzeBernhard Tempel RusDML-Archiv Prototyp beim GDZ: –Einfache Suche (auch nach Klassifikation möglich) –Erweiterte Suche –Browsing –Volltextsuche (OCR-generiert)

30 Matthias SchulzeBernhard Tempel Zugänge zum RusDML-Archiv Jeder Projektpartner und Lizenzgeber erhält eine Kopie des RusDML-Archivs und kann eine eigene Suche implementieren. Geplant: Die in RusDML verbesserten Metadaten werden ins Zentralblatt MATH zurückgeliefert und aus dem Zentralblatt MATH für jeden Artikel auf das RusDML- Archiv verlinkt. Somit kann für die fachlich anspruchsvollste Suche weiterhin das Zentralblatt MATH genutzt werden.

31 Matthias SchulzeBernhard Tempel Kritisches Fazit (1) Quantitativ bleibt RusDML im Förderzeitraum hinter den gesteckten Zielen zurück: –Geplant 1,5 Mio. Seiten zu digitalisierende Seiten, je durch die deutschen Partner und den russischen Partner –Lizenzen liegen momentan vor für ca Seiten –Problematik der Einwerbung von Lizenzen –Digitalisierung nur durch den deutschen Partner SUB Göttingen –GPNTB erhält von RFBR erheblich geringere Förderung als erwartet und beteiligt sich nur an Anreicherung der Metadaten

32 Matthias SchulzeBernhard Tempel Kritisches Fazit (2) Qualitativ erreicht RusDML die gesteckten Ziele: –Kooperative, dezentrale Anreicherung von Metadaten durch alle Partner –Die im Projekt entwickelte technische Infrastruktur zu Workflowverwaltung und verteilter Metadatenbearbeitung (RusDML-Tool) wird für weitere Digitalisierungsprojekte nachgenutzt. –Die Ergebnisse aus dem Projekt RusDML werden als Teil der WDML und des europäischen Kulturerbes Bestand haben. Abschied vom Ideal des weltweit freien Zugangs zu sämtlicher mathematischer Literatur im Rahmen der WDML? Inzwischen wird auch das kostenpflichtige JSTOR auf der Internetpräsentation der WDML aufgeführt:

33 Matthias SchulzeBernhard Tempel Vielen Dank für Ihre Aufmerksamkeit! Haben Sie Fragen, Anmerkungen...? Matthias Schulze Bernhard Tempel


Herunterladen ppt "Matthias SchulzeBernhard Tempel RusDML Ein digitales Archiv russischer mathematischer Zeitschriften DMV-Jahrestagung 2006 Minisymposium 29 – Information,"

Ähnliche Präsentationen


Google-Anzeigen