Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

XML-Clearinghouse, Kolloquium 16. Juni 2003 16. Juni 2003 Uwe Müller Humboldt-Universität zu Berlin Computer- und Medienservice.

Ähnliche Präsentationen


Präsentation zum Thema: "XML-Clearinghouse, Kolloquium 16. Juni 2003 16. Juni 2003 Uwe Müller Humboldt-Universität zu Berlin Computer- und Medienservice."—  Präsentation transkript:

1 XML-Clearinghouse, Kolloquium 16. Juni Juni 2003 Uwe Müller Humboldt-Universität zu Berlin Computer- und Medienservice Arbeitsgruppe Elektronisches Publizieren

2 XML-Clearinghouse, Kolloquium 16. Juni 2003

3 XML-Clearinghouse, Kolloquium 16. Juni 2003 Thema Exemplarischer Aufbau eines Internet-Portals zur Erschließung, Archivierung und Recherche von komplexen Dokumenten mit multimedialen Inhalten unter Nutzung XML-basierter Technologien am Beispiel des Dokumentenservers und der Sammlungsobjekte der Humboldt-Universität Laufzeit: Oktober 2001 bis September 2003 (März 2004) Förderung: Deutsche Forschungsgemeinschaft

4 XML-Clearinghouse, Kolloquium 16. Juni 2003 Agenda Historie und Einordnung Technologischer und Organisatorischer Rahmen Ziele des Projekts Metadaten-Modell Dokumenten-Modellierung Document Management Medienportal Recherche und Datenaustausch Zusammenfassung und Ausblick

5 XML-Clearinghouse, Kolloquium 16. Juni 2003 Elektronisches Publizieren – Dissertationen NDLTD (Networked Digital Library for Theses and Dissertatations) und ETD-Konferenz Digitale Dissertationen (Humboldt-Universität) Dissertationen Online (DFG-Projekt mit HU als Partner)

6 XML-Clearinghouse, Kolloquium 16. Juni 2003 Elektronisches Publizieren – sonstige Projekte Proprint (Humboldt-Universität, SUB Göttingen) GAP (German Academic Publishers) / FIGARO OAI (Open Archives Initiative) OAForum (Open Archives Forum, EU-Projekt) eprints.org DSpace Projekt Langzeitarchivierung (Die Deutsche Bibliothek)

7 XML-Clearinghouse, Kolloquium 16. Juni 2003 Elektronisches Publizeren – Motivation direkte und permanente Verfügbarkeit (Recherchemöglichkeiten, Browsing, Volltexte) Integration heterogener und verteilter Bestände zusätzliche Präsentationsmöglichkeiten (Multimediaobjekte, Lernmodule,...) niedrige Produktionskosten Langzeitarchivierung Lösung der Zeitschriftenkrise

8 XML-Clearinghouse, Kolloquium 16. Juni 2003 Agenda Historie und Einordnung Technologischer und Organisatorischer Rahmen Ziele des Projekts Metadaten-Modell Dokumenten-Modellierung Document Management Medienportal Recherche und Datenaustausch Zusammenfassung und Ausblick

9 XML-Clearinghouse, Kolloquium 16. Juni 2003 Technologische Kernpunkte Verwendung von SGML / XML als Speicherformat Gründe –Langzeitarchivierung –qualifizierte Recherchefähigkeit –automatisierte Weiterverarbeitung –zukünftige Mehrwertdienste Konsequenzen –Konvertierung aus Quellformaten –Unterstützung der Autoren bei der Erstellung –Styles / Skripts zur Präsentation

10 XML-Clearinghouse, Kolloquium 16. Juni 2003 Technologische Kernpunkte (2) zusätzliches Speicherformat zur Präsentation: PDF Digitale Signatur Erfassung der Metadaten Workflow-System

11 XML-Clearinghouse, Kolloquium 16. Juni 2003 Organisatorischer Rahmen gemeinsame Arbeitsgruppe Elektronisches Publizieren von Universitätsbibliothek und Computer- und Medienservice 5 feste Mitarbeiter, 10 Projektmitarbeiter (4 + 6) Verantwortung für Routine- und Projektaufgaben Einbindung der Arbeitsgruppe in andere Zusammenhänge –DINI (Deutsche Initiative für Netzwerkinformation) –NDLTD

12 XML-Clearinghouse, Kolloquium 16. Juni 2003 Agenda Historie und Einordnung Technologischer und Organisatorischer Rahmen Ziele des Projekts Metadaten-Modell Dokumenten-Modellierung Document Management Medienportal Recherche und Datenaustausch Zusammenfassung und Ausblick

13 XML-Clearinghouse, Kolloquium 16. Juni 2003 Ausgangspunkt steigende Zahl elektronischer Publikationen im universitären Bereich heterogene Datenbestände (inhaltlich, formal, strukturell) gesucht: –Standardlösungen für Erschließung, Zugang, Archivierung –anpassbar an Bedürfnisse der Nutzer und an neue Publikationstypen Idee: –Entwicklung eines Portals auf der Basis von XML –Berücksichtigung bibliothekarischer, dokumentarischer und rechentechnischer Gesichtspunkte

14 XML-Clearinghouse, Kolloquium 16. Juni 2003 Portal Zusammenführung verteilter und heterogener Ressourcen zu einer einheitlichen und integrierten Schnittstelle / Oberfläche an unterschiedlichen Nutzergruppen orientierte Sichten (z.B. differenzierte Suchmasken) Portal Datenbestände

15 XML-Clearinghouse, Kolloquium 16. Juni 2003 Hauptziele Multimedia-Erweiterung der bisher verwendeten Technologien –Metadaten (modulares, erweiterbares, hierarchisches Datenmodell; Eingabe- und Verwaltung der Daten) –Dokumenten-Modellierung –Autorenunterstützung (Empfehlungen, Richtlinien, …) –Recherche (in Metadaten und im Volltext) –Digitale Signatur / Wasserzeichen

16 XML-Clearinghouse, Kolloquium 16. Juni 2003 Hauptziele (2) integrative Lösung für heterogene Inhalte (Frontends, Speicherung, Verwaltung, Beschreibung) Entwicklung eines exemplarischen Bibliotheksportals Beispielanwendung: Kustodie, digitale Diathek Aufbereitung der Erfahrungen im Bereich textorientierter Dokumente (Hochschulschriften)

17 XML-Clearinghouse, Kolloquium 16. Juni 2003 Multimedia-Objekte Bilder (Diagramme, Fotos, Vektorgrafiken) mathematische und chemische Formeln, Noten Video-Clips, Audio-Dateien Landkarten 3D-Visualisierungen Textdokumente mit Multimedia-Teilen Standards: MathML, CML, SMIL, SVG, MusicML, VoiceML

18 XML-Clearinghouse, Kolloquium 16. Juni 2003 Arbeitspakete (6 + 1) 1.Untersuchung existierender XML- Standards und DTDs 2.Entwurf eines modularen Dokumentenmodells für die Beschreibung komplexer digitaler Dokumente mit Multimedia- Inhalten 3.Richtlinien und Empfehlungen für Autoren, Schulungskonzept 4.exemplarisches Bibliotheksportal mit fach- bzw. nutzerspezifischen Sichten 5.Rechercheschnittstelle zur Suche in unterschiedlich strukturierten XML-Dokumenten 6.Prüfen und evtl. Anpassen vorhandener Lösungen zur Sicherung Integrität, Authentizität und Urheberrecht digitaler Dokumente mit Multimedia-Inhalten 7.Dokumentation

19 XML-Clearinghouse, Kolloquium 16. Juni 2003 Agenda Historie und Einordnung Technologischer und Organisatorischer Rahmen Ziele des Projekts Metadaten-Modell Dokumenten-Modellierung Document Management Medienportal Recherche und Datenaustausch Zusammenfassung und Ausblick

20 XML-Clearinghouse, Kolloquium 16. Juni 2003 Metadaten beschreiben Dokumente / Objekte (Daten über Daten) diverse Standards und Entwicklungen –Dublin Core –MAB –Marc21 –DLmeta formale Definition in der Regel auch als XSD / DTD Speicherung / Austausch in XML

21 XML-Clearinghouse, Kolloquium 16. Juni 2003 Bisheriges Metadaten-Modell idnumericgebvarchardatumveroeffvarchar titletextgebortvarchardatum_changevarchar titlealttexturlvarcharsprachevarchar titlelangvarcharrvkvarcharmimevarchar titletranstextdnbvarchardoctypevarchar titlealttranstextnofvahrcharsourcevarchar titletranslangvarcharbeschreibungtextkeywords_detext heftnrvarchargutachter1varcharkeywords_entext namevarchargutachter2varcharabstract_detext a_vornamevarchargutachter3varcharabstract_entext a_nachnamevarcharfachbereichvarcharseitenanzahlint a_titelvarchardatumantragvarchar adressevarchardatumvarchar

22 XML-Clearinghouse, Kolloquium 16. Juni 2003 Anforderung für neues Modell modular und erweiterbar für die Beschreibung heterogener Ressourcen Ermöglichung von Mehrfach-Werten für hierarchische Strukturen geeignet (Zeitschriften, Konferenzbände, MM-Teile in einem Dokument), Abbildung von Beziehungen zwischen Ressourcen spezifischer Publikationstyp über XML-Datei konfigurierbar (DB-Abfragen, Darstellung eines Metadatensatzes als XML-Instanz) generische Erfassungs-, Recherche- und Browsing- Schnittstellen auf der Basis einer XML-Konfiguration

23 XML-Clearinghouse, Kolloquium 16. Juni 2003 Modulares Datenmodell für Metadaten Grunddaten Spezifische Daten 1 Res_ID Spezifische Daten 2 Res_ID Erweiterte Daten A Res_ID Erweiterte Daten B Res_ID n n /1

24 XML-Clearinghouse, Kolloquium 16. Juni 2003 Thesis Res_ID Date_Exam Date_Acc Referee Res_ID Person_ID Journal Res_ID Number Year Text Res_ID IsPartOf Res_ID Contain_ID Title Res_ID Title Lang_ID Location Res_ID Schema Identifier Format_ID Description Res_ID Type Content Lang_ID Resource Rights Type_ID OPAC_ID State Created Modified Deleted Type Res_ID DC_Type Name Note PartOf_ID Unit Author Res_ID Person_ID Person Lastname Firstname Institution Name Address PartOf_ID Publisher Res_ID Institut_ID Subject Res_ID Key_ID Keyword Schema Value Konferenz - Paper, Zeitschrift - Artikel Zeitschrift Monographie Dissertation, Habilitation Editor Res_ID Person_ID Konferenz, Zeitschrift

25 XML-Clearinghouse, Kolloquium 16. Juni 2003 Spezifikation eines Metadaten-Modells mit XML XML XSD Eingabe-Frontend Recherche-Frontend Datenmodell SQL-Queries Metadaten- DB

26 XML-Clearinghouse, Kolloquium 16. Juni 2003 XML-Konfiguration der Datenbank (Beispiel) Person_ID Resource_ID...

27 XML-Clearinghouse, Kolloquium 16. Juni 2003 XML-Konfiguration der Eingabemaske (Beispiel) 1 p......

28 XML-Clearinghouse, Kolloquium 16. Juni 2003 Beispiel für eine Eingabe-Frontend

29 XML-Clearinghouse, Kolloquium 16. Juni 2003 Agenda Historie und Einordnung Technologischer und Organisatorischer Rahmen Ziele des Projekts Metadaten-Modell Dokumenten-Modellierung Document Management Medienportal Recherche und Datenaustausch Zusammenfassung und Ausblick

30 XML-Clearinghouse, Kolloquium 16. Juni 2003 Dokumenten-Modellierung XML-basiert xDiML (Dissertation Markup Language) –an der HU entwickelt (aus der ETD-DTD von Virginia Tech) –modularer Aufbau Erzeugungssystem für modulare DTDs –erzeugt auf Knopfdruck individuelle DTD aus vorgegebenen Modulen und einer benutzerdefinierten Auswahl –Generierung von Styles und Dokumentationen

31 XML-Clearinghouse, Kolloquium 16. Juni 2003 Architektur des Erzeugungssystems

32 XML-Clearinghouse, Kolloquium 16. Juni 2003 DTD-Erzeugungssystem: Details Vortrag von Jakob Voß am 6. Februar 2003 im Kolloqium des XML-Clearinghouse: Verwaltung dokumentenorientierter DTDs für den Dokument- und Publikationsserver der Humboldt-Universität

33 XML-Clearinghouse, Kolloquium 16. Juni 2003 Beschreibung von MM-Inhalten bisher –als Ersatz für die 1998 entwickelte SGML-DTD (DiML) im Einsatz –keine wesentlichen funktionalen Erweiterungen aber –durch modularen Ansatz lassen sich beliebige andere DTDs (z.B. Standards für Multimedia- Objekte) einbinden –aus der DTDBase können Dokumentationen und Styles z.B. zur Präsentation in HTML erzeugt werden

34 XML-Clearinghouse, Kolloquium 16. Juni 2003 Agenda Historie und Einordnung Technologischer und Organisatorischer Rahmen Ziele des Projekts Metadaten-Modell Dokumenten-Modellierung Document Management Medienportal Recherche und Datenaustausch Zusammenfassung und Ausblick

35 XML-Clearinghouse, Kolloquium 16. Juni 2003 Document Management bisherige Technologie: statische Speicherung von SGML und HTML im Dateisystem –Gründe Performance fehlende Technologien für SGML –Probleme zusätzlicher Konvertierungsschritt Fehlerquelle Migrationsaufwand bei Änderung von Styles

36 XML-Clearinghouse, Kolloquium 16. Juni 2003 Document Management (2) Ziel: Speicherung der Dokumente in einem DMS (Document Management System) –XML-basiert (validierte Dokumente) –dynamisches Erzeugen der HTML-Sichten –qualifizierte Volltextsuche in unterschiedlich strukturierten XML-Dokumenten –Schnittstellen für Verwaltungs- und Portalfunktionen –Zugriff auf Untereinheiten eines XML-Dokuments (Performance!)

37 XML-Clearinghouse, Kolloquium 16. Juni 2003 Document Management (3) Lösung: Content Management Suite der Firma Sörman / CORENA –basiert auf POET-Datenbank –Server: Solaris –Client: Windows –Komponenten-Konzept –Versionierung / Varianten –LDAP-Authentifizierung –Verity Search Engine –JavaSDK für Input und Output über eine Web- Schnittstelle (plattformunabhängig)

38 XML-Clearinghouse, Kolloquium 16. Juni 2003 CMS Content Server (Solaris) Browser Tomcat/JSPCocoon/XSLT OIDDOMXMLOID TOCHTMLLinkListe Nodes Suche OQL Tomcat/JSP CMS Content Client (Windows) PubSpecXML Link Browser XML DMS-Anbindung – Funktionsweise

39 XML-Clearinghouse, Kolloquium 16. Juni 2003 DMS-Anwendung: Prototyp

40 XML-Clearinghouse, Kolloquium 16. Juni 2003 Agenda Historie und Einordnung Technologischer und Organisatorischer Rahmen Ziele des Projekts Metadaten-Modell Dokumenten-Modellierung Document Management Medienportal Recherche und Datenaustausch Zusammenfassung und Ausblick

41 XML-Clearinghouse, Kolloquium 16. Juni 2003 Medienportal Unterstützen des Lehrens und Lernens an der Universität einheitliche Schnittstelle (Portal) zu multimedialen Ressourcen Metadaten-Modellierung (Recherche!) unterschiedliche Datenpools –Sammlungsobjekte (Kustodie) –Diathek –Video-Datenbank –Portrait-Datenbank –Dokumentenserver –OPAC

42 XML-Clearinghouse, Kolloquium 16. Juni 2003 Medienportal (2) Funktionen –Einstellen und Bearbeiten, Verschlagwortung, Präsentation und Archivierung von Studienmaterialien Semesterapparate, Skripten, Präsentationen, Referate –Einbeziehung von Objekten aus importierten oder referenzierten Datenpools –persönliche Arbeitsumgebung mit entsprechenden Zugriffsrechten –Authentifizierung über NIS

43 XML-Clearinghouse, Kolloquium 16. Juni 2003 Agenda Historie und Einordnung Technologischer und Organisatorischer Rahmen Ziele des Projekts Metadaten-Modell Dokumenten-Modellierung Document Management Medienportal Recherche und Datenaustausch Zusammenfassung und Ausblick

44 XML-Clearinghouse, Kolloquium 16. Juni 2003 OAI-PMH Protokoll zum Austausch von Metadaten der Open Archives Initiative (http://www.openarchives.org), Harvest-Ansatzhttp://www.openarchives.org sehr einfaches Protokoll, sechs unterschiedliche Anfragetypen basiert auf HTTP / XML Austausch beliebiger Metadatenformate Data Provider –Skript zwischen Datenbank und Web (z.B. Perl, PHP,...) –antwortet auf OAI-PMH-Anfragen Service Provider –sammelt Metadaten mit OAI-PMH ein –speichert sie in eigener DB –bietet Service nach außen an (Suchmaschine, Fachportal,...)

45 XML-Clearinghouse, Kolloquium 16. Juni 2003 OAI-PMH (2) Service Provider e-print Data Provider e-prints e-print Data Provider Images e-print Data Provider OPAC e-print Data Provider Museum e-print Data Provider Archive Requests: Identify ListMetadataformats ListSets ListIdentifiers ListRecords GetRecord Responses: General information Metadata formats Set structure Record identifier Metadata Data Provider Harvester Repository

46 XML-Clearinghouse, Kolloquium 16. Juni 2003 OAI-PMH – Einsatz im XML-Portal Data Provider für Dokumentenserver der HU Mitarbeit in der DINI-Arbeitsgruppe – Empfehlungen für deutsche Data Provider EU-Projekt OAForum (UKOLN Bath, CNR Pisa, HU Berlin) eigener Service Provider –Schnittstelle für eigene Daten –Integration weiterer Archive Portal Austausch von Metadaten mit anderen Datenpools an der Universität

47 XML-Clearinghouse, Kolloquium 16. Juni 2003 Recherche Suche in Metadaten –allgemeine und spezialisierte Suchmasken entsprechend Metadatenmodell Volltextsuche –qualifiziert in XML-Elementen –Suchkriterien entsprechend verwendeter DTD- Module –Verity Search Engine

48 XML-Clearinghouse, Kolloquium 16. Juni 2003 Integration in MetaLib Bibliotheks-Software von ExLibris stellt Portal-Funktionen bereit kann neben OPAC viele weitere Ressourcen einbinden SFX-Technologie / OpenURL OAI-Service-Provider dient als Aggregat für Publikationsserver

49 XML-Clearinghouse, Kolloquium 16. Juni 2003 Agenda Historie und Einordnung Technologischer und Organisatorischer Rahmen Ziele des Projekts Metadaten-Modell Dokumenten-Modellierung Document Management Medienportal Recherche und Datenaustausch Zusammenfassung und Ausblick

50 XML-Clearinghouse, Kolloquium 16. Juni 2003 Zusammenfassung modulares (MM-fähiges) Metadatenmodell auf XML basierende Konfigurations- und Generierungsfunktionen modulares (MM-fähiges) Dokumentenmodell Erzeugungssystem für DTDs XML-basiertes Document Management System modulare Rechercheschnittstelle (Metadaten und Volltext) Integration ins Medienportal und in MetaLib

51 XML-Clearinghouse, Kolloquium 16. Juni 2003 Ausblick Anwendung des Metadatenmodells auf andere Publikationstypen (u.a. MM-Objekte) Anwendung des DTD-Erzeugungssystems auf Dokument-DTDs mit multimedialen Inhalten prototypische Portal-Implementation LDAP-Authentifizierung für DMS-Zugriff Signaturen / Wasserzeichen für MM-Objekte

52 XML-Clearinghouse, Kolloquium 16. Juni 2003 Vielen Dank... Fragen? Uwe Müller Humboldt-Universität zu Berlin Computer- und Medienservice Arbeitsgruppe Elektronisches Publizieren Informationen:


Herunterladen ppt "XML-Clearinghouse, Kolloquium 16. Juni 2003 16. Juni 2003 Uwe Müller Humboldt-Universität zu Berlin Computer- und Medienservice."

Ähnliche Präsentationen


Google-Anzeigen