Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

DSpace -Eine Einführung

Ähnliche Präsentationen


Präsentation zum Thema: "DSpace -Eine Einführung"—  Präsentation transkript:

1 DSpace -Eine Einführung
IT-Zertifikat :Dedizirte Systeme Milena Kujawa

2 In heutiger Sitzung: Gliederung Was ist DSpace? Geschichte von DSpace
Techniche Grundlagen Architektur Datenmodell Rechtevergabe

3 Was ist DSpace? Open Source Software für einen Dokumentenserver
DSpace is a platform that allows you to capture items in any format – in text, video, audio, and data. It distributes it over the web. It indexes your work, so users can search and retrieve your items. It preserves your digital work over the long term.

4 Was ist DSpace? DSpace wird meist in Universitäten, Bibliotheken und Forschungseinrichtungen für ein "Institutional Repository" eingesetzt. Es ermöglicht vor allem drei Hauptaufgaben: Erfassung Weiterverbreitung Langzeitarchivierung von digitalen Ressourcen Langzeitspeicherung, d.h. hilft Einrichtungen ihre Forschungsergebnisse und Veröffentlichungen über großen Zeitraum zu bewahren Bedrohte Dokumente können so in einer Form bewahrt werden, ebenso ganze Museen geschaffen werden Bei der BSD-Lizenz handelt es sich um eine Lizenz für freie Software. Entstanden ist die Lizenz an der University of California, Berkeley, und BSD steht für Berkeley Software Distribution. Software unter der BSD-Lizenz darf frei verwendet werden und es ist erlaubt, sie zu kopieren, zu verändern und zu verbreiten. Einzige Bedingung der BSD-Lizenz ist, dass der Copyright-Vermerk des ursprünglichen Programms nicht entfernt werden darf. Somit eignet sich unter der BSD-Lizenz stehende Software auch gut als Vorlage für kommerzielle (teilproprietäre) Produkte, wie es z. B. bei JunOS der Fall ist, dem Router-Betriebssystem der Firma Juniper Networks. Dieses Lizenzmodell unterscheidet sich von der GNU General Public License (GPL) darin, dass es kein Copyleft enthält: Ein Programmierer, der ein unter einer BSD-Lizenz veröffentlichtes Programm verändert und dann verbreitet, ist nicht verpflichtet, den Quellcode seines veränderten Programms mitzuveröffentlichen. Er ist auch nicht verpflichtet, das Ergebnis seiner Änderungen wiederum unter der BSD-Lizenz zu veröffentlichen.

5 What can DSpace be used for?
DSpace unterstützt eine Vielzahl von digitalen Objekten beliebigen Formats. Einsetzbar für: Journal papers Data sets Electronic theses Reports Conference posters Videos Images Articles Preprints, e-prints Technical Reports Working Papers Conference Papers E-theses Audio/Video Datasets - Statistical, geospatial Images - Visual, scientific Teaching material - Lecture notes, visualizations, simulations Digitized library collections

6 Metadatenformat (Standard) Qualified Dublin Core
Was kann DSpace? Zu jedem Dokument deskriptive, administrative und strukturelle Metainformationen Metadatenformat (Standard) Qualified Dublin Core und diverse weitere (METS/MODS) Benutzerverwaltung mit Nutzern und Gruppen Nutzer können sich selbst registrieren integriertes System zur Authentifizierung und Authorisierung Persistent Identifier BSD-Lizenz DC als Metadatenstandard und diverse weitere (METS/MODS) Benutzerverwaltung mit Zuweisung von Rechten und Aufgaben, Benutzer zu Gruppen zusammenfassbar Bei der BSD-Lizenz handelt es sich um eine Lizenz für freie Software. Entstanden ist die Lizenz an der University of California, Berkeley, und BSD steht für Berkeley Software Distribution. Software unter der BSD-Lizenz darf frei verwendet werden und es ist erlaubt, sie zu kopieren, zu verändern und zu verbreiten. Einzige Bedingung der BSD-Lizenz ist, dass der Copyright-Vermerk des ursprünglichen Programms nicht entfernt werden darf. Somit eignet sich unter der BSD-Lizenz stehende Software auch gut als Vorlage für kommerzielle (teilproprietäre) Produkte

7 Geschichte von DSpace Der Beginn: 2000 Software Versionen:
Gemeinschaftsentwicklung von Massachusetts Institute of Technology (MIT) und den HP Labs Software Versionen: Version 1.0 – 8th November 2002 Version th May 2003 Version 1.2 – 13th August 2004 Version 1.3 – 3rd August 2005 Version 1.4 – 26th July 2006 Version 1.5 – 25th March 2008 Geschichte DSpace ist eine von der Mellon Foundation geförderte Gemeinschaftsentwicklung vom Massachusetts Institute of Technology (MIT) und den HP Labs, der Forschungsabteilung von Hewlett-Packard. Die erste Version wurde im September 2002 veröffentlicht. Die letzte stabile Version wurde am 10. September 2008 veröffentlicht.

8 Dspace Foundation DSpace Federation entstand 2007 als non-profit organization zur Unterstützung der immer wachsender Gemeinde der DSpace Benutzer. koordiniert das gemeinschaftliche Entwicklungsmodell und damit die Herausgabe neuer Versionen Seit 2007 gibt es auch eine Foundation “Collect and organize an institution intellectual production“ KOORDINATION die DSpace Federation koordiniert das gemeinschaftliche Entwicklungsmodell und damit die Herausgabe neuer Versionen

9 eine Gruppe von Kernentwicklern Feedback aus Anwenderkreisen erwünscht
DSpace Foundation eine Gruppe von Kernentwicklern Feedback aus Anwenderkreisen erwünscht Austausch über Newsgroups, Wiki, Anwendertreffen Plattform: Sourceforge-Projekt Gruppe von Kernentwicklern, die Quellcode ändern können Promotion von DSpace via newsletter, website, marketing materials etc Austausch über Wiki, Anwendertreffen und Newsgroups Jeder kann mit Kommentaren, Wünschen, Feed-Back zur Entwicklung beitragen - Feedback aus Anwenderkreisen erwünscht - Plattform: sehr aktives Sourceforge-Projekt ca. 500 Einrichtungen weltweit als Benutzer (laut Dspace)

10 Technische Grundlagen
- Unix Betriebssystem (empfohlen, Windows-Server möglich) - in Java und JavaServer Pages (JSP) geschrieben - verwendet eine relationale Datenbank (PostgreSQL, Oracle) - Apache Tomcat - Apache Lucene als Index-/ Suchmaschine - OAI-PMH-Schnittstelle - unterstützte Metadatenformate: DC, QDC, METS, MODS, MPEG21-DIDL, XEpicur - Persistent Identifier: CNRI Handle oder URN - sessionbasierte Statistik durch integriertes Logsystem - Vollständige Benutzerverwaltung mit Nutzern und Gruppen ein System zur Authentifizierung und Authorisierung enthalten prinzipiell unabhängig vom Betriebssystem , unix-artiges empfohlen javabasierte Open Source Software Verwendet relationale Datenbank; Unterstützt SQL und Oracle DSpace läuft mit Apache Tomcat und nutzt Apache LUCENE als Text Search Engine DSpace implementiert das OAIS-Modell (Open Archival Information System Model) nutzt Unicode :- Persistent Identifier: CNRI Handle oder URN integrierte, sessionbasierte Statistik : Möglichkeit des Erzeugen von integrierte, sessionbasierte Statistik aufgrund von integriertem Logsystem

11 Persistent Identifier
Eindeutige, dauerhafte, ortsunabhängige Bezeichner (Identifikator) für eine Ressource bzw. digitale Inhalte Ähnlich DNS (Domain Name System), also Verfahren zur Auflösung von Namensräumen z.B. URN (Uniform Resource Name) Jeder Ressource wird ein dauerhafter Identifikator zugewiesen Ortsunabhängig Eindeutig Nicht direkt aufrufbar: Übersetzung in URLs Handle System Handle (für „Griff“ oder „Henkel“) bezeichnet in der Informatik einen Identifikator (eindeutiger Objektschlüssel) für digitale Objekte. Im Gegensatz zu einem Zeiger wird ein Handle durch ein anderes System verwaltet (z. B. Filesystem, Datenbank) und stellt daher eine abstrakte Referenz dar, die nicht direkt mit dem wirklich zugeteilten Speicher in Verbindung steht. Im engeren Sinne ist das Handle System eine Anwendung zur Vergabe und Verwaltung von Identifikatoren im World Wide Web. Ähnlich wie das Domain Name System bedeutet Handle in diesem Sinne ein Verfahren zur Auflösung von Namensräumen. Ein weiteres System sind die PURL (Persistent URLs). -ein Weg, konstante, persistente (= bestehen bleibende) Verweise auf Inhalte von Webseiten bereitzustellen, während die tatsächlichen Adressen der Seiten variabel bleiben können

12 Persistent Identifier
Können nicht direkt aufgerufen werden, sondern müssen in URLs übersetzt werden Handle-System: System zur Vergabe und Verwaltung von Identifikatoren und ist so eine abstrakte Referenz, die nicht direkt mit dem wirklich zugeteilten Speicher in Verbindung steht Digital Object Identifier (DOI) baut auf Handle-System auf und wird vor allem für Online-Artikel von wissenschaftlichen Fachzeitschriften verwendet Eine entsprechende Anwendung von Handles, die im deutschsprachigen Raum bekannter ist, sind Digital Object Identifiers (DOI). Persistente URLs - Das Handle System DSpace verwendet das CNRI Handle System, um seine Ressourcen (Bereiche, Teilbereiche, Sammlungen, Dokumente, Bündel und Dateien) mit persistenten Identifiern zu versehen. Jede DSpace-Instanz benötigt eine eigene Kennung (prefix) von CNRI.

13 Architektur DSpace System besteht aus drei Schichten:
3-Schichten-Modell der DSpace-Architektur: Anwendungsebene Verwaltungsebene Speicherebene

14 Storage Layer Storage Layer: Speicherung
physikaliche Datenspeicherung (Content und Metadaten) Speicherung (Storage Layer): betrifft die physikalische Speicherung von Metadaten und Inhalt ??? DSpace uses a relational database to store all information about the organization of content, metadata about the content, information about e-people and authorization, and the state of currently-running workflows.

15 Business Logic Layer Geschäftslogistik
Verwaltung von Benutzer(gruppen), Rechtevergabe, Content, Workflow Business Logic Layer: Geschäftslogistik Verwaltung von Benutzer(gruppen), Rechtevergabe, Content, Workflow verwaltet Inhalt, Benutzer und Gruppen, Rechte und Geschäftsgänge Logsystem, Basis auch für Statistik Handle-Manager verwaltet PI (CNRI-Handle bzw. URN) Zuordnung von Nutzern und Gruppen sowie deren Rechte zu Dokumenten Bearbeitung von akzeptierten Formaten (Bitstreamformatregistry) Bearbeiten von DC-Elementen Akzession und Geschäftsgänge [Bearbeiten] Dokumente können per Stapelverarbeitung (Batch-Import) oder einzeln über das Webinterface eingespielt werden. Das Einspielen eines Dokumentes ist ein Prozess, in dem das Dokument automatisch, z. B. durch das Hinzufügen von Metadaten wie Zeitstempeln, bearbeitet wird. Zudem können Dokumente einen Geschäftsgang, in dem bis zu drei Bearbeitungsschritte definiert werden, durchlaufen. ??? The business logic layer deals with managing the content of the archive, users of the archive (e-people), authorization, and workflow

16 Application Layer Anwendungsschicht
die Komponenten, mit denen eine DSpace-Instanz mit der Außenwelt kommuniziert, z. B. Webinterface, OAI-PMH-Schnittstelle The DSpace Web UI is the largest and most-used component in the application layer. Two versions: JSPUI: Built on Java Servlet and JavaServer Page technology XMLUI (Manakin): Built on XML and Cocoon technology Anwendungsschicht (Application Layer): die Komponenten, mit denen eine DSpace-Instanz mit der Außenwelt kommuniziert, z. B. Webinterface, OAI-PMH-Schnittstelle (Protocol for Metadata Harvesting - Einsammeln und Weiterverarbeiten von Metadaten) Application Layer: Anwendungsschicht in Form von komandozeilenorientierten Tools oder Web UI (Webfrontend), OAI-PMH-Schnittstelle (Open Archive Initiative Protocol for Metadata Harvesting -> OAIster) -> in diesem Sinne auch die „Kommunikationsschicht“

17 Ein Dokument besteht aus:
Datenmodell Ein Dokument besteht aus: Metadaten Bündel (ORIGINAL / LICENCE / TEXT / THUMBNAILS) Bitstreams Bereiche (Communities): administrative/logische Gruppierung von einer oder mehreren Sammlungen z.B. Fakultäten, Institute an einer Uni, Schulen, Forschungszentren Teilbereiche (Subcommunities): Sammlungen (Collections): Gruppierung von Einheiten die sinngemäß zusammenhängen (Metadaten) Dokumente (Items): enthält Metadaten eines Dokuments und ein oder mehrere Bundles Bündel (Bundles): Bündel von Bitstreams Auf diese Objekte mit ihren Benutzern und Gruppen greift das Rechtesystem zurück (Löschen, Bearbeiten, Lesen etc.) So z.B. Metadaten eines Objektes für alle sichtbar, aber die zum Dokument gehörigen Dateien nur bestimmten Benutzern

18 DATENSTRUKTUR: Die Art, in der Daten in DSpace organisiert sind, spiegelt die Struktur einer Organisation wider. Die Einheiten sind: Bereiche (Communities) Teilbereiche (Subcommunities) Sammlungen (Collections) Dokumente (Items) Bündel (Bundles) ORIGINAL - enthält die ursprünglich eingereichten Dateien. THUMBNAILS - Thumbnails (Miniaturbilder) von eingereichten Bildern, zur Anzeige in Übersichten. TEXT - extrahierter Text aus den eingereichten Dateien LICENSE - Lizenzbestimmungen unter denen eine Ressource veröffentlicht wurde CC LICENSE - Creative Commons Lizenz, falls die Ressource unter solcher veröffentlicht wurde Metadaten Dateien Bereiche und Teilbereiche sind Container für Teilbereiche und Sammlungen. Sammlungen sind Container für Dokumente. Ein Dokument setzt sich aus einem Metadatensatz und Dateien zusammen. Die Dateien werden in Bündeln organisiert. Nicht alle Bündel sind für den Benutzer sichtbar. Community = Fachgebiet, Institut, Fakultät (Sub-Communities) usw. Collection = Inhalts-Klassen, z.B. Dissertationen, E-Books, Berichte (eine Collection kann mehreren Communities zugeordnet sein) Item = „basic archival elements“ in rel. DB, die durch Metadaten im Dublin Core „Minimalstandard“ beschriebenen Dokumente (ein Item gehört zu einer Collection) --> Communities, Collections und Items haben Persistent Identifier Bundle = Container für Lizenzen (LICENSE) = deposit license that the submitter granted the host organization, (CC_LICENSE) = distribution license - Creative Commons license if associated, Originaldateien (ORIGINAL) = bundle with the original, deposited bitstreams, THUMBNAILS of any image bitstreams, TEXT = extracted full-text of bitstreams in original, for indexing

19 Metadaten Descriptive Metadata:
neben dem DC-Schema (default), basierend auf dem Library Application Profile weitere Konfigurationsmöglichkeiten für jedes Item. Communities und Collections werden einfacher beschrieben, bspw. mit Name und Beschreibung Administrative Metadata: Metadaten zu Herkunft, Archivierung, Authorisierung. Bitstream-Größe, MIME-Type usw. Structural Metadata: Die Struktur eines Items und die Beziehungen zwischen dessen Bitstreams zwecks Ausgabe / Präsentation an den End-User. Drei Arten von Metadaten des archivierten Materials: Metadaten werden teilweise vom Benutzer, teilweise vom System vergeben. ???? Bitstreams besitzen neben technischen Daten auch eine „sequence-ID“, um einen „persistent“ bitstream identifier produzieren zu können

20 Benutzer und Gruppen Benutzer werden von Systemadministrator verwaltet
Administration Veröffentlichungen Rechte+Aufgaben Benutzer zu Gruppen zusammengefasst Rechte+Aufgaben Gruppe Anonymus Administratorengruppe Benutzer [Bearbeiten] Benutzer werden in DSpace benötigt, wenn jemand eine besondere Rolle übernehmen will: Administration, Veröffentlichung von Dokumenten, Bearbeitung von Dokumenten im Rahmen des Geschäftsgangs, Supervision und wenn man den Neuerscheinungsdienst benutzen will. Der Benutzer registriert sich mit seiner -Adresse selbst und verwaltet auch seine Daten und sein Passwort. Der Systemadministrator kann in die Benutzerverwaltung eingreifen, Benutzer hinzufügen, löschen und bearbeiten, jedoch keine Passwörter vergeben. Gruppen [Bearbeiten] Benutzer können zu Gruppen zusammengefasst werden. Diesen Gruppen können wie auch einzelnen Benutzern Rechte und Aufgaben zugewiesen werden. Als besondere Gruppen gibt es die Administratorengruppe und die Gruppe Anonymous. Per default ist jeder Benutzer, der sich nicht am System anmeldet, der Gruppe Anonymous zugeordnet. Gruppen können Benutzer und Gruppen enthalten.

21 hinzufügen, löschen, bearbeiten und lesen von Objekten
Rechtevergabe hinzufügen, löschen, bearbeiten und lesen von Objekten eigene Lizenz und Creative Commons konfigurierbar DSpace Rechtesystem assoziiert Aktionen auf Objekte mit Benutzern und Gruppen. Objekte sind hierbei: Bereiche und Teilbereiche, Sammlungen, Dokumente, Bündel, einzelne Dateien. Aktionen beziehen sich auf das Hinzufügen, Löschen, Bearbeiten und Lesen dieser Objekte. Durch diese Trennung ist es zum Beispiel möglich, dass die Metadaten zu einem Dokument für alle sichtbar sind, während die zum Dokument gehörigen Dateien nur einem eingeschränkten Benutzerkreis zur Verfügung stehen. Creative Commons (englisch, ‚schöpferisches Gemeingut‘, ‚Allmende‘) ist eine gemeinnützige Gesellschaft, die im Internet verschiedene Standard-Lizenzverträge veröffentlicht, mittels derer Autoren an ihren Werken, wie zum Beispiel Texten, Bildern, Musikstücken usw., der Öffentlichkeit Nutzungsrechte einräumen können. Anders als etwa die von der Freie-Software-Gemeinde bekannte GPL sind diese Lizenzen jedoch nicht auf einen einzelnen Werkstyp zugeschnitten, sondern für beliebige Werke anwendbar, deren Schutz sich aus dem Urheberrecht ableiten lässt. Ferner gibt es eine starke Abstufung der Freiheitsgrade: von Lizenzen, die sich kaum vom völligen Vorbehalt der Rechte unterscheiden, bis hin zu Lizenzen, die das Werk in die Public Domain stellen, das heißt, bei denen auf das Urheberrecht so weit wie möglich verzichtet wird.

22 Suchmaschine Lucene Browsen Suchfunktionen
Stichwortsuche und erweiterte Suchfunktionen Browsen Search & Browse - Eine Suche (-> Lucene) ist in den Metadaten oder im Volltext mgl., ebenso - das browsen durch Indices (Titel, Autor, Datum, Thema) des gesamten Archivs, oder einzelnen Communities oder Collections. Die Konfiguration von Lucene - aus welchen Metadaten Indices gebildet werden sollen - ist möglich. Suche [Bearbeiten] Zum Erzeugen von Indices und dem Durchsuchen selbiger benutzt DSpace die Suchmaschine Lucene. Dem Benutzer steht eine einfache Stichwortsuche und eine erweiterte Suche zur Verfügung. In der einfachen Suche werden die aus den Metadaten und den Volltexten extrahierten Textelemente durchsucht. In der erweiterten Suche hat der Benutzer die Möglichkeit nach bestimmten Elementen zu suchen und diese logisch zu verknüpfen. Browsen [Bearbeiten] Als weiteren Einstieg kann der Benutzer im Bestand nach Titeln, Autoren und Datum browsen. Die Auflistung der Dokumente ist abhängig von der Hierarchieebene, in der sich der Benutzer befindet.

23 Praktisches Beispiel mit Live CD
Praxis Praktisches Beispiel mit Live CD


Herunterladen ppt "DSpace -Eine Einführung"

Ähnliche Präsentationen


Google-Anzeigen