Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Verteilte Informationssysteme für die Wissenschaften (und ihre Vernetzung) Michael Hohlfeld Die Zukunft des wissenschaftlichen.

Ähnliche Präsentationen


Präsentation zum Thema: "Verteilte Informationssysteme für die Wissenschaften (und ihre Vernetzung) Michael Hohlfeld Die Zukunft des wissenschaftlichen."—  Präsentation transkript:

1 Verteilte Informationssysteme für die Wissenschaften (und ihre Vernetzung) Michael Hohlfeld <hohlfeld@uni-oldenburg.de> Die Zukunft des wissenschaftlichen Publizierens Der Wissenschaftler im Dialog mit Verlag und Bibliothek 28.- 30. November 2001 Forschungszentrum Jülich

2 Übersicht Ein kleine EinführungEin kleine Einführung verteilte Informationssystemeverteilte Informationssysteme aktuelle Entwicklungen / erste Ergebnisse:aktuelle Entwicklungen / erste Ergebnisse: –Das Projekt CARMEN –Das Projekt Open Archives –Das Projekt SINN Schlußbemerkungen zum wissenschaftlichen PublizierenSchlußbemerkungen zum wissenschaftlichen Publizieren Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

3 Einführung Aufgabe des Managements wissenschaftlicher Fachinformationen ist die Bereitstellung aller benötigten Informationen zur aktuellen wissenschaftlichen ForschungAufgabe des Managements wissenschaftlicher Fachinformationen ist die Bereitstellung aller benötigten Informationen zur aktuellen wissenschaftlichen Forschung Zum BeispielZum Beispiel –aktuelle Forschungsergebnisse von anderen Wissenschaftlern –Daten und Fakten –Adressen von Kollegen –Hinweise auf Tagungen Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

4 Informationsmenge Informationen können im digitalen Zeitalter von beliebigen Erzeugern im beliebigen Umfang überall auf der Welt ins Netz gestellt werdenInformationen können im digitalen Zeitalter von beliebigen Erzeugern im beliebigen Umfang überall auf der Welt ins Netz gestellt werden wissenschaftliche Fachinformation sind nur ein sehr kleiner Teil der verfügbaren Informationsmengewissenschaftliche Fachinformation sind nur ein sehr kleiner Teil der verfügbaren Informationsmenge nicht die Verbreitung der Information, sondern das Retrieval bildet den Engpassnicht die Verbreitung der Information, sondern das Retrieval bildet den Engpass Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

5 Zentrale Suchmaschinen Suchmaschinen sollen helfen, Informationen im WWW zu finden Suchmaschinen sollen helfen, Informationen im WWW zu finden die bekannten Suchmaschinen sind aber nicht wissenschaftsspezifisch ausgelegt, liefern überwiegend irrelevante Informationendie bekannten Suchmaschinen sind aber nicht wissenschaftsspezifisch ausgelegt, liefern überwiegend irrelevante Informationen –decken einerseits einen viel zu großen Suchraum ab, –erreichen andererseits nicht eine ausreichende Suchtiefe zentrale Systeme benötigen große Rechenleistungzentrale Systeme benötigen große Rechenleistung Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

6 Verteilte Informationssysteme Verteilte (fachspezifische) Informationssysteme sind eine Lösung dieses Problems Verteilte (fachspezifische) Informationssysteme sind eine Lösung dieses Problems nutzen die relevanten (fachspezifischen) Webserver als verteilte Datenbank und machen die dort verfügbaren Informationen zugänglichnutzen die relevanten (fachspezifischen) Webserver als verteilte Datenbank und machen die dort verfügbaren Informationen zugänglich durch diese Beschränkung wird die Relevanz und Qualität sichergestelltdurch diese Beschränkung wird die Relevanz und Qualität sichergestellt Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

7 Verteilte Informationssyteme Weitere Vorteile:Weitere Vorteile: –Inhalte verbleiben auf den Servern ihrer Erzeuger, diese behalten so die Kontrolle –verteilte Systeme sind beliebig skalierbar Beispiele für solche verteilten Informationssysteme sind:Beispiele für solche verteilten Informationssysteme sind: –PhysNet für die Physik –PhysNet für die Physik –MareNet für die Meeresforschung –MareNet für die Meeresforschung –Math-Net für die Mathematik –Math-Net für die Mathematik Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

8 Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

9 Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

10 Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

11 Metadaten verteilte Informationsysteme sind nur dann sinnvoll nutzbar, wenn die darin enthaltenden Informationen strukturiert aufbereitet und damit recherchierbar sindverteilte Informationsysteme sind nur dann sinnvoll nutzbar, wenn die darin enthaltenden Informationen strukturiert aufbereitet und damit recherchierbar sind gemeinsame Semantik aller heterogenen Quellengemeinsame Semantik aller heterogenen Quellen z.B. der Dublin-Core-Metadatensatz z.B. der Dublin-Core-Metadatensatz OAi-Protokoll als RealisierungOAi-Protokoll als Realisierung Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

12 Das Projekt CARMEN* * Content Analysis, Retrieval and MetaData: Effective Networking beschäftigt sich mit der Weiterentwicklung der Inhaltserschließung durch neue Verfahrenstechniken mit starker Verbindung zum Retrievalbeschäftigt sich mit der Weiterentwicklung der Inhaltserschließung durch neue Verfahrenstechniken mit starker Verbindung zum Retrieval drei Bereiche:drei Bereiche: –Metadaten –Methoden des Umgangs mit der verbleibenden Heterogenität –Retrieval für strukturierte und heterogene Datentypen Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

13 Arbeitsbereiche in CARMEN (Weiter-)Entwicklung von Werkzeugen zur Erzeugung von Metadaten mit Dokumentenupload(Weiter-)Entwicklung von Werkzeugen zur Erzeugung von Metadaten mit Dokumentenupload Methoden der Authentifizierung (digitale Signaturen) und der dauerhaften Adressierung (Persistent Identifier)Methoden der Authentifizierung (digitale Signaturen) und der dauerhaften Adressierung (Persistent Identifier) Konkordanzen von Klassifikationen und ThesauriKonkordanzen von Klassifikationen und Thesauri Entwicklung von umfassenden RetrievalkomponentenEntwicklung von umfassenden Retrievalkomponenten –Retrieval auf Metadaten, Datensätzen mit XML-Struktur –Suchfunktionen für verschiedene Datentypen, Klassifikationen –automatische Klassifikation,... Fachübergreifende InformationssystemeFachübergreifende Informationssysteme Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

14 PhysDoc und MPRESS Verknüpfung von PhysDoc und MPRESSVerknüpfung von PhysDoc und MPRESS Crosskonkordanzen zwischen den Klassifikationen (PACS und MSC) und ThesauriCrosskonkordanzen zwischen den Klassifikationen (PACS und MSC) und Thesauri Möglichkeit, in beiden Dokumentenräumen gleichzeitig zu suchenMöglichkeit, in beiden Dokumentenräumen gleichzeitig zu suchen Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

15 Das Projekt OAD* * Open Archives: Distributed services for physicists and graduate students Zugriff auf verteilte Daten und DokumenteZugriff auf verteilte Daten und Dokumente als Austauschprotokoll das OAi-Protokollals Austauschprotokoll das OAi-Protokoll Unterscheidung zwischen Data- und Service-ProviderUnterscheidung zwischen Data- und Service-Provider –Data-Provider: betreibt Dienste, welche Metadaten mittels des OAi-Protokolls zur Verfügung stellen –Service-Provider: stellt mittels des OAi-Protokolls Anfragen an andere Data-Provider und nutzt diese Daten, um eigene Dienste (z.B. Suchfunktionen) zur Verfügung zu stellen Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

16 PhysDoc als Data-Provider PhysDoc stellt als Data-Provider Daten OAi-konform zur Verfügung (seit 13.04.01 angemeldet)PhysDoc stellt als Data-Provider Daten OAi-konform zur Verfügung (seit 13.04.01 angemeldet) prinzipielle Möglichkeit, direkt SOIF-Records zu verwenden, um OAi-konforme Antworten zu erzeugenprinzipielle Möglichkeit, direkt SOIF-Records zu verwenden, um OAi-konforme Antworten zu erzeugen Abbildung von SOIF nach Dublin Core ist schlecht (nicht alle Dokumente enthalten Metadaten)Abbildung von SOIF nach Dublin Core ist schlecht (nicht alle Dokumente enthalten Metadaten) Definition eines Metadatencontainers mit einer möglichst umfassenden Beschreibung der DokumenteDefinition eines Metadatencontainers mit einer möglichst umfassenden Beschreibung der Dokumente –umfasst Dublin Core Elemente –kann beliebig erweitert werden Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

17 PhysDoc als Data-Provider Der Metadatencontainer : Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften Filesystem with SOIF Records Metadata- converter Quality function Normalizer Metadata- container title creator... datestamp settype

18 Metadatenconverter Daten werden offline konvertiertDaten werden offline konvertiert NormalisierungNormalisierung –benutze DC, wenn vorhanden, ansonsten extrahiere aus SOIF –verschiedene Repräsentationen einzelner Metadatenelemente werden in ein einheitliches Format gebracht (z.B. DC.Date ´´1.02.1999´´ --> ´´1999-02-01´´) (z.B. DC.Date ´´1.02.1999´´ --> ´´1999-02-01´´) einfache Qualitätsfunktion (sind ausreichend Daten vorhanden?)einfache Qualitätsfunktion (sind ausreichend Daten vorhanden?) bessere Konsistenzprüfung der Daten möglichbessere Konsistenzprüfung der Daten möglich beliebige Ausgabeformate neben DC/OAi möglichbeliebige Ausgabeformate neben DC/OAi möglich für andere Austauschprotokolle als OAi gewappnetfür andere Austauschprotokolle als OAi gewappnet Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

19 PhysDoc mit OAi Autoren legen Dokumente auf eigenem Server abAutoren legen Dokumente auf eigenem Server ab reichern diese ggf. mit Metadaten anreichern diese ggf. mit Metadaten an Harvest-Gatherer sammelt Metadaten einHarvest-Gatherer sammelt Metadaten ein Metadaten werden offline normalisiert und in SQL- Datenbank in Metadatencontainer gespeichertMetadaten werden offline normalisiert und in SQL- Datenbank in Metadatencontainer gespeichert OAi-Gateway fragt Datenbank ab und liefert OAi-konforme Ausgabe (XML on-the-fly)OAi-Gateway fragt Datenbank ab und liefert OAi-konforme Ausgabe (XML on-the-fly) Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

20 PhysDoc als Service-Provider PhysDoc demnächst als Service-ProviderPhysDoc demnächst als Service-Provider wird zurzeit getestet und erweitertwird zurzeit getestet und erweitert stellt Suchfunktion zur Verfügung, welche die frei zugänglichen (und gut strukturierten) Dokumente vonstellt Suchfunktion zur Verfügung, welche die frei zugänglichen (und gut strukturierten) Dokumente von –PhysDoc, –Teilen des arXiv Eprint Archives –und die Metadaten von IOPP umfasst umfasst Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

21 Ein neues Suchinterface für PhysDoc Ergebnisse aus CARMEN und OAD sind in ein neues Suchinterface für PhysDoc eingeflossenErgebnisse aus CARMEN und OAD sind in ein neues Suchinterface für PhysDoc eingeflossen Quick-Search über den gesamten Datenbestand von PhysDoc (wie bisher, ohne Ranking), ca. 40.000 DokumenteQuick-Search über den gesamten Datenbestand von PhysDoc (wie bisher, ohne Ranking), ca. 40.000 Dokumente Strukturierte Suche (nach Titel, Autoren, Schlagworten und Klassifikation, Volltextsuche) über den gesamten Bestand von PhysDoc und MPRESS (ca. 100.000 Dokumente)Strukturierte Suche (nach Titel, Autoren, Schlagworten und Klassifikation, Volltextsuche) über den gesamten Bestand von PhysDoc und MPRESS (ca. 100.000 Dokumente) gut strukurierte Suche in den mit MetaDaten versehenen Teilen von PhysDoc, dem arXiv.org und bei IOPPgut strukurierte Suche in den mit MetaDaten versehenen Teilen von PhysDoc, dem arXiv.org und bei IOPP (ca. 140.000 Dokumente) (ca. 140.000 Dokumente) Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

22 Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

23 Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

24 Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

25 Das Projekt SINN* * Suchmaschinennetzwerk im Internationalen Naturwissenschaftlichen Netz ein optimales Informationssystem beantwortet Anfragen schnell und stets, unabhängig von der Netzbelastung oder dem Ausfall von Programmen oder Hardwareein optimales Informationssystem beantwortet Anfragen schnell und stets, unabhängig von der Netzbelastung oder dem Ausfall von Programmen oder Hardware Aufbau eines Spiegelnetzwerkes des PhysNet-DienstesAufbau eines Spiegelnetzwerkes des PhysNet-Dienstes Vernetzung von global verteilten Harvest-Brokern und Harvest GatherernVernetzung von global verteilten Harvest-Brokern und Harvest Gatherern Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

26 Aufgaben in SINN Aufbau des Netzwerkes mittels der Harvest Replicator- TechnikAufbau des Netzwerkes mittels der Harvest Replicator- Technik Entwicklung einer Sprache zum Anfragenaustausch (aufbauend auf XML-Query)Entwicklung einer Sprache zum Anfragenaustausch (aufbauend auf XML-Query) Kommunikation zwischen den Brokern mittels eines XML- ProtokollsKommunikation zwischen den Brokern mittels eines XML- Protokolls Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

27 PhysNet-Mirrors weltweit derzeit acht Spiegel der HTML-Seiten (Linklisten) von PhysNetderzeit acht Spiegel der HTML-Seiten (Linklisten) von PhysNet –European Physical Society, Lusanne, Switzerland –Virginia Tech, USA –eprints.org, UK –CCSD-CNRS, Lyon, France –NIKHEF, Amsterdam, The Netherlands –Russian Academy of Science, Chernogolovka, Russia –Institute for Plasma Research, Gujarat, India –Universität Bayreuth, Germany Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

28 Zusammenfassung und einige Bemerkungen zum Umfeld die klassische Verteilung wissenschaftlicher Information über Verlag-Grossist-Bibliothek entfällt im elektronischen Zeitalterdie klassische Verteilung wissenschaftlicher Information über Verlag-Grossist-Bibliothek entfällt im elektronischen Zeitalter Wissenschaflter können ihre Ergebnisse direkt übers WWW anbieten und werden dies in Zukunft verstärkt tunWissenschaflter können ihre Ergebnisse direkt übers WWW anbieten und werden dies in Zukunft verstärkt tun –über ihre eigene Homepage –den Server ihres Fachbereiches, etc. –über PrePrint-Server Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

29 Referieren die zeitliche Reihenfolge des Referierens kehrt sich dabei um :die zeitliche Reihenfolge des Referierens kehrt sich dabei um : von „erst referieren, dann publizieren“ von „erst referieren, dann publizieren“ zu „erst publizieren, dann referieren“ zu „erst publizieren, dann referieren“ statt Peer Reviewing des Verlages wird sich ein vielstufiges Qualitäts-Evaluierungskonzept durchsetzenstatt Peer Reviewing des Verlages wird sich ein vielstufiges Qualitäts-Evaluierungskonzept durchsetzen Suchmaschinen/Informationsdienste können so auch mit Qualitätsfiltern versehen werdenSuchmaschinen/Informationsdienste können so auch mit Qualitätsfiltern versehen werden Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

30 Zugang Erkenntnisse, welche durch staatliche Förderung gewonnen wurden, müssen auch öffentlich zugänglich seinErkenntnisse, welche durch staatliche Förderung gewonnen wurden, müssen auch öffentlich zugänglich sein Änderung des Copyrights für wissenschaftliche DokumenteÄnderung des Copyrights für wissenschaftliche Dokumente Verlage wenden sich professionellen add-on Diensten zuVerlage wenden sich professionellen add-on Diensten zu –intellegentes personenbezogenes Suchen –cross.back-forward-citation –etc. Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

31 Archivierung Langzeitarchivierung ist staatliche AufgabeLangzeitarchivierung ist staatliche Aufgabe an bestimmte Bedingungen geknüpft:an bestimmte Bedingungen geknüpft: –elektronische Version eines Dokumentes –internationale Archiviersprachen (XML, CML, MathML,...) –nur nicht-proprietäre Dateiformate –maschinenlesbar auffindbar (Metadaten) Verlage können auch archivieren (solange sie existieren)Verlage können auch archivieren (solange sie existieren) Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

32 Zum Schluß im Bereich des wissenschaftlichen Publizierens zeigt sich die Bedeutung verteilter Informationssysteme / Informationsdienste mit dezentralen Quellenim Bereich des wissenschaftlichen Publizierens zeigt sich die Bedeutung verteilter Informationssysteme / Informationsdienste mit dezentralen Quellen Verbreitung wissenschaftlicher Information in elektronischer, wieder auffindbarer und archivierbarer Form wird Aufgabe der Erzeuger und ihrer InstitutionenVerbreitung wissenschaftlicher Information in elektronischer, wieder auffindbarer und archivierbarer Form wird Aufgabe der Erzeuger und ihrer Institutionen Technische Voraussetzungen hierzu sind vorhanden, werden z.T. schon genutzt und weiterentwickelt.Technische Voraussetzungen hierzu sind vorhanden, werden z.T. schon genutzt und weiterentwickelt. Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

33 Weitere Informationen Institute for Science NetworkingInstitute for Science Networking<www.isn-oldenburg.de> Projekt CARMENProjekt CARMEN<www.mathematik.uni-osnabrueck.de/projects/CARMEN> Projekt Open Archives distributed (OAD)Projekt Open Archives distributed (OAD)<www.isn-oldenburg.de/projects/OAD> Projekt SINNProjekt SINN<www.isn-oldenburg.de/projects/SINN> Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften

34 Vielen Dank für Ihre Aufmerksamkeit. Die Zukunft des wissenschaftlichen Publizierens Forschungszentrum Jülich, 29. Nov. 01 Michael Hohlfeld, Verteilte Informationssysteme für die Wissenschaften


Herunterladen ppt "Verteilte Informationssysteme für die Wissenschaften (und ihre Vernetzung) Michael Hohlfeld Die Zukunft des wissenschaftlichen."

Ähnliche Präsentationen


Google-Anzeigen