Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Vernetzung von verteilten Informationssystemen Michael Hohlfeld Institute for Science Networking Oldenburg GmbH an der C.V.O. Universität Oldenburg

Ähnliche Präsentationen


Präsentation zum Thema: "Vernetzung von verteilten Informationssystemen Michael Hohlfeld Institute for Science Networking Oldenburg GmbH an der C.V.O. Universität Oldenburg"—  Präsentation transkript:

1 Vernetzung von verteilten Informationssystemen Michael Hohlfeld Institute for Science Networking Oldenburg GmbH an der C.V.O. Universität Oldenburg Iuk Tagung in Ulm, 10. bis 13. März 2002

2 Übersicht Ù Verteilte Informationssyteme Ù PhysNet-Aktivitäten –Das Projekt SINN –OAD: Open Archives Distributed –Ergebnisse aus CARMEN Ù Ein kleiner Ausblick... Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

3 Verteilte Informationssysteme Ù Warum verteilte Informationssysteme? –riesige Informationsmenge im WWW –Suchmaschinen nicht wissenschaftsspezifisch –zentrale Systeme benötigen große Rechenleistung – Ù Verteilte Dienste nutzen relevante (fachspezifische) Webserver als verteilte Datenbank Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

4 Vorteile verteilter Systeme Ù durch die Beschränkung des Daten- raumes sind Relevanz und Qualität sichergestellt Ù Inhalte verbleiben auf den Servern der Erzeuger, diese behalten so die Kontrolle Ù beliebig skalierbar Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

5 Anforderungen an verteilte Systeme Ù Zugriff auf heterogene Datenräume Ù Vernetzung verschiedener fachspezifischer Informationsdienste Ù Stabilität und Schnelligkeit Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

6 Das Projekt SINN SINN: Suchmaschinennetzwerk im Internationalen Naturwissenschaftlichen Netz Ù Aufbau eines weltweiten Spiegel-Systems von PhysNet Ù Vernetzung von global verteilten Harvest- Brokern und -Gatherern Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

7 Aufgaben in SINN Ù Aufbau des Suchmaschinenetzwerkes mittels der Harvest-Replicator Technik Ù Entwicklung einer Sprache zum Anfragen- austausch (basierend auf XML-Query) Ù Kommunikation zwischen den Such- maschinen mittels eines XML-Protokolls Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

8 PhysNet Spiegel weltweit Ù weltweit neun Spiegel des PhysNet- Dienstes (HTML-Seiten) – in der Schweiz (EPS), den USA, England, Russland, Frankreich, Indien, Niederlande, Deutschland Ù weitere Spiegel sind in Vorbereitung Ù dienen als Vorläufer des späteren Suchmaschinennetzwerkes Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

9 Stand der Dinge Ù Einarbeitung in die interne Diskussion der W3C Arbeitsgruppe XML-Query –aktive Mitarbeit geplant –noch kein stabiler Standard Ù internationaler technischer Workshop im Dezember 2001 – Erfahrungsaustausch und intensive Diskussionen mit den internationalen Partnern von SINN/PhysNet Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

10 Ergebnisse des Workshops Ù Verbesserung der Spiegelsoftware Ù Netz-Topologie vorerst zu vernachlässigen Ù regionale Gatherer und unabhängige Broker Ù Synchronisation der Gatherer und Broker Ù Austausch von Konfigurationsdateien Ù bei Ausfall eines Brokers: Liste mit Verweisen zu den alternativen Brokern der anderen Standorte Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

11 SINN 2002 Ù Optimierung der Harvest-Suchmaschinen –Einbau eines Rankings –Programmierung eines Harvest-Moduls für die Kommunikation zwischen den Brokern –Entwicklung eines XML-basierten Query- und Anwserprotokolles und Programmierung eines Harvest- Moduls, welches XML-Qurey versteht Ù Planung und Durchführung einer weiteren internationalen Tagung Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

12 Informationen zu SINN SINN ist ein Vorhaben in Rahmen des DFN-Projektes Einsatz von Netzdiensten im wissenschaftlichen Informationswesen Ù Mittel des bmb+f und des Landes Niedersachsen Ù Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

13 Das Projekt OAD Open Archives: Distributed services for physicists and graduate students Ù DFG/NSF Projekt, gemeinsam mit Virginia Tech Ù Zugriff auf verteilte Daten + Dokumente Ù als Austauschprotokoll das OAi-Protokoll Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

14 PhysDoc als Data-Provider Ù stellt als Data-Provider Daten OAi- konform zur Verfügung –Harvest-Gatherer sammelt –Daten werden offline konvertiert und in einem Metadatencontainer (SQL-DB) gespeichert –Normalisierung der Daten –einfache Qualitätsfunktion –OAi-konforme Ausgabe (XML on-the-fly) –beliebige Ausgabeformate möglich und für andere Austauschprotokolle gewappnet Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

15 PhysDoc als Service-Provider Ù stellt als Service-Provider eine Suchfunktion zur Verfügung, welche die frei zugänglichen (und gut strukturierten) Dokumente bzw. Metadaten von Ù PhysDoc Ù Teilen des arXiv Eprint Archives Ù und von IOPP umfasst. Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

16

17 Das Projekt CARMEN Content Analysis, Retrieval and MetaData: Effective Networking Sonderfördermaßnahme im Rahmen von Global-Info mit Mitteln des bmb+f Ù Weiterentwicklung der Inhaltserschließung durch neue Verfahrenstechniken mit starker Verbindung zum Retrieval Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

18 Arbeitsbereiche in CARMEN Ù(Weiter-)Entwicklung von Werkzeugen zur Erzeugung von Metadaten mit Dokumentenupload ÙMethoden der Authentifizierung und der dauerhaften Adressierung (digitale Signaturen und Persistent Identifier) ÙKonkordanzen von Klassifikationen und Thesauri ÙEntwicklung von umfassenden Retrievalkomponenten –Retrieval auf Metadaten, Datensätzen mit XML-Struktur –Suchfunktionen für verschiedene Datentypen, Klassifikationen –automatische Klassifikation,... ÙFachübergreifende Informationssysteme Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

19 Ergebnisse aus CARMEN Ù Verknüpfung der Dokumentendienste PhysDoc und MPRESS in AP9 Ù Crosskonkordanzen zwischen PACS und MSC Klassifikationen Ù Entwicklung einer gemeinsamen Suchoberfläche für PhysDoc und MPRESS Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

20

21 Neues PhysDoc Suchinterface Ù findet Anwendung in PhysDoc Ù zusätzlich Anbindung an das OAi-Protokoll Ù verschiedene Suchmöglichkeiten: –Quick-Search über gesamten PhysDoc-Datenbestand –Strukturierte Suche über den gesamten Bestand von PhysDoc und MPRESS –Strukturierte Suche über die mit Metadaten versehenden Teile von PhysDoc, arXiv und IOPP Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

22 Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

23 Zum Schluss ein kleiner Ausblick... Iuk Tagung in Ulm, 10. bis 13. März 2002Vernetzung von verteilten Informationssystemen

24

25 Vortrag Online: Weitere Informationen: Institute for Science Networking Projekt SINN Projekt CARMEN Projekt Open Archives distributed (OAD) Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen

26 Vielen Dank für Ihre Aufmerksamkeit ! Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH Vernetzung von verteilten Informationssystemen


Herunterladen ppt "Vernetzung von verteilten Informationssystemen Michael Hohlfeld Institute for Science Networking Oldenburg GmbH an der C.V.O. Universität Oldenburg"

Ähnliche Präsentationen


Google-Anzeigen