Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Kunibert Kappus Geändert vor über 11 Jahren
1
Einsatz neuer Technologien auf dem Slavistik-Portal Ivo Ulrich, Staatsbibliothek zu Berlin 32. ABDOS-Tagung, Martin (Slowakei), 19. Mai 2009
2
18. Mail 2009 |Slavistik-Portal | Osteuropa-AbteilungS. 2 Übersicht Was ist das Slavistik-Portal? Neue Technologien im Einsatz Suchmaschinentechnologie Föderierte Indexsuche Vollautomatischer Linksammler Retrokonversionsprojekt 130 Jahre deutsche Slavistik
3
18. Mail 2009 |Slavistik-Portal | Osteuropa-AbteilungS. 3 Was ist das Slavistik-Portal? … ein Produkt der Virtuellen Fachbibliothek Slavistik gefördert durch Deutsche Forschungsgesellschaft (DFG) seit 10/2005 im Aufbau, seit 5/2007 online angesiedelt an der Staatsbibliothek zu Berlin (SBB), Projektleitung: Osteuropa-Abteilung Kooperationen Universitätsbibliothek Bochum ViFaOst (BSB München) Vascoda Bibliothekarische und wissenschaftliche Einrichtungen in Osteuropa (Russland, Tschechien, Polen, Südosteuropa) Adresse: http://www.slavistik-portal.de
4
18. Mail 2009 |Slavistik-Portal | Osteuropa-AbteilungS. 4
5
18. Mail 2009 |Slavistik-Portal | Osteuropa-AbteilungS. 5 Suchmaschinentechnologie I Begriffsklärung Erweiterung des Suchraumes bzw. maschinelle Erschließung unterschiedlicher Dokumentenformate Architektur: Crawler - Indexer - Searcher PDF HTML DOC TXT XML... Index
6
18. Mail 2009 |Slavistik-Portal | Osteuropa-AbteilungS. 6 Suchmaschinentechnologie II Apache Lucene = Opensource-Software, kostenfrei Volltextrecherche in Webseiten (= Fachgoogle) Volltextrecherche in strukturierten Daten: Stemming- und Transliterationsmodule verfügbar Hohe Performance Trefferliste nach Relevanz sortiert geplant: Erschliessung von ca. 5 Mio. slavistikrelevanten Webseiten Erschliessung von fachrelevanten PDF-Dokumenten der SBB
7
18. Mail 2009 |Slavistik-Portal | Osteuropa-AbteilungS. 7 Aufbau eines kooperativen Fachnetzwerkes für Slavistik Metasuchmaschine iPort + Apache Lucene schnell, stabil und skalierbar wird enthalten: –5 Mio. slavistische Webseiteninhalte, z.Zt. 35.000 (Berlin) –16.000 bibliographische Datensätze (Bamberg) –150 Mio. tschechische Webseiten (Prag) –80.000 polnische Volltext-Dokumente (Poznań) Föderierte Indexsuche Berlin Deutschland Poznań Polen Prag Tschechische Republik Bamberg Deutschland Slavistik-Portal SRU
8
18. Mail 2009 |Slavistik-Portal | Osteuropa-AbteilungS. 8 Vollautomatischer Linksammler liefert täglich 5-10 neue Web-2.0-Community-generierte Weblinks Einsatz bei Weblink-Katalogisierung bzw. für Indizierungsprozess
9
18. Mail 2009 |Slavistik-Portal | Osteuropa-AbteilungS. 9 Retrokonversionsprojekt 130 Jahre deutsche Slavistik Digitalisierung von vier mehrbändigen Bibliographien; enthalten Veröffentlichungen der deutschsprachigen Slavistik seit 1876 ~ 60.000 bibliographische Einheiten, inkl. Schlagworten Scanprozess bereits abgeschlossen zur Zeit: OCR-Bearbeitung geplant: softwaregesteuerte Konversion der Daten in Lucene- Indizes einfacher Zugriff über Metasuche des Slavistik-Portals Weltweiter Zugriff auf Daten durch SRU-Schnittstelle Fertigstellung Anfang 2010
10
18. Mail 2009 |Slavistik-Portal | Osteuropa-AbteilungS. 10 Zusammenfassung Neue Technologien … erhöhen Trefferqualität durch größere Datenmenge … bieten Recherche in unterschiedlichen Ressourcentypen … verbinden ViFas mit Fachcommunity Automatisierte Prozesse … unterstützen Arbeit der Fachreferenten … liefern fachrelevanten Content ohne Mehraufwand … vereinfachen die Verstetigung von ViFas
11
Danke für Ihre Aufmerksamkeit! Ivo Ulrich Staatsbibliothek zu Berlin, Deutschland Osteuropa-Abteilung ivo.ulrich@sbb.spk-berlin.de Tel.: +49-30-266 435782
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.