Automatische Sacherschließung an der ZBW – Status quo & Ausblick

Slides:



Advertisements
Ähnliche Präsentationen
Einsatz neuer Technologien auf dem Slavistik-Portal Ivo Ulrich, Staatsbibliothek zu Berlin 32. ABDOS-Tagung, Martin (Slowakei), 19. Mai 2009.
Advertisements

Die ViFaOst in der Verstetigung 2009/2010
Seite 1 Find Economic Literature Stand
Anbindung mobiler Endgeräte über den Terminal Service
IT-Projektmanagement
1 Jahr Digitization Lifecycle Überblick & Ausblick.
Das Studium der Informatik
Modell der Verfahrensdokumentation für die E-Buchführung
Automatische Indexierung an der ZBW – Status quo
Maschinelle Lernverfahren für IE und TM 1 Topic Detection.
Sicherheit als Geschäftsmodell
Olaf Siegert IuK-Tagung Göttingen, 28. September 2006
Die ZBW ist Mitglied der Leibniz-Gemeinschaft Copyright © ZBW 2010 Seite 1 Potenziale semantischer Technologien für die Bibliothek der Zukunft Klaus Tochtermann.
Vergleichstests – Kompetenztest Thüringen Ergebnisse 2008/09 Primar – Klasse 6
Die Deutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW)
EconBiz – Ergebnisse der Umfrage zu Informationskompetenz und EconBiz und der GENICUS-Studie Tamara Pianos, Thorsten Meyer Hamburg, 11. September.
Einsatz neuer Technologien bei der Virtuellen Fachbibliothek Slavistik Ivo Ulrich, Staatsbibliothek zu Berlin 98. Bibliothekartag, Erfurt, 3. Juni 2009.
Ulrich Kähler, DFN-Verein
Math-Net ein Netzwerk für die Mathematik
ASAM ODS Daten standardisiert auswerten
Open-Access-Publizieren an der - Technischen Universität Chemnitz -
PinK Plattform für intelligente Kollaborationsportale Dr. Joachim Quantz, e.V. Berlin, 13. September 2005.
Community Building im Bereich ePublishing Das CARPET Projekt.
Intelligent self-adaptation of user interface complexity in a case-based medical training system Alexander Hörnlein, Frank Puppe.
Workshop: Qualifizierung für Groupware 7. September 1999 Dortmund Herzlich willkommen zum.
Verlauf und Ergebnisse - Fujitsu Siemens Computers -
der Universität Mannheim!
Dr. Heidrun Alex, DDB Projekt DDC Deutsch Fortbildung für Fachreferentinnen und Fachreferenten der Altertums- wissenschaften UB Heidelberg,
Entitäten Extraktion Wichtige Schritte Petra Maier WS 05/06.
04 b Ressourcenschichtplan. © beas group 2011 / Page 2 This documentation and training is provided to you by beas group AG. The documents are neither.
Wirtschaftswissenschaften
Eidgenössisches Finanzdepartement EFD Informatiksteuerungsorgan des Bundes ISB Die Cloud Strategie der Schweizer Behörden Willy Müller / 25. Januar 2013.
Guete Morge! Roland Scheurer. Guete Morge! Roland Scheurer.
OceanRep das Institutional Repository des Helmholtz-Zentrums für Ozeanforschung Kiel, GEOMAR Barbara Schmidt, GEOMAR Bibliothek.
Begleitung eines Vernetzungsprojektes zur Politischen Bildung im Internet
Teaching Library – Bibliothek der Fachhochschule Frankfurt am Main
November digital tender ist die durchgängige, plattformunabhängige Online- Abwicklung von Ausschreibungen...
1 Semiautomatische Medienresonanz- und Diffusions-Analyse Waltraud Wiedermann, GF APA-DeFacto und APA-MediaWatch Michael Granitzer, Know-Center.
Studentische Arbeiten im Social Web Aktuelle Nutzung und Anforderungen für die Nutzung Klaus Tochtermann Seite 1.
Das Projekt allwiss Projektphasen, Arbeitschritte und Output im Überblick Martina Josten, Inmit Kick-off-Veranstaltung zum Projekt allwiss Trier,
Statuspräsentation Titel der Seminararbeit
Deutsche Digitale Bibliothek Ein großes Vorhaben nimmt Gestalt an 1.
© Fraunhofer ISI AP 1: Projektfortschritt Fallstudien (ISI, ZIRN) Die soziale Dimension des Rebound- Effekts (REBOUND) Projekttreffen, ZEW,
Kläranlagenzustandsbericht ÖWAV-Arbeitsbehelf Nr. 22
Aufbauwissen Informationskompetenz für Doktoranden
Organisation, Kommunikation und Termine Dr. Matthias Woisin Beitrag zum 4. Workshop in Leipzig am
ASTROnomie Interaktiv & Dynamisch ASTROID C. Reimers Institut für Astronomie, Universität Wien Projektleitung: E. Dorfi, Institut für Astronomie, Universität.
BIBFRAME Stand „DNB-BIBFRAME“ 1
Integration existierender digitaler Bibliotheken in Lernumgebungen LEBONED (Learning Environment Based On Non Educational Digital Libraries) Dipl.-Inform.
QIS-POS-Schulung | 29.November 2006 | 1 QIS-POS-Schulung 1.Zusammenspiel QIS und POS-GX; Überblick über beteiligte Komponenten.
Forschungsplattform Theorie und Praxis der Fachdidaktiken Workshop Finalisierung der Forschungsinstrumente 28 – 29. Jänner 2010 USZ 1, Schmelz.
Fortbildungsmeeting 9. bis 10. März 2012, Wien www. biomed-austria.at Österreichischer Berufsverband der Biomedizinischen AnalytikerInnen.
Berufsbild InformationsmanagerIn / InformationsspezialistIn
Einführung eines Content Management Systems
ASIM-Folien Copyright FHG - IPK 2003 Markus Rabe Tagungszeitpunkt ASIM-Fachtagung 2004 Simulation in Produktion und Logistik (ASIM Dedicated Conference.
Koordinierungsstelle der Österreichischen Bischofskonferenz für internationale Entwicklung und Mission KOO-CIDSE Aktivitäten zur Wirksamkeit Kick off Veranstaltung.
Abschluss-Sitzung am 18./19. Juni 2002 Krisenbeständige Produktions- und Servicekooperation mit einem Partner USA mit einem Partner in USA? Dipl.-Ing.
Fachhochschule Südwestfalen
Titelmasterformat durch Klicken bearbeiten Textmasterformate durch Klicken bearbeiten Zweite Ebene Dritte Ebene Vierte Ebene Fünfte Ebene 1 Titelmasterformat.
The ZBW is a member of Leibniz-Gemeinschaft Willkommen bei der EconBiz Roadshow!
ISSUU Ein TEST. 2 Grundsätzliches Benutzerzentrierter Ansatz und Prozessorientierung Bewusst KEINE Abbildung der Organisationsstruktur Weg vom Verzeichnis-Browser.
MareNet Ein neuer elektronischer Informationsdienst für die Meeresforschung IuK Trier, 12. März 2001 Michael Hohlfeld Institute for Science Networking.
Eidgenössisches Volkswirtschaftsdepartement EVD Bundesamt für Berufsbildung und Technologie BBT Förderagentur für Innovation KTI Förderagentur für Innovation.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
XML in der Praxis: Electronic Bill Presentment (EBP) Institut für Wirtschaftsinformatik J. W. Goethe-University J. W. Goethe University Institute of Information.
CMS Kirsten Kropmanns Dedizierte Systeme 16. März 2009.
Aktuelle Bilanzierungs- und Prüfungsfragen aus der Facharbeit des IDW
Die ZBW ist Mitglied der Leibniz-Gemeinschaft Effiziente Dokumentlieferung mit MyBib eDoc Erfahrungen beim Wechsel des Dokumentliefersystems Nicole Clasen.
Sitzung AK-Metadaten 25./ , München © Wrangler - fotolia.com.
IT-Dienstleistungen E-Learning Systeme Content Management 1 Fallbeispiel ILIAS: Das Repository-Objekt-Plugin „Centra“
 Präsentation transkript:

Automatische Sacherschließung an der ZBW – Status quo & Ausblick Thomas Groß, MA (LIS) Deutsche Zentralbibliothek für Wirtschaftswissenschaften Abteilung Informationsdienste Jahrestagung der Gesellschaft für Klassifikation - Bibliothekarische Fortbildung/ Workshop Frankfurt am Main, 31.08.2011

Übersicht Einführung – Grundsätzliches Projektphasen – Rückblick und Ergebnisse Mögliche Szenarien – Ausblick Weiterführende Literatur Copyright © ZBW 2010

1. Einführung – Grundsätzliches I  Allgemein: - automatisierte Sacherschließung (Indexierung, Klassifikation) elektronischer und später aller Informationsressourcen  Konkret: - Auswahl, Prüfung und Evaluierung maschineller Verfahren - organisatorische Einbindung und begleitende Evaluierung  Standard-Thesaurus Wirtschaft (STW): - ca. 6.200 Deskriptoren, dichte semantische Relation - polyhierarchisch und bilingual (dt./engl.) Input - ca. 15.000 - 20.000 Online-Working-Paper - Online-Diss., (parallele) Online-Zeitschriftenaufsätze Firmenvortrag Recommind heute ab 17 Uhr Copyright © ZBW 2010

1. Einführung – Grundsätzliches II Projektteam (unterschiedliche Zeitanteile): - Manfred Faden (Fachreferent, HH): Leitung - Thomas Groß (Fachreferent, KI): u. a. Auswertung - Max-Michael Wannags (Dipl.-Inf., HH): IT-Aspekte offen: (nicht Projektauftrag) - Einbindung IT-Entwicklung/ Forschung!? - Input (Formalerschließung) - Output (Zielsystem: GBV/ EconBiz) Firmenvortrag Recommind heute ab 17 Uhr Copyright © ZBW 2010

2. Projektphasen I  Probeläufe: Mitte – Ende 2009 - Test von zwei Verfahren (statistisch vs. linguistisch) - Kaufentscheidung: Decisiv Categorization - statistischer Ansatz + STW = begriffsorientiertes Verfahren  wesentliche Ergebnisse: Anfang 2010 - 1/3 Indexierungskonsistenz Mensch/Maschine - STW-Nutzung durch ReferentInnen umfassender und trennschärfer (= fehlende/schmale Trainigsbasis) - STW-Polyhierarchie als Problem - deutsch (-) vs. englisch (+), VWL (+) vs. BWL (-), themenspezifisch: z. B. Geldpolitik/Finanzmarkt (+) Firmenvortrag Recommind heute ab 17 Uhr Copyright © ZBW 2010

2. Projektphasen II  Implementierung (EDV-seitig): Anfang 2010 - Installation & Schulung der Content-Administratoren (M. Faden/ T. Groß)  Update auf Decisiv 7 & Hosting bei Recommind: Herbst 2010 - fehlendes VPN, neues/komplexeres Admin-Tool - Software-Probleme, Anpassung durch Recommind (bis Frühjahr 2011) - interne Content-Administration schwierig  Outsourcing an Recommind Firmenvortrag Recommind heute ab 17 Uhr Copyright © ZBW 2010

2. Projektphasen III  Erweiterung der Trainingsbasis: seit Mitte 2010 - Econbiz-Abzug, Verlags-Verhandlungen (gescheitert) - aktuell ca. 200.000 Doks (davon ca. 1/3 indexiert) - pdf-Problematik (Archivierungsstandards)  STW-Anpassung: - flacher Thesaurus - Systematik (Klassifikation): BWL, VWL, Geo‘s, Sektoren - Sperrung problematischer Deskriptoren (Bsp. Atomwaffe, Zweitwohnung) Firmenvortrag Recommind heute ab 17 Uhr Copyright © ZBW 2010

2. Projektphasen IV – Der ZBW- Indexer I - „ZBW-Werkstatt“ innovative Anwendungen/ Services Prototypen, Beta-Version ZBW-Indexer Basis: Decisiv Categorization (Recommind), 83.297 Datensätze, STW Funktion: Generierung potentieller STW-Schlagwörter aus wirtschaftswissenschaftlichen Texten Ziel: auch Klassifikation Copyright © ZBW 2010

2. Projektphasen IV – Der ZBW- Indexer II http://zbw.eu/beta/zbw-indexer Probetext: Using a GARCH model, we analyze the influence of U.S. monetary policy action and communication on the price volatility of commodities for the period 1998-2009. We find, first, that U.S. monetary policy events have an economically significant impact on price volatility. Second, expected target rate changes and communications decrease volatility, whereas target rate surprises and unorthodox monetary policy measures increase it. Third, we find a change in reaction to central bank communication during the recent financial crisis: the calming effect of communication found for the whole sample is partly offset during that period. -- Central Bank Communication ; Commodities ; Federal Reserve Bank ; Monetary Policy ; Price Volatility Copyright © ZBW 2010

2. Projektphasen IV – Der ZBW- Indexer III mit Keywords ohne Keywords Copyright © ZBW 2010

3. Mögliche Szenarien I Szenario 1: Klassifikation/Systematik - jederzeit möglich, d. h. „startklar“ - Erschließungsinstrument: - STW-Systematik: rund 300 Stellen - JEL-Klassifikation??? - Training per Hand (Tax-Brower), anschließende Evaluierung - grobe Sacherschließung auch ZBW-fremder Ressourcen möglich (EconBiz als Zielsystem) - aufwendig, ca. 1 Fachrefent/in p. a. (VZÄ) nötig = keine unmittelbare Wirkung auf Indexierungslast! Copyright © ZBW 2010

3. Mögliche Szenarien II Szenario 2: semiautomatische Indexierung im Regelbetrieb - Erschließungsinstrument: STW (flache Hierarchie) - Einarbeitung der SacherschließerInnen und begleitendes Training der Software durch tägliche Indexierung - neue Geschäftsabläufe (Formalerschließung, Zielsysteme) - konkreter, aber mittelfristiger Nutzen: Entlastung der Indexierung - sehr aufwendig: andere Abteilungen einbinden, zusätzlicher Einarbeitungsaufwand intern (Abteilung Info-Dienste)  Beispiele zeigen mehrjährige Implementierungsdauer - Grundannahme: eine Vielzahl an bereits indexierten Texten (Druckausgabe) kann über Abgleich mit Online-Ausgaben (bekommen wir von den Verlagen) als Trainingsbasis genutzt werden - hat sich als falsch erwiesen (parallele Online-Abos werden unsererseits gekündigt) - mögliche Alternative: Nationallizenzen - was verbleibt sind ca. 15-20.000 Working Paper, Online-Diss. u. ä. Copyright © ZBW 2010

3. Mögliche Szenarien III Szenario 3: automatische Indexierung als Forschungsfeld - Haben: Aufbau einer Forschungsabteilung gestartet, Reorganisation läuft an - Soll: begleitende, software/IT-gestützte Evaluierung (i. S. v. Indexierungskonsistenzen, auch Retrievaltests (recall/precision)) - nicht vorgesehen (abteilungsintern nicht möglich) Copyright © ZBW 2010

Vielen Dank für Ihre Aufmerksamkeit Thomas Groß: t.gross@zbw.eu Copyright © ZBW 2010

Weiterführende Literatur Groß, Thomas; Manfred Faden (2010): Automatische Indexierung elektronischer Dokumente an der ZBW. In: Bibliotheksdienst, Bd. 44 (2010), Heft 12, S. 1120-1135. Link Groß, Thomas (2010): Automatische Indexierung von wirtschaftswissenschaftlichen Dokumenten: Implementierung und Evaluierung am Beispiel der ZBW. Berliner Handr., Heft 284. Link Vorträge (Faden/Groß): Petrus-Workshop, DNB, FFM, 21./22. März 2011, Link 14. GBV-Verbundkonferenz, Berlin, 08.09.2010, Link FIS-Bildung-Tagung, Frankfurt am Main, 03.-04.05.2010, Link Copyright © ZBW 2010