Content Mining des TIB|AV-Portals

Slides:



Advertisements
Ähnliche Präsentationen
RIMAX-Koordinierung Publikationsdatenbank Metadatenbank Datensätze mit DOI Sonderhefte in Zeitschriften (WaWi, NHESS) Präsentation für Entscheidungsträger.
Advertisements

Kontakt? Elektronische Literatursuche in den Naturwissenschaften - Universitätsbibliothek Oldenburg -
Workfloworchestrierung Grundlage für effiziente und qualitativ hochwertige (Massen)Digitalisierung Dipl. Sozw. Ralf Stockmann (SUB Göttingen)
Digitale Zukunft – Von der Digitalisierung zur Dokumentverfügbarkeit
Ergebnis einer Evaluierung -- Kurzform. Ergebnis der Evaluierung: Harte Kriterien Organizational context wird beschrieben –"ELAN Application Profile",
AKI-Sitzung, DPG-PhysikerInnen Tagung 2004, München Eberhard R. Hilf, Thomas Severiens Vernetzung offener, verteilter Portale Skizzierung.
1 Stundentafeln für die Jahrgangsstufen 6 mit 7 Mathematik Klasse 6 4 Klasse 7 4.
Publikationsserver OpenAgrar
Wichtige bibliographische Begriffe: Kurs WA, Zrelski, BRG WY, 2013.
Web 2.0 Möglichkeiten & Anwendungsfelder Robert Handrow Jugendbildungsreferent AdB Haus Steinstraße e.V.
1 Referenten: M.Damm Web Was ist dran? Neue Dot-Com Blase oder echte Chance? Web 2.0.
Peter Kriz, 13.Nov Multimedialer Unterricht mit AonWebTV / AonTV Peter Kriz 13. November 2008.
Content Mining des TIB|AV-Portals
Platzhalter für Bild, Bild auf Titelfolie hinter das Logo einsetzen Dr. Jana Mersmann / Carsten Elsner, 20. & 22. Oktober 2015 Open Access.
Biodiversity Heritage Library for Europe Naturwissenschaftliches Erbe für die Europeana Henning Scholz Museum für Naturkunde Berlin.
Seite ZB MED: Eine Zentralbibliothek als treibender Motor für Open Access in den Lebenswissenschaften Ursula Arning.
Entwicklung und Anwendung eines Evaluationskatalogs für eine E- Learning Plattform Mediadidactics Referent: Mag. Konstantin Mitgutsch Plattform: Moodle.
Aus der Ferne beseh'n ist alles schön? Die Bereitstellung digitaler Unterlagen für Behörden und Öffentlichkeit Dr. Herbert HUTTERER.
Das Wiki System der Freien Universität Berlin. Vorstellungsrunde Bitte stellen Sie sich kurz vor! Wer sind Sie? Haben Sie Erfahrungen in der Nutzung.
Technische Universität München, Informatik XI Angewandte Informatik / Kooperative Systeme Verteilte Anwendungen: Web Services Dr. Wolfgang Wörndl
Vorbereitet zur Rechenübung – Die HAITI-Methode LiT-Shortcut Unterstützung der Selbstlernphase Studierender zur Vorbereitung auf Rechenübungen.
Internet Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred Thaller AM 2: Digitale Langzeitarchivierung Referentin: Rasa Sommer.
Überlebensfähiges Geschäftsmodell Zedin Sisic Informationsverarbeitung 2.
| planet-beruf.de Medien für Jugendliche der Sekundarstufe I Teil 1 Medien für Schülerinnen und Schüler.
Simone Georgi Kommunikationswissenschaft SLUB Baustein 2, Suche nach Aufsätzen Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden.
Dedizierte Systeme - Anna Job Universität zu Köln – IT-Zertifikat – WS 08/09 Digital library software Greenstone.
Welchen Mehrwert ermöglicht Blended Learning den Lehrenden und Lernenden? Bernhard Probst, Muri bei Bern, 25. Okt
Torsten Rathmann (DKRZ) Torsten Rathmann Deutsches Klimarechenzentrum (DKRZ) Datenmanagement am DKRZ PubFlow Workshop 18. März 2014.
Gewusst wie - Literatur suchen und finden in der Unibibliothek
Elterninformationsabend zu Abschlüssen und Zentralen Prüfungen 10 im Schuljahr 2016/17 D. Brünger, 2016.
Aufbau eines Medienzentrums an der Universitätsbibliothek Marburg
Lehrpraxis im Transfer – unser Service für gute Lehre
Content Markplatz NRW 1. September 2017
Blended Learning-Team
Architektur Archiv der Schweiz
Digitale Kompetenzen Informatische Bildung 8. Schulstufe
und die Jahrgangsstufen am Stromberg-Gymnasium
Elterninformationsabend zu Abschlüssen und Zentralen Prüfungen 10 im Schuljahr 2017/18 D. Brünger, 2017.
Vorlesung #3 ER –Modellierung (Fortsetzung)
Multimedia-Auris Projekt
10 Jahre B R I E F T A U B E N - M A R K T . D E
Die gymnasiale Oberstufe
Willkommen zum Informationsabend
Die gymnasiale Oberstufe in Baden-Württemberg
Citavi im Prozess der wissenschaftlichen Arbeit
Open Source ILIAS Plugin: Interaktive Videos
Lesen Sie alles darüber Microsoft SharePoint-News
Lesen Sie alles zu Microsoft SharePoint-News
Tagung Am LISUM PERSPEKTIVWECHSEL
IT an Schulen - Ergebnisse einer Befragung von Lehrern in Deutschland - - November
Open Educational Ressources - eine sehr kurze Definition
Was brauchen Open Access Monographien ?
Was brauchen Open Access Monographien ?
Cluster 6 Fachwissenschaftliche Annotationen
Seminar Wissenspsychologie
Friederike Kleinfercher Abteilung Forschung und Entwicklung
Informationsveranstaltung des Einstein Gymnasiums für die Eltern der Klassenstufe 9 Kursanwahl in Klasse 10 – Vorbereitung auf die Qualifikationsphase.
Primärdaten Malte Dreyer Bonn,
Informationsveranstaltung für die Klasse 10
Naturwissenschaft und Technik
Risiko – Check Erkennung von Politisch exponierten Persönlichkeiten (PeP‘s) bzw. von Personen mit Verdacht auf Geldwäsche und/oder Terrorismusfinanzierung.
Fächerwahl für die S6 Februar 2019.
NwT Naturwissenschaft und Technik
Heute ist der _. Februar. Donnerstag.
Wie die ZHB Sie dabei unterstützen kann
Herzlich willkommen! Area WirtschaftspädagogiK 29. August 2018.
Felix-Mendelssohn-Bartholdy-Gymnasium
 Präsentation transkript:

Content Mining des TIB|AV-Portals Automatische Analyse und Verschlagwortung von AV-Medien Dr. Sven Strobel DPG - Arbeitsgruppe Information 18. März 2015, Berlin

Content Mining des TIB|AV-Portals Inhalt TIB|AV-Portal Sammlungsprofil Automatische Videoanalyse Automatische Verschlagwortung der AV-Medien Mehrwert des Portals 2 2

1. TIB|AV-Portal Profil Medienspezifisches Portal für wissenschaftliche Videos aus Technik & Naturwissenschaften Automatische Videoanalyse mit Szenen-, Sprach-, Text- und Bilderkennung Zielgruppe Wissenschaftler, Lehrende, Lernende Inhalte Videos aus Forschung und Lehre (Technik & Naturwissenschaften) 2700 Videos / 1900 Filmnachweise (Feb. 2015) Das Meiste unter Open Access av.getinfo.de Entwicklung: KNM und HPI (2011-2014) Online-Gang: 29. April 2014 3

Content Mining des TIB|AV-Portals Inhalt TIB|AV-Portal Sammlungsprofil Automatische Videoanalyse Automatische Verschlagwortung der AV-Medien Mehrwert des Portals 4 4

2. Sammlungsprofil AV-Medien aus Wissenschaft und Lehre zu den Kernfächern der Technischen Informationsbibliothek: Architektur Chemie Informatik Mathematik Physik Technik 5 5

Sammlungsprofil Materialien Aus den genannten Fachgebieten werden u.a. folgende Materialien gesammelt: Aufzeichnungen von Konferenzbeiträgen, Vorlesungen und Podiumsdiskussionen Aufzeichnungen von Experimenten aus Forschung und Entwicklung Interviews Massive Open Online Courses (MOOCs) Dokumentationen von Forschungsarbeiten und -ergebnissen filmische Vorstellungen von 3D-Modellen (z.B. aus Architektur) Modellierung, Simulationen und Vorstellung von Spezialsoftware 6 6

Content Mining des TIB|AV-Portals Inhalt TIB|AV-Portal Sammlungsprofil Automatische Videoanalyse Automatische Verschlagwortung der AV-Medien Mehrwert des Portals 7 7

3. Automatische Videoanalyse Überblick über Prozesskette Zitierung und permanente Verlinkung visuelles Inhaltsverzeichnis / zielgenauer Zugriff Suche im geschriebenen Text des Videos Suche im gesprochenen Text des Videos Suche nach Bildmotiven Suche nach semantisch verknüpften Schlagworten 8 8

3.1 DOI-Vergabe DOI und MFI Der Digital Object Identifier (DOI) … ist ein eindeutiger und permanenter digitaler Identifikator für Objekte wie z.B. AV-Medien. … wird durch den DOI-Service der TIB vergeben. Verlinkung und Zitierung des gesamten Videodokuments Der Media Fragment Identifier (MFI) … wird dem DOI hinzugefügt, um Teile des Videos zu adressieren. Verlinkung und Zitierung einzelner Sekunden des Videos 9 9

3.1 DOI-Vergabe DOI MFI 10 10

3.2 Szenenerkennung Shot Boundary Detection segmentiert das Video anhand von Bildmerkmalen in einzelne Segmente. visuelles Inhaltsverzeichnis: Überblick über den Inhalt des Videos zielgenauer Zugriff auf Videoinhalt 11 11

3.2 Szenenerkennung Automatische Erkennung eines Schnittes anhand von Kopf, S. (2006): Computergestützte Inhaltsanalyse von digitalen Videoarchiven. Dissertation, Mannheim. Automatische Erkennung eines Schnittes anhand von Helligkeit / Kontrast Farbverteilung Kanten 12 12

3.2 Szenenerkennung visuelles Inhaltsverzeichnis zielgenauer Zugriff 13 13

3.3 Texterkennung Optical Character Recognition (OCR) indexiert geschriebene Sprache im Video und macht sie somit durchsuchbar. Volltextsuche in den geschriebenen Texten des Videos (Texteinblendungen, Vorlesungsfolien …) 14 14

3.3 Texterkennung Texteinblendung 15 15

3.3 Texterkennung Vorlesungsfolie 16 16

3.4 Spracherkennung Speech to Text notiert die gesprochene Sprache im Video in Form eines Transkripts. Volltextsuche im gesprochenen Text des Videos 17 17

3.4 Spracherkennung 18 18

3.5 Bilderkennung Visual Concept Detection indexiert das Bewegtbild mit fächerübergreifenden und fachspezifischen visuellen Konzepten. Suche nach Bildmotiven wie z.B. Computeranimation, Experiment oder Mikroskopie 19 19

3.5 Bilderkennung 20 20

Content Mining des TIB|AV-Portals Inhalt TIB|AV-Portal Sammlungsprofil Automatische Videoanalyse Automatische Verschlagwortung der AV-Medien Mehrwert des Portals 21 21

4. Automatische Verschlagwortung der AV-Medien Named Entity Recognition Named Entity Recognition: Zuordnung von Begriffen eines Referenzvokabulars auf analysierte Textinhalte. GND = Gemeinsame Normdatei 22 22

Named Entity Recognition Mapping der GND-Sachbegriffe 23 23

Verschlagwortung auf Segmentebene 24 24

Vorteile der automatischen Verschlagwortung 1. GND-Sachbegriffe werden als Indexterme verwendet standardisierte Erschließung mit kontrolliertem Vokabular 2. GND-Sachbegriffe werden zeitbezogen entsprechend der Videosegmentierung zugewiesen zielgenaue Suche innerhalb des Videos 3. GND-Sachbegriffe werden fachbezogen zugewiesen (z.B. Physikvokabular für Physikvideos) höhere Precision (Genauigkeitsrate) im Retrieval 4. GND-Sachbegriffe stehen in semantischen Beziehungen zueinander Erweiterung der Treffermenge durch Einbezug von Synonymen, Ober- und Unterbegriffen 25 25

Content Mining des TIB|AV-Portals Inhalt TIB|AV-Portal Sammlungsprofil Automatische Videoanalyse Automatische Verschlagwortung der AV-Medien Mehrwert des Portals 26 26

5. Mehrwert des TIB|AV-Portals Rezipienten Produzenten Innovative Suchmöglichkeiten Mehrsprachige Suche Segmentgenauer Zugriff Segmentgenaues Zitieren Herunterladen, Bestellen, Lizenzieren Einbetten auf anderen Webseiten Empfehlungen Video-Upload Hosting Qualitätsprüfung Standardisierte Erschließung Sprachtranskription DOI-Vergabe Langzeitarchivierung Rechtssicherheit 27 27 27

Vielen Dank für Ihre Aufmerksamkeit!