Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Dr. Sven Strobel DPG - Arbeitsgruppe Information 18. März 2015, Berlin Content Mining des TIB|AV-Portals Automatische Analyse und Verschlagwortung von.

Ähnliche Präsentationen


Präsentation zum Thema: "Dr. Sven Strobel DPG - Arbeitsgruppe Information 18. März 2015, Berlin Content Mining des TIB|AV-Portals Automatische Analyse und Verschlagwortung von."—  Präsentation transkript:

1 Dr. Sven Strobel DPG - Arbeitsgruppe Information 18. März 2015, Berlin Content Mining des TIB|AV-Portals Automatische Analyse und Verschlagwortung von AV-Medien

2 22 Content Mining des TIB|AV-Portals 1.TIB|AV-Portal 2.Sammlungsprofil 3.Automatische Videoanalyse 4.Automatische Verschlagwortung der AV-Medien 5.Mehrwert des Portals Inhalt

3 3 Profil Medienspezifisches Portal für wissenschaftliche Videos aus Technik & Naturwissenschaften Automatische Videoanalyse mit Szenen-, Sprach-, Text- und Bilderkennung av.getinfo.de 1. TIB|AV-Portal Entwicklung: KNM und HPI ( ) Online-Gang: 29. April 2014 Zielgruppe Wissenschaftler, Lehrende, Lernende Inhalte Videos aus Forschung und Lehre (Technik & Naturwissenschaften) 2700 Videos / 1900 Filmnachweise (Feb. 2015) Das Meiste unter Open Access

4 44 Content Mining des TIB|AV-Portals 1.TIB|AV-Portal 2.Sammlungsprofil 3.Automatische Videoanalyse 4.Automatische Verschlagwortung der AV-Medien 5.Mehrwert des Portals Inhalt

5 55 2. Sammlungsprofil AV-Medien aus Wissenschaft und Lehre zu den Kernfächern der Technischen Informationsbibliothek: Architektur Chemie Informatik Mathematik Physik Technik

6 66 Sammlungsprofil Aus den genannten Fachgebieten werden u.a. folgende Materialien gesammelt: Aufzeichnungen von Konferenzbeiträgen, Vorlesungen und Podiumsdiskussionen Aufzeichnungen von Experimenten aus Forschung und Entwicklung Interviews Massive Open Online Courses (MOOCs) Dokumentationen von Forschungsarbeiten und -ergebnissen filmische Vorstellungen von 3D-Modellen (z.B. aus Architektur) Modellierung, Simulationen und Vorstellung von Spezialsoftware Materialien

7 77 Content Mining des TIB|AV-Portals 1.TIB|AV-Portal 2.Sammlungsprofil 3.Automatische Videoanalyse 4.Automatische Verschlagwortung der AV-Medien 5.Mehrwert des Portals Inhalt

8 8 3. Automatische Videoanalyse Überblick über Prozesskette Zitierung und permanente Verlinkung visuelles Inhaltsverzeichnis / zielgenauer Zugriff Suche im geschriebenen Text des Videos Suche im gesprochenen Text des Videos Suche nach Bildmotiven Suche nach semantisch verknüpften Schlagworten

9 9 3.1 DOI-Vergabe DOI und MFI Der Digital Object Identifier (DOI) … ist ein eindeutiger und permanenter digitaler Identifikator für Objekte wie z.B. AV-Medien. … wird durch den DOI-Service der TIB vergeben. Verlinkung und Zitierung des gesamten Videodokuments Der Media Fragment Identifier (MFI) … wird dem DOI hinzugefügt, um Teile des Videos zu adressieren. Verlinkung und Zitierung einzelner Sekunden des Videos

10 DOI-Vergabe DOI MFI

11 Szenenerkennung visuelles Inhaltsverzeichnis: Überblick über den Inhalt des Videos Shot Boundary Detection segmentiert das Video anhand von Bildmerkmalen in einzelne Segmente. zielgenauer Zugriff auf Videoinhalt

12 Szenenerkennung Automatische Erkennung eines Schnittes anhand von Kopf, S. (2006): Computergestützte Inhaltsanalyse von digitalen Videoarchiven. Dissertation, Mannheim. Helligkeit / Kontrast Farbverteilung Kanten

13 Szenenerkennung visuelles Inhaltsverzeichnis zielgenauer Zugriff

14 Texterkennung Volltextsuche in den geschriebenen Texten des Videos (Texteinblendungen, Vorlesungsfolien …) Optical Character Recognition (OCR) indexiert geschriebene Sprache im Video und macht sie somit durchsuchbar.

15 Texterkennung Texteinblendung

16 Texterkennung Vorlesungsfolie

17 Spracherkennung Volltextsuche im gesprochenen Text des Videos Speech to Text notiert die gesprochene Sprache im Video in Form eines Transkripts.

18 Spracherkennung

19 Bilderkennung Suche nach Bildmotiven wie z.B. Computeranimation, Experiment oder Mikroskopie Visual Concept Detection indexiert das Bewegtbild mit fächerübergreifenden und fachspezifischen visuellen Konzepten.

20 Bilderkennung

21 21 Content Mining des TIB|AV-Portals 1.TIB|AV-Portal 2.Sammlungsprofil 3.Automatische Videoanalyse 4.Automatische Verschlagwortung der AV-Medien 5.Mehrwert des Portals Inhalt

22 22 4. Automatische Verschlagwortung der AV-Medien Named Entity Recognition: Zuordnung von Begriffen eines Referenzvokabulars auf analysierte Textinhalte. Named Entity Recognition GND = Gemeinsame Normdatei

23 23 Named Entity Recognition Mapping der GND-Sachbegriffe

24 24 Verschlagwortung auf Segmentebene

25 25 Vorteile der automatischen Verschlagwortung 1. GND-Sachbegriffe werden als Indexterme verwendet standardisierte Erschließung mit kontrolliertem Vokabular zielgenaue Suche innerhalb des Videos höhere Precision (Genauigkeitsrate) im Retrieval 2. GND-Sachbegriffe werden zeitbezogen entsprechend der Videosegmentierung zugewiesen 3. GND-Sachbegriffe werden fachbezogen zugewiesen (z.B. Physikvokabular für Physikvideos) 4. GND-Sachbegriffe stehen in semantischen Beziehungen zueinander Erweiterung der Treffermenge durch Einbezug von Synonymen, Ober- und Unterbegriffen

26 26 Content Mining des TIB|AV-Portals 1.TIB|AV-Portal 2.Sammlungsprofil 3.Automatische Videoanalyse 4.Automatische Verschlagwortung der AV-Medien 5.Mehrwert des Portals Inhalt

27 27 5. Mehrwert des TIB|AV-Portals Rezipienten Produzenten Innovative Suchmöglichkeiten Mehrsprachige Suche Segmentgenauer Zugriff Segmentgenaues Zitieren Herunterladen, Bestellen, Lizenzieren Einbetten auf anderen Webseiten Empfehlungen Video-Upload Hosting Qualitätsprüfung Standardisierte Erschließung Sprachtranskription DOI-Vergabe Langzeitarchivierung Rechtssicherheit

28 Vielen Dank für Ihre Aufmerksamkeit!


Herunterladen ppt "Dr. Sven Strobel DPG - Arbeitsgruppe Information 18. März 2015, Berlin Content Mining des TIB|AV-Portals Automatische Analyse und Verschlagwortung von."

Ähnliche Präsentationen


Google-Anzeigen