Content Mining des TIB|AV-Portals

Slides:



Advertisements
Ähnliche Präsentationen
Beate Sturm (SUB/MPDL)
Advertisements

Ehemaliges Deutsches Bibliotheksinstitut Berlin
Library of Labs Co-funded by the Community programme eContentplus Library of Labs WP 4: Metadaten Definition Universitätsbibliothek Stuttgart (UBS)
Olaf Siegert IuK-Tagung Göttingen, 28. September 2006
Natascha Schumann TU Darmstadt IuK-Konferenz, März 2003
Digitalisierung in Göttingen
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Forum Information and Communication in Mathematics Jahrestagung der ÖMG/DMV Graz.
Dl-konzepte bmb+f-Projekt im Digital Library-Forum Rudi Schmiede Verteilte Informationsstrukturen in der Wissenschaft Digital Library Konzepte bmb+f Projekt.
Ein Projekt des Ibero-Amerikanischen Institutes Berlin, des Institutes für Iberoamerika-Kunde Hamburg, der Staats- und Universitätsbibliothek Bremen und.
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Kapitel 4 Datenstrukturen
Kontakt? Elektronische Literatursuche in den Naturwissenschaften - Universitätsbibliothek Oldenburg -
Leistungszentren für Forschungsinformation II – Sicherung und Bereitstellung von Textquellen und Primärdaten DINI – AG Informationsmanagement Essen, 17.
Projekt von Rechenzentrum und Universitätsbibliothek Erste Inhalte: Linguistik-Server Essen (LINSE), Semesterapparate Physik Ziel: Bereitstellung einer.
Persistent Identifiers: URNs
„Philosopher‘s Index“ by OvidSP
Haus Potsdamer Straße | 4. Mai 2011 | 10–17 Uhr
Literaturverwaltung und Wissensorganisation
Welcome to MIAMI - dem digitalen Gedächtnis der WWU.
Welcome to MIAMI - dem digitalen Gedächtnis der WWU.
Workfloworchestrierung Grundlage für effiziente und qualitativ hochwertige (Massen)Digitalisierung Dipl. Sozw. Ralf Stockmann (SUB Göttingen)
Digitale Zukunft – Von der Digitalisierung zur Dokumentverfügbarkeit
WIESEL – Integration von Wissensmanagement und E-Learning auf der Basis von Semantic Web Technologien Matthias Rust, XML-Tage 2004, Berlin WIESEL Integration.
Renardus The Academic Subject Gateway in Europe Nationalbibliotheken und nationale Dienste – Interoperabilität mit Subject Gateways Christel Hengel.
Seminarfach und Medienkompetenz
Ergebnis einer Evaluierung -- Kurzform. Ergebnis der Evaluierung: Harte Kriterien Organizational context wird beschrieben –"ELAN Application Profile",
Esther Tobschall 74. Jahrestagung der DPG und DPG Frühjahrstagung - AGI Bonn, 16. März 2010 Das neue GetInfo Informationsportal für Technik und Naturwissenschaften.
Indexierung - Verschlagwortung
Die folgenden Seiten veranschaulichen, wie Sie die Online-Angebote als Ergänzung zu Ihrer Papierversion zeitsparend und effektiv nutzen. Die Inhalte der.
AKI-Sitzung, DPG-PhysikerInnen Tagung 2004, München Eberhard R. Hilf, Thomas Severiens Vernetzung offener, verteilter Portale Skizzierung.
1 Talk - CeBIT 2008 GroupMe!... where Semantic Web meets Web 2.0 Prof. Dr. Nicola Henze Leibniz Universität.
1 Stundentafeln für die Jahrgangsstufen 6 mit 7 Mathematik Klasse 6 4 Klasse 7 4.
AUDIOVISUELLE MEDIEN.
Elektronische, internetbasierte Lerninfrastruktur für die Aus- und Weiterbildung an der FHTW Berlin 1. Juni Mai 2006 eTrain.
Vom Image zum Volltext – Texterkennung im Projekt „OstDok“
Schnelles und effizientes Suchen. Was ist MPEG 7? Wie funktioniert MPEG? Was bietet MPEG 7? Wo wird MPEG 7 verwendet?
Informationen zu digitalisiertem Archivgut in MICHAEL Deutschland Digitales Kulturerbe – gemeinsam vernetzen Tagung am 28./29. April 2008 in der Deutschen.
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Publikationsserver OpenAgrar
Studienfeldbezogener Beratungstest (SFBT)
Begriffe -Technische Geräte
Wichtige bibliographische Begriffe: Kurs WA, Zrelski, BRG WY, 2013.
Innovator Die Komponenten.
EScience eScience ist die globale Zusammenarbeit in Schlüsselgebieten der Forschung und die nächste Generation Werkzeuge, um diese Art von Forschung zu.
Der SLUB Katalog und die Semantische Suche Ralf Talkenberger, SLUB / 21. März 2012.
Expertise Grid und eScience Jens Klump nestor AG Grid/eScience DNB, Frankfurt (M),
Informationstheorie Begr. von Claude Shannon
Automatische Texterkennung
Jahrestagung der ASpB - München
Alexander ZapletalObject Space 1 /15 Object Space von Alexander Zapletal.
Daten- wo bleiben sie? Bernd Richter.
Web 2.0 Möglichkeiten & Anwendungsfelder Robert Handrow Jugendbildungsreferent AdB Haus Steinstraße e.V.
Barrierefreiheit, ePub3, EDUPUB
Digitising Patterns of Power (DPP)
1 Referenten: M.Damm Web Was ist dran? Neue Dot-Com Blase oder echte Chance? Web 2.0.
Peter Kriz, 13.Nov Multimedialer Unterricht mit AonWebTV / AonTV Peter Kriz 13. November 2008.
Methoden der Sozialwissenschaften
Die Übersetzung von “Diskursdialekten” für die Suche: Das Mapping zwischen Fachsprachen und Indexierungssprachen Vivien Petras Vortrag im Berliner Bibliothekswissenschaftlichen.
Homepage E-Books. Elektronische Dissertationen Jährlich ca 150 Dissertationen (180 gesamt) Zugänglich über: –Online Katalog (bibliographische Daten) (link)link.
1 Prof. Dr. Andreas SchmietendorfWS06/07 Übung 3 Test der Möglichkeiten des JDBC-Interfaces.
ELearning an der Alpen-Adria-Universität Klagenfurt: So geht es weiter Claudia Steinberger & Gabriele Frankl Hintergründe.
Platzhalter für Bild, Bild auf Titelfolie hinter das Logo einsetzen Dr. Jana Mersmann / Carsten Elsner, 20. & 22. Oktober 2015 Open Access.
Biodiversity Heritage Library for Europe Naturwissenschaftliches Erbe für die Europeana Henning Scholz Museum für Naturkunde Berlin.
Seite ZB MED: Eine Zentralbibliothek als treibender Motor für Open Access in den Lebenswissenschaften Ursula Arning.
Möglichkeiten des elektronischen Publizierens Workshop der AG Physikalische Praktika der DPG Projektidee Möglichkeiten des elektronischen.
Das Wiki System der Freien Universität Berlin. Vorstellungsrunde Bitte stellen Sie sich kurz vor! Wer sind Sie? Haben Sie Erfahrungen in der Nutzung.
Multimedia-Auris Projekt
Content Mining des TIB|AV-Portals
 Präsentation transkript:

Content Mining des TIB|AV-Portals Automatische Analyse und Verschlagwortung von AV-Medien Dr. Sven Strobel DPG - Arbeitsgruppe Information 18. März 2015, Berlin

Content Mining des TIB|AV-Portals Inhalt TIB|AV-Portal Sammlungsprofil Automatische Videoanalyse Automatische Verschlagwortung der AV-Medien Mehrwert des Portals 2 2

1. TIB|AV-Portal Profil Medienspezifisches Portal für wissenschaftliche Videos aus Technik & Naturwissenschaften Automatische Videoanalyse mit Szenen-, Sprach-, Text- und Bilderkennung Zielgruppe Wissenschaftler, Lehrende, Lernende Inhalte Videos aus Forschung und Lehre (Technik & Naturwissenschaften) 2700 Videos / 1900 Filmnachweise (Feb. 2015) Das Meiste unter Open Access av.getinfo.de Entwicklung: KNM und HPI (2011-2014) Online-Gang: 29. April 2014 3

Content Mining des TIB|AV-Portals Inhalt TIB|AV-Portal Sammlungsprofil Automatische Videoanalyse Automatische Verschlagwortung der AV-Medien Mehrwert des Portals 4 4

2. Sammlungsprofil AV-Medien aus Wissenschaft und Lehre zu den Kernfächern der Technischen Informationsbibliothek: Architektur Chemie Informatik Mathematik Physik Technik 5 5

Sammlungsprofil Materialien Aus den genannten Fachgebieten werden u.a. folgende Materialien gesammelt: Aufzeichnungen von Konferenzbeiträgen, Vorlesungen und Podiumsdiskussionen Aufzeichnungen von Experimenten aus Forschung und Entwicklung Interviews Massive Open Online Courses (MOOCs) Dokumentationen von Forschungsarbeiten und -ergebnissen filmische Vorstellungen von 3D-Modellen (z.B. aus Architektur) Modellierung, Simulationen und Vorstellung von Spezialsoftware 6 6

Content Mining des TIB|AV-Portals Inhalt TIB|AV-Portal Sammlungsprofil Automatische Videoanalyse Automatische Verschlagwortung der AV-Medien Mehrwert des Portals 7 7

3. Automatische Videoanalyse Überblick über Prozesskette Zitierung und permanente Verlinkung visuelles Inhaltsverzeichnis / zielgenauer Zugriff Suche im geschriebenen Text des Videos Suche im gesprochenen Text des Videos Suche nach Bildmotiven Suche nach semantisch verknüpften Schlagworten 8 8

3.1 DOI-Vergabe DOI und MFI Der Digital Object Identifier (DOI) … ist ein eindeutiger und permanenter digitaler Identifikator für Objekte wie z.B. AV-Medien. … wird durch den DOI-Service der TIB vergeben. Verlinkung und Zitierung des gesamten Videodokuments Der Media Fragment Identifier (MFI) … wird dem DOI hinzugefügt, um Teile des Videos zu adressieren. Verlinkung und Zitierung einzelner Sekunden des Videos 9 9

3.1 DOI-Vergabe DOI MFI 10 10

3.2 Szenenerkennung Shot Boundary Detection segmentiert das Video anhand von Bildmerkmalen in einzelne Segmente. visuelles Inhaltsverzeichnis: Überblick über den Inhalt des Videos zielgenauer Zugriff auf Videoinhalt 11 11

3.2 Szenenerkennung Automatische Erkennung eines Schnittes anhand von Kopf, S. (2006): Computergestützte Inhaltsanalyse von digitalen Videoarchiven. Dissertation, Mannheim. Automatische Erkennung eines Schnittes anhand von Helligkeit / Kontrast Farbverteilung Kanten 12 12

3.2 Szenenerkennung visuelles Inhaltsverzeichnis zielgenauer Zugriff 13 13

3.3 Texterkennung Optical Character Recognition (OCR) indexiert geschriebene Sprache im Video und macht sie somit durchsuchbar. Volltextsuche in den geschriebenen Texten des Videos (Texteinblendungen, Vorlesungsfolien …) 14 14

3.3 Texterkennung Texteinblendung 15 15

3.3 Texterkennung Vorlesungsfolie 16 16

3.4 Spracherkennung Speech to Text notiert die gesprochene Sprache im Video in Form eines Transkripts. Volltextsuche im gesprochenen Text des Videos 17 17

3.4 Spracherkennung 18 18

3.5 Bilderkennung Visual Concept Detection indexiert das Bewegtbild mit fächerübergreifenden und fachspezifischen visuellen Konzepten. Suche nach Bildmotiven wie z.B. Computeranimation, Experiment oder Mikroskopie 19 19

3.5 Bilderkennung 20 20

Content Mining des TIB|AV-Portals Inhalt TIB|AV-Portal Sammlungsprofil Automatische Videoanalyse Automatische Verschlagwortung der AV-Medien Mehrwert des Portals 21 21

4. Automatische Verschlagwortung der AV-Medien Named Entity Recognition Named Entity Recognition: Zuordnung von Begriffen eines Referenzvokabulars auf analysierte Textinhalte. GND = Gemeinsame Normdatei 22 22

Named Entity Recognition Mapping der GND-Sachbegriffe 23 23

Verschlagwortung auf Segmentebene 24 24

Vorteile der automatischen Verschlagwortung 1. GND-Sachbegriffe werden als Indexterme verwendet standardisierte Erschließung mit kontrolliertem Vokabular 2. GND-Sachbegriffe werden zeitbezogen entsprechend der Videosegmentierung zugewiesen zielgenaue Suche innerhalb des Videos 3. GND-Sachbegriffe werden fachbezogen zugewiesen (z.B. Physikvokabular für Physikvideos) höhere Precision (Genauigkeitsrate) im Retrieval 4. GND-Sachbegriffe stehen in semantischen Beziehungen zueinander Erweiterung der Treffermenge durch Einbezug von Synonymen, Ober- und Unterbegriffen 25 25

Content Mining des TIB|AV-Portals Inhalt TIB|AV-Portal Sammlungsprofil Automatische Videoanalyse Automatische Verschlagwortung der AV-Medien Mehrwert des Portals 26 26

5. Mehrwert des TIB|AV-Portals Rezipienten Produzenten Innovative Suchmöglichkeiten Mehrsprachige Suche Segmentgenauer Zugriff Segmentgenaues Zitieren Herunterladen, Bestellen, Lizenzieren Einbetten auf anderen Webseiten Empfehlungen Video-Upload Hosting Qualitätsprüfung Standardisierte Erschließung Sprachtranskription DOI-Vergabe Langzeitarchivierung Rechtssicherheit 27 27 27

Vielen Dank für Ihre Aufmerksamkeit!