1 Semiautomatische Medienresonanz- und Diffusions-Analyse Waltraud Wiedermann, GF APA-DeFacto und APA-MediaWatch Michael Granitzer, Know-Center
2
3
4 Kurzzeit-Diffusionsanalyse: APA-Meldung: wer schreibt wann ab? Such-Fokus: typische Duplikatssuche Die APA- Exklusivmeldung um Uhr wurde vom Kurier um Uhr in der Onlineausgabe zu 94% übernommen.
5 Langzeit-Diffusionsanalyse: APA-Meldung: wer übernimmt wie stark welche Inhalte? Such-Fokus: typische Zitatssuche Die APA-Meldung vom wurde in der OÖ Rundschau am in drei Absätzen zu 97% übernommen.
6 Themen-Drift: APA-Meldung: wie entwickeln sich die Inhalte der Meldung?
7 Wien, Freitag, 2. Juni, 9.00 Uhr
8
9 Wien, Freitag, 2. Juni, Uhr
10 Wien, Freitag, 2. Juni, Uhr
11 Berlin, Samstag, 3. Juni, Uhr Blog: Life on the road, Donnerstag, 8.Juni Sys-Con, Spanien,
12 Yonhap News, 5. Juni, Uhr
13 ThaiPR, 5. Juni, 9.33 Uhr
14 ??? ??
15 Projekt N-Trace Nachrichten-Diffusionsanalyse Identifikation von Plagiaten Identifikation von exakt gleichen Textteilen Artikel in 30 Tagen (ohne externe Quellen) 30 Millionen Gesamt Ansatz Einschränken der Artikelmenge durch zeitlichen Ausschluss (z.B. 30 Tage) Berechnen von Hash-Werten für Artikel (Shingling lt. Broder et. al.) Artikel in Memory Vergleichen der Hash-Werte: Übereinstimmung möglicherweise ähnliche Inhalte Detailanalyse der verbleibenden Kandidaten Reihenfolgeabhängige Satz-Levenstheinmetrik Reihenfolgeunabhängiges Chunking
16 N-Trace Ähnlichkeitskandidaten über Hashing
17 MediaMatrix Zusammenfassung der Ergebnisse Direkte Integration in Office Online Verfügbarkeit über APA Plattform
18 Projekt N-Trace
19 Projekt X-Trend Zielsetzung & Ablauf Semiautomatische Unterstützung der Medienresonanzanalyse Prototypische Anwendung von Techniken der Wissenserschließung Als Unterstützung der APA Mitarbeiter, nicht als Ersatz Wahrung der hohen Qualitätsstandards durch menschliche Kontrolle Vermeidung von Medienbrüchen Ablauf im Projekt: Ablaufanalyse Erarbeitung von Ansatzpunkten zur Integration von Wissenserschließungstechniken Prototypische Umsetzung und Test
20 Projekt X-Trend Ablauf einer Medienresonanzanalyse 1.Definition von Nennungs- und Wertungsbegriffen 2.Suche nach Nennungen über die APA PowerSearch 3.Import der gefundenen Artikel 4.Identifikation der Sätze mit entsprechenden Wertungsbegriffen 5.Manuelle Satzbewertung 6.Auswertung und manuelle Berichterstellung Prototypische Umsetzung einer Service- orientierten Architektur Entwicklung eines dementsprechenden Client
21 Projekt X-Trend Service-orientierte Architektur Erweiterung der Thesaurusverwaltung Verwaltung von Suchen und Projekten Analyse der APA PowerSearch Suchergebnisse Extraktion von Personen-, Orts und Zeitbezügen Extraktion von Schlüsselwörtern Filtern auf Basis der bereitgestellten/extrahierten Metadaten Artikel Warenkorb und Vergleich von Suchen Fuzzy Analyse von Nennungen Automatisches Vorschlagen von Wertungsbegriffen Automatisches Vorschlagen von weiterführenden Suchbegriffen für Nennungen
22 Projekt X-Trend / X-Trend Client
23 Projekt X-Trend / X-Trend Client
24 Vielen Dank für Ihre Aufmerksamkeit Waltraud Wiedermann Michael Granitzer