Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Identifikation der geographischen Lage von Zeitungsartikeln (GIR) Masterarbeit von Tobias Brunner Betreuung: Dr. R. S. Purves.

Ähnliche Präsentationen


Präsentation zum Thema: "Identifikation der geographischen Lage von Zeitungsartikeln (GIR) Masterarbeit von Tobias Brunner Betreuung: Dr. R. S. Purves."—  Präsentation transkript:

1 Identifikation der geographischen Lage von Zeitungsartikeln (GIR) Masterarbeit von Tobias Brunner Betreuung: Dr. R. S. Purves

2 Motivation Suchmaschinen können mit geographischen Anfragen oft wenig anfangen...

3

4

5

6

7 Motivation Zeitungsabschnitte Aufgrund von räumlichen Unterteilungen »Scan von NZZ-Vorderseite

8 Forschungsstand und -kontext geoCLEF GIR: –Geographic information retrieval (GIR) is concerned with providing access to geo- referenced information sources (Larson 2000). –Toponym Detection –Toponym Resolution / Disambiguation –Indexing

9 Toponym Detection Erkennung von Ortsnamen Methoden: –Gazetteer Lookup GETTY, Geonames, WorldGazetteer, GNIS, NIMA, Bevölkerungsstatistik.de –NER-Systems Regel-basiert, statistisch Z.B. GATE

10 Toponym Resoultion / Disambiguation Zuweisung von Footprint an Toponym Problem der Mehrdeutigkeit von Toponymen: –Coocurrence (z.B. in Wikipedia) –Hierarchisch –Map-Distance

11 Indexing Spatial Index Textual Index

12 Problemstellung und Zielsetzung (1) Statistische Auswertung der Gazetteers (2) Zuweisen von Footprint an Zeitungsartikel (3) Räumlicher Vergleich der Südostschweizartikel mit den NZZ- Artikeln

13 1. Statistische Auswertung Methodik: –Statistische Methoden in Java programmieren –Daten: Swissnames und Geonames These: Die räumliche Verteilung von mehrdeutigen Ortsnamen ist gleich wie die allgemeine Verteilung von Ortsnamen.

14 SwissNames (nur Schweiz): –Swisstopo –Kommerziell – Einträge –Hierarchische Angaben (Gemeinde, Kanton) –Typinformationen –Koordinatensystem: H1903 Geonames (weltweit): –Wiki-style User-Editing –Mehr als 8 Mio. Einträge –Hierarchische Angaben: Land –Typinformationen –Koordinatensystem: WGS84

15 Erste Ergebnisse (1)

16 Erste Ergebnisse (2)

17 Mögliche Erklärung...

18 2. Zuweisen von Footprint an Zeitungsartikel Methodik: –Toponym Detection: Gazetteer Lookup (GATE, SwissNames, Geonames) –Toponym Resolution / Disambiguation: Hierarchische Beziehungen Metonyme: Regeln

19 3. Räumlicher Vergleich von Südostschweiz- mit NZZ-Artikeln These: Artikel lokaler Zeitungen sind stärker auf ihre Region fokussiert als diejenigen global erhältlicher Zeitungen Aufbauend auf 2. Teil der Arbeit Statistischer Vergleich der Verteilung der Footprints

20 Problempunkte SwissNames: mehrmalige punkte Kombination SwissNames und Geonames Deutsche Sprache: –Gross-/Kleinschreibung –Satzstellung Zeitungstexte politischer Natur –Metonyme (z.B. Zug, Bern) –Location?

21 Zeittafel/Meilensteine

22 Zusammenfassung GIR Statistische Auswertung von SwissNames und Geonames Zuweisen von Footprints an Zeitungsartikel Vergleich von Südostschweizartikeln und NZZ-Artikeln In Java programmiert

23 Quellen Cunningham, Hamish et al. (2007): GATE - General Architecture for Text Engineering. Zugriff: http://www.gate.ac.uk Geonames (2007): Zugriff http://www.geonames.org Larson, Ray R. (2000): Geographic Information Retrieval and Spatial Browsing. https://sherlock.sims.berkeley.edu/geo_ir/PART1.html, Zugriff: https://sherlock.sims.berkeley.edu/geo_ir/PART1.html SwissTopo (2006): SwissNames - Georeferenzierte Sammlung der Landeskartennamen. Zugriff:


Herunterladen ppt "Identifikation der geographischen Lage von Zeitungsartikeln (GIR) Masterarbeit von Tobias Brunner Betreuung: Dr. R. S. Purves."

Ähnliche Präsentationen


Google-Anzeigen