Ralf Schenkel joint work with Fabian Suchanek and Gjergji Kasneci YAWN A Semantically Annotated Wikipedia XML Corpus.


Ähnliche Präsentationen
Cadastre for the 21st Century – The German Way

An new European Power Network: Student Power
PSI and Competition The General Framework
Finding the Pattern You Need: The Design Pattern Intent Ontology
Development of a Web-Service for the DIOXIN- Database of Germany
H - A - M - L - E - IC T Teachers Acting Patterns while Teaching with New Media in the Subjects German, Mathematics and Computer Science Prof. S. Blömeke,
Titel | Title {How to give a Presentation} Autor, Arbeitgeber | Author, Affiliation {M. Schubert, FH Regensburg, Univ. of Applied Sciences, Regensburg,
Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung Two Issues on Remote Data Access.
Die ZBW ist Mitglied der Leibniz-Gemeinschaft Copyright © ZBW 2010 Seite 1 Potenziale semantischer Technologien für die Bibliothek der Zukunft Klaus Tochtermann.
Institut für Softwaresysteme in Wirtschaft, Umwelt und Verwaltung Folie 1 DER UMWELT CAMPUS BIRKENFELD ISS Institut für Softwaresysteme in Wirtschaft,
Fakultät für informatik informatik 12 technische universität dortmund Specifications Peter Marwedel TU Dortmund, Informatik 12 Graphics: © Alexandra Nolte,
When people think about Germany, they usually think of……
Institut für Verkehrsführung und Fahrzeugsteuerung > Technologien aus Luft- und Raumfahrt für Straße und Schiene Automatic Maneuver Recognition in the.
Lancing: What is the future? Lutz Heinemann Profil Institute for Clinical Research, San Diego, US Profil Institut für Stoffwechselforschung, Neuss Science.
Lehrstuhl Informatik III: Datenbanksysteme AstroGrid-D Meeting Heidelberg, Informationsfusion und -Integrität: Grid-Erweiterungen zum Datenmanagement.
Comparative Adjectives. The term comparison of adjectives is used when two or more persons or things have the same quality (height, size, color, any characteristic)
Case Study Session in 9th GCSM: NEGA-Resources-Approach
Das Wetter – Bern, Switzerland -5°C to 4°C Wolkig, Sonnig Das Wetter – Zurich, Switzerland Das Wetter – Basel, Switzerland -6°C to 5°C Wolkig, Sonnig -4°C.
die Zeiten (The Tenses) das Aktiv (Active Voice)
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
Eigenbetrieb IT- und Organisationsdienstleistungen Dresden EU Service Directive updated work plan and basics of the final document.
BAS5SE | Fachhochschule Hagenberg | Daniel Khan | S SPR5 MVC Plugin Development SPR6P.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
Command form! Formal Command Otherwise known as the Sie command The only command form where you use the you in the formation of the command. Formation:
der Imperativ Nicht Vergessen! (Don’t forget)
Deutsch 1 G Stunde. Donnerstag, der 25. Oktober 2012 Deutsch 1, G Stunde Heute ist ein B- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
Deutsch 1 G Stunde. Donnerstag, der 18. Oktober 2012 Deutsch 1, G Stunde Heute ist ein E- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
Deutsch 1 G Stunde. Montag, der 22. Oktober 2012 Deutsch 1, G Stunde Heute ist ein F- Tag Unit: Family & homeFamilie & Zuhause Objectives: Conjugations.
Deutsch 1 G Stunde. Donnerstag, der 18. Oktober 2012 Deutsch 1, G Stunde Heute ist ein D- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
Deutsch 1 G Stunde. Dienstag, der 16. Oktober 2012 Deutsch 1, G Stunde Heute ist ein B- Tag Unit: Family & homeFamilie & Zuhause Objectives: Getting to.
Deutsch 1 G Stunde. Montag, der 10. September 2012 Deutsch 1 (G Stunde)Heute ist ein D - Tag Unit: Introduction to German & Germany Objectives: Introducing.
You need to use your mouse to see this presentation © Heidi Behrens.
You need to use your mouse to see this presentation
INTAKT- Interkulturelle Berufsfelderkundungen als ausbildungsbezogene Lerneinheiten in berufsqualifizierenden Auslandspraktika DE/10/LLP-LdV/TOI/
DER FRÜHLING Der Frühling beginnt am 21. März, aber in Nova Scotia ist es im März oft noch kalt, und das Wetter ist meist nicht schön. Erst im Mai wird.
Verben Wiederholung Deutsch III Notizen.
German Commands Brandon Soellner Three ways to say you in German, du, ihr, and Sie. There are 3 types of commands.
Kölner Karneval By Logan Mack
Berner Fachhochschule Hochschule für Agrar-, Forst- und Lebensmittelwissenschaften HAFL Recent activities on ammonia emissions: Emission inventory Rindvieh.
Ein Projekt des Technischen Jugendfreizeit- und Bildungsvereins (tjfbv) e.V. kommunizieren.de Blended Learning for people with disabilities.
Design Patterns Ein Muster (pattern) ist eine Idee, die sich in einem praktischen Kontext als nützlich erwiesen hat und dies auch in anderen sein wird.
Talking about yourself
Demonstration of Performance of CASCOT 5.0
External Labels – The rules For all external labels the following rules apply (external labels are all labels which are not inside of a shape) - all labels.
© Boardworks Ltd of 8 Time Manner Place © Boardworks Ltd of 8 This icon indicates that the slide contains activities created in Flash. These.
Time Expressions with Dative Von: Payton Knuckles.
8.1 Lektion 8 Recht und Umwelt STRUKTUREN © and ® 2012 Vista Higher Learning, Inc Der Konjunktiv II and würde with infinitive Ja, aber ich würde.
(Where are you traveling to?)
Greetings and goodbyes Deutschland v. USA
RZPD Deutsches Ressourcenzentrum für Genomforschung GmbH DESPRAD-Meeting 02/09/2003 Steffen Schulze-Kremer (until 7/2003) Bernd Drescher (since 8/2003)
Basel, September 2, 2008 Work Stream Template: ODM.
Sentence Structure Subject and verb are always together. Subject and verb are always together. Subject and verb must agree Subject and verb must agree.
KIT – die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH) Vorlesung Knowledge Discovery - Institut AIFB Tempus fugit Towards.
Plusquamperfekt The past of the past.
Dyabola Archäologische Bibliographie Römisch-Germanischen Kommission (RGK) Author searches – compound names Bibliotheken Click = next Libraries.
Adjective Endings Nominative & Accusative Cases describing auf deutsch The information contained in this document may not be duplicated or distributed.
KGE Kommunalgrund GmbH Entwicklungsträger der Landeshauptstadt Magdeburg Presentation for the REDIS Project at the Interim Conference.
Technische Universität München 1 CADUI' June FUNDP Namur G B I The FUSE-System: an Integrated User Interface Design Environment Frank Lonczewski.
TUM in CrossGrid Role and Contribution Fakultät für Informatik der Technischen Universität München Informatik X: Rechnertechnik und Rechnerorganisation.
Noch most directly has the meaning of still. As such, it has basically for types of usage. The temporal usage of the word. (as it relates to time) can.
Lust auf Lesen Treffpunkt Deutsch Sixth Edition
Proposal for a unified XML-file of the avalanche report... © Patrick NAIRZ, Avalanche Warning Center Tyrol - Why do we need a unified XML-file? - Integration.
1 Christopher Oezbek, Seminar „Software aus Komponenten“ Literature Search Christopher Oezbek Freie Universität Berlin, Institut.
Physik multimedial Lehr- und Lernmodule für das Studium der Physik als Nebenfach Julika Mimkes: Links to e-learning content for.
The „Perfekt“ tense The German „Perfekt“ tense is a past tense that is similar to the English present perfect. For weak German verbs the rule for forming.
Komparativ und Superlativ German 2. zum Beispiel … Ein VW ist schnell. Ein BMW ist schneller. Ein Porsche ist am Schnellsten. There are 2 levels of comparison:
Du bist am dicksten und am dümmsten.
Niedersächsisches Ministerium
 Präsentation transkript:

Ralf Schenkel joint work with Fabian Suchanek and Gjergji Kasneci YAWN A Semantically Annotated Wikipedia XML Corpus

8. März 2007BTW 2007, Aachen 2 Results for Konferenz Aachen NRW KULTURsekretariat Relevanz: 5.9% - -NRW KULTURsekretariat Pfadfinderinnenschaft Sankt Georg Relevanz: 5.7% - -Pfadfinderinnenschaft Sankt Georg Konferenz der deutschsprachigen Mathematikfachschaften Relevanz: 5.2% - -Konferenz der deutschsprachigen Mathematikfachschaften Leonard Monheim Relevanz: 5.1% - -Leonard Monheim Andreas Kruse Relevanz: 4.9% - -Andreas Kruse Holzbau Relevanz: 4.9% - -Holzbau Wolfgang Seifen Relevanz: 4.9% - -Wolfgang Seifen Feldpost der Belgier in Deutschland nach dem Ersten Weltkrieg 1918–1935 Relevanz: 4.1% - -Feldpost der Belgier in Deutschland nach dem Ersten Weltkrieg 1918–1935 Konferenz der Informatikfachschaften Relevanz: 4.0% - -Konferenz der Informatikfachschaften UNESCO-Club Relevanz: 3.7% - -UNESCO-Club Kaiser/Riegraf-Gruppe (Heilbronn) Relevanz: 3.7% - -Kaiser/Riegraf-Gruppe (Heilbronn) Niederländische Annexionspläne nach dem Zweiten Weltkrieg Relevanz: 3.6% - -Niederländische Annexionspläne nach dem Zweiten Weltkrieg Find a page of a conference that is related to Aachen. Limit query to certain classes of result pages

8. März 2007BTW 2007, Aachen 3 Source for Classes: WordNet Thesaurus ROOT entitygroup thingliving_thing person entertainerscientist physicistbiologistmusicianactor meeting conferencecongress minority More than concepts

8. März 2007BTW 2007, Aachen 4 Mapping Pages to Concepts city Automatic mapping with high quality

8. März 2007BTW 2007, Aachen 5 Architecture Wikipedia Pages (Wiki Markup) HTML TopX Search Engine Concept Mapper Wikipedia Pages (Annotated XML) Wikipedia Pages (XML)

8. März 2007BTW 2007, Aachen 6 Concept Mapping (1): Categories Manually added category information in most pages Example: Albert Einstein Excellent_articles 1879_births Physics Swiss_physicists Technically: exclude admin categories, shallow parsing of category labels, stemming, mapping heuristics

8. März 2007BTW 2007, Aachen 7 Concept Mapping (2): Regular Structure Regular structures (list, tables, …) often indicate similar concepts Example: List of people Albert Einstein Max Planck Nils Bohr Werner Heisenberg Technically: grouping of similar XPath expressions, find coherent annotations, frequency & confidence thresholds physicist

8. März 2007BTW 2007, Aachen 8 Concept Mapping (2): Regular Structure Technically: grouping of similar XPath expressions, find coherent annotations, frequency & confidence thresholds /article[1]/…/list[3]/item[1]/link[1] /article[1]/…/list[3]/item[2]/link[1] /article[1]/…/list[3]/item[3]/link[1] /article[1]/…/list[3]/item[4]/link[1] Regular structures (list, tables, …) often indicate similar concepts Example: List of people

8. März 2007BTW 2007, Aachen 9 Concept Mapping (3): Outlier Detection Sometimes conflicting annotations of the same page: ROOT entity thingliving_thing person ruler artifact instrument ruler Solution: Compatibility matrix for high-level concepts king Kings_of_Spain European_rulers ?

8. März 2007BTW 2007, Aachen 10 YAWN: Annotated XML Add concept tag(s) to articles … Add concept tag(s) to outgoing links … Saarbrücken

8. März 2007BTW 2007, Aachen 11 Querying YAWN Map concept queries to XPath expressions conferences in Aachen: //conference[contains(.,Aachen)] scientists who won a nobel prize: //scientist[contains(.,Nobel prize)] musicians who performed a song where space occurs in the title: //musician[contains(//song,space)] Not for end users! Needs good user interface

8. März 2007BTW 2007, Aachen 12 Left Overs and Summary XML Conversion Templates Preliminary evaluation See paper Automated detection and annotation of concepts is useful for retrieval.

8. März 2007BTW 2007, Aachen 13 The Future: YAGO [WWW07] city area state AachenNRW is_a instance_of located_in Querying the knowledge representation

8. März 2007BTW 2007, Aachen 14 Thank you!