Tanja Eder Slawische Korpuslinguistik 515.005 Prof. Tosovic, SS 2006 Lexikalische Datenbanken WordNet – RussNet EuroWordNet und Global WordNet Association.

Slides:



Advertisements
Ähnliche Präsentationen
» Imagine « Gestaltung von Benutzungsschnittstellen in der Praxis, Beispiele für Hypermedia- Systeme und virtuelle Realität Videoseminar zur Software-Ergonomie.
Advertisements

Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Übung zu Einführung in die LDV I
Wissensmanagement mit semantischen Netzen – Analyse und Vergleich verschiedener Softwarelösungen Autor: Holger Wilhelm Referentin: Prof. Dr. Uta Störl.
Erschließen von semantischen Referenzen mit Ontology-Reasoning-Werkzeugen Das Ziel dieser Masterarbeit war die Erweiterung des ORBI Systems um ein Inferenz-System.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Manuelle Verfahren Klassifizierung Hier werden Dokumente in ein fest vorgegebenes System.
Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.
Der Umgang mit qualitativ erhobenen Daten: Strategien der Datenanalyse
1 Ein Computermodell zur Bestimmung von Begriffstypen Christof Rumpf Heinrich-Heine-Universität Tag der Forschung
Hypertextualisierung mit Topic Maps Ein Ansatz zur Unterstützung des Textverständnisses bei der selektiven Rezeption von Fachtexten.
Grundkurs Linguistik Programm der Vorlesung Oktober
SYSTRAN Information and translation technologies.
Semantisch gestützte Suche im Internet
4 Philologische Methoden Vorlesung 1
Seminar: Verteilte Datenbanken
Spree SoSe 2007 Titel Lexikographie und Metalexikographie Lexikonproduktion und Lexikontheorie Dank an Franziskus Geeb, der mir seine Unterrichtsmaterialien.
- Die wichtigsten Wortarten im Überblick -
Wortarten und Satzglieder
UML Begleitdokumentation des Projekts
Sprachverstehenstest in germanischen Sprachen
Morphologiesystem MORPHY Für Deutsche Sprache:
1 Europäische Gesellschaft für Sprachtesten und Prüfen
Titelmasterformat durch Klicken bearbeiten Formatvorlage des Untertitelmasters durch Klicken bearbeiten Die formalen Sprachen bei ETAP Teil II.
Internet (World Wide Web)
Gradierte Grammatikalität SS 2003 Einheit 1. Quelle des Übels Klassische Linguistik Korpusorientiert (Tote Sprachen/ Literatur- sprachliche Norm) Dialektforschung.
Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik Seminar: Slawische Korpuslinguistik SS 2006 O. Prof. Dr. Branko Tošović
Knowledge Discovery mit Wordnet und Alembic Workbench
Die Naturgesetze der Sprache
EXCEL PROFESSIONAL KURS
Anglo-Amerikanische Korpuslinguistik Anglo-American Corpus Linguistics Erstellt von Gudrun Krenn Slawische Korpuslinguistik SE SS 2006 Dr. Branko Tošović
INFORMATIONSSYSTEM ZUR STUDIERENDENVERWALTUNG OPUS-College.
Virtuelle Forschungsumgebung Games Professor Thaller WS 2010 HKI Hauptseminar I Referent: Nim-Ron Lan.
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
Peter Grzybek ( Graz ) Das Grazer Projekt »Wortlängen(häufigkeiten) in Texten slawischer Sprachen« FWF #15485 ( )
Institut für Slawistik der Karl-Franzens Universität Graz Graz, 25. November 2010 Evaluierung der Grazer Sprachwissenschaft von 2005 bis 2009 Einführung.
Institut für Slawistik der Karl-Franzens Universität Graz Graz, 25. November 2010 Evaluierung der Grazer Sprachwissenschaft von 2005 bis 2009 Perspektive.
DIE UNTERSCHIEDE IN DEN DREI VERSIONEN BOSNISCH- HERZEGOWINISCHER GESETZESTEXTE Eine Analyse phonetisch-phonologischer Unterschiede sowie Wortbildungsunterschiede.
Diplomarbeit Magdalena Kaiser Karl-Franzens Universität Graz Mai 2010
Französisch-Slawische Korpuslinguistik Французско- славянская корпусная лингвистика Aigner Ruth Prenn Linde SE Korpuslinguistik O. Univ.-Prof. Dr. Branko.
Studieren Lernen Claudia Lischke-Arzt.
Visualisierung als Unterstützung des Denkens Visualisierung semantischer Information
Elternabend der Schule … vom …
Web 2.0 Interaktives Internet.
1 Hauptziele Ihrer Schule Hauptziel 1 Bessere Leistungen der Schüler und Schülerinnen (hier Hauptziel 1 eintragen) Hauptziel 2 Bessere Leistungen der Schüler.
Institut für slawistik / Karl-Franzens-Universität Graz, am
Semantic Web.
Fallstudie „intelligentes“ semantisches Netz
Semantische Netze im Recht
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
IB+IA_Anf Structura limbii Sommersemester 2015 Dr. Ileana-Maria RATCU.
Sprache – Geschlecht - Gender
Dreamteam: Web 2.0 und der Katalog Anne Christensen und Thomas Hapke GBV-Verbundkonferenz
Lexikalische Semantik
Arten von Suchwerkzeugen
Konzept Hilfsmittel für Wörterlernen Simplistischer Seitenaufbau à la Google Multimedia – und mehrsprachige Suche Unterstützung für 42 Sprachen Ergebnisse.
HYPERLINK WAS IST DAS WEB 2.0? SEMANTIC WEB.
Webzubi Ein Web 2.0-Netzwerk zur Gestaltung innovativer Berufsausbildung für gewerblich-technische Auszubildende.
Werkzeuge und Unterrichtsbeispiele Uwe Matthias Richter Universität Klagenfurt 30. Mai 2006.
Piktogramm. Definition Ein Piktogramm (von lateinisch pictum ‚gemalt‘ und griechisch graphein, schreiben)lateinisch Bildzeichen, welches Informationen.
Bildungsplan 2016/G8 Standardstufe 6
© WZL/Fraunhofer IPT Entwicklung einer Profilbörse für Konfigurationen von Smartphones Vortrag der Seminararbeit von Patrick Posor Aachen, den
Vo#1:Semantik als Wissenschaft Semantik I Matej-Bel-Universität in Banská Bystrica Zuzana Tuhárska.
200 Jahre der Universität Warschau Dr. Przemyslaw Wolski Zentrum zur Ausbildung von Fremdsprachenlehrern und für Europäische Bildung der Universität Warschau.
GBIF NODES Committee Meeting Kopenhagen, Dänemark 4. Oktober 2009 Das GBIF Integrated Publishing Toolkit Alberto GONZÁLEZ-TALAVÁN Programme Officer für.
der die das Auftragskasten: Substantiv | Nomen | Hauptwort
Kontextualisierte Wortschatzvermittlung mit Hilfe des AWL Highlighters
Wortarten und Satzglieder
 Präsentation transkript:

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Lexikalische Datenbanken WordNet – RussNet EuroWordNet und Global WordNet Association

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 WordNet Über WordNet Verwandte Projekte Datenbank Statistiken Häufig gestellte Fragen

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Über WordNet seit 1985 am Wahrnehmungswissenschaftlichen Laboratorium der Princeton Universität entwickelter Wortschatz der englischen Sprache, unter der Leitung von Professor George A. Miller.

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Über WordNet WordNet besteht aus einer lexikalischen Datenbank ursprünglich entwickelt, um natürlichsprachliche Texte für den Computer verständlich zu machen Datenbank - frei durchsuchbar und kostenlos

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Über WordNet WordNet enthält nur englische Substantive, Verben, Adjektive und Adverben Keine Präpositionen, Partikel, Konjunktionen oder Pronomen wie of, an, the, and, about, because, etc.

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Über WordNet Die folgenden Personen in Princeton arbeiten an der ständigen Entwicklung von WordNet: -Professor George A. Miller -Dr. Christiane Fellbaum -Randee Tengi u.a.

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Über WordNet Developers Forum Robert Oschler Literatur Christine Fellbaum (Hrsg.): Wordnet: An Electronic Lexical Database, Bradford Book, 1998, ISBN X (englisch) Weblinks - WordNet-Homepage - Global WordNet Association WordNet- Visualisierung von

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Verwandte Projekte Semantische Netzwerke Web Interfaces (Schnittstellen) Local Interfaces Erweiterungen Mappings

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Datenbank Statistiken WNhttp://wordnet.princeton.edu/man/wnstats.7 WN Die Summe von allen einzigartigen Nomen, Verben, Adjektiven und Adverben beläuft sich auf

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Häufig gestellte Fragen

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 EuroWordNet Mehrsprachige Datenbank mit WordNets für mehrere europäische Sprachen Projektstart: März 1996 Projektende: Juni 1999

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 EuroWordNet Selbe Struktur wie Princeton WordNet Synsets und semantische Beziehungen einzigartiges spracheninternes System von Lexika alle WordNets sind mit einem inter- sprachlichen Index verbunden (ILI)

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 EuroWordNet Über den Index sind die Sprachen miteinander verbunden Wechsel von Wörtern in einer Sprache zu ähnlichen Wörtern in jeder anderen Sprache

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 EuroWordNet Das Design der Datenbank, die festgelegten Beziehungen und der inter-sprachliche Index wurden auf Eis gelegt

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 EuroWordNet Institutionen und Forschungsgruppen entwickeln ähnliche WordNets in anderen Sprachen (europäische und nicht- europäische), die die technischen Daten von EuroWordNet verwenden

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 EuroWordNet Entwicklung von WordNets für Schwedisch, Norwegisch, Dänisch, Griechisch, Portugisisch, Baskisch, Katalanisch, Rumänisch, Lithauisch, Russisch, Bulgarisch und Slowenisch

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 EuroWordNet Die Grundstruktur von EuroWordNet wird durch die Global WordNet Association weitergeführt

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Global WordNet Association freie und öffentliche Vereinigung, die auf EuroWordNet und Princeton WordNet aufgebaut ist Plattform für Diskussionen, zeigt die Verbindung von WordNets in allen Sprachen

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Global WordNet Association Ziel: weitere Entwicklung von WordNets ankurbeln und WordNets in allen Sprachen der Welt miteinander zu verbinden

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 RussNet Über RussNet о РуссНет Ziel цель Derzeitige Größe теку́щий объём

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 RussNet Projekt Neuigkeiten но́вости прое́кта Quellen исто́чники Methoden ме́тоды

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 RussNet Beziehungen отноше́ния Datenbankstrukturen структу́ра

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 RussNet Definitionen определе́ния Anwendung практи́ческое примене́ние

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Über RussNet О РуссНет lexikalische, semantische Datenbank für die Russische Sprache Abteilung für angewandte und mathematische Linguistik - Philologische Fakultät - St. Petersburger Staatsuniversität

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Über RussNet О РуссНет Das Projekt startete (bzw. 8) Linguisten

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Ziel Цель Entwicklung einer Quelle für allgemeine Zwecke, die das lexikalische System des Russischen als ganzes repräsentiert, das Basisvokabular des modernen Russisch enthält...

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Ziel Цель...und semantische, semantisch- grammatische und semantisch-nachgeahmte Beziehungen zwischen den Wörtern enthält, die für das Russische relevant sind

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Derzeitige Größe Теку́щий объём Mehr als 5500 Synsets: Nomen Synsets, Verb Synsets, Adjektiv Synsets, Adverb Synsets. - ~ Synsets sind für die letzte Ausgabe vorbereitet

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Projekt Neuheiten Но́вости прое́кта 14 Dezember 2003 Beispiel für Datengrundsätze 15 Oktober 2003 Praktische Anwendung und Ergebnisse 13 Oktober 2003 Änderung des Designs. Entstehen der russ. Seite

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Quellen Исто́чники Erklärende Wörterbücher Häufigkeitslisten Assoziationswörterbücher Synonymwörterbücher Thesauri Künstlerische Texte Publizistische Texte

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Methoden Ме́тоды Allgemeine Strategie Sammeln von Grundkonzepten Definitionsanalysen Hergeleitete Analysen Kontextanalysen

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Beziehungen Отноше́ния Beziehungen zwischen Synsets Beziehungen zwischen Wörtern

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Datenbankstruktur Структу́ра Vererbte Konstruktionsgrundsätze PoS files Nomen Verben Adjektive Adverben Erklärungen

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Definitionen Определе́ния nicht nur für maschinelle Benutzung - auch für die menschliche Interaktion entwickelt zusätzliche Informationen, die dem Benutzer helfen Wortbedeutungen bzw. Definitionen schnell zu erkennen

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Anwendung Практи́ческое примене́ние RussNet als einsprachige Quelle RussNet als mehrsprachige Quelle ons_ru.shtmlhttp:// ons_ru.shtml

Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Danke für eure Aufmerksamkeit! Thank you for your attention!! Спаси́бо за внима́ние!!!