Das kombinatorische Wörterbuch von ETAP

Slides:



Advertisements
Ähnliche Präsentationen
Einführung in die Germanistische Linguistik
Advertisements

Vorlesung Compilertechnik Sommersemester 2008
Semantik und Wissensrepräsentation
spezielle Nutzersichten formale Ebene (deskriptive Regeln)
Übung zu Einführung in die LDV I
Die Neuen Regeln für die Getrennt- und Zusammenschreibung
SYSTRAN Information and translation technologies.
Lexikalisch-Funktionale-Grammatik
Grundlegende Analysen & Zwischendarstellungen
- Die wichtigsten Wortarten im Überblick -
Wortarten und Satzglieder
Morphologiesystem MORPHY Für Deutsche Sprache:
Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen.
Grundelemente der Dependenzsyntax
Titelmasterformat durch Klicken bearbeiten Formatvorlage des Untertitelmasters durch Klicken bearbeiten Die formalen Sprachen bei ETAP Teil II.
Die formalen Sprachen bei ETAP
Презентация урока по теме
Wortarten-Bestimmungs-Maschine
Linguistische Analyse von russischen Plakaten aus dem Bereich der Wirtschaftswerbung Präsentation der Diplomarbeit Wolf Petra Graz, Jänner 2007 Betreuer:
Alle zeitwelige Formen des Verbes.
Глаголы kennen и wissen.
Relativpronomen Da steht der Junge, der so gut Gitarre spielt.
1 Branko Tošović Slawische grammatische Systeme Russisch.
Модальные глаголы Это глаголы, выражающие своё отношение к действию.
Diplomarbeit Magdalena Kaiser Karl-Franzens Universität Graz Mai 2010
Die Schreibung von Präpositionen, Konjunktionen, Partikeln, Interjektionen und lautmalerischen Wörtern im Russischen Schellander Michaela
Der ideale Mitarbeiter
Grammatik auf Deutsch.
Lernprogramm zur Bestimmung der Wortarten
Satzsemantik Verben, Aktionsarten und semantische Rollen -
Wortbildung: Grundlagen, Klassen von Affixen
Modalverben Модальные глаголы.
Übung zu Einführung in die LDV I
Musik. Unbestimmte Pronomen.
Rekonstruktion der Funktionen Erläuterung zur Inzidenz: Zur Inzidenz u.a.: Aspekttheorie 4.3. und Lehmann 2011AspekttheorieLehmann Inzidenz = episodischer.
«СКЛОНЕНИЕ ИМЕН СУЩЕСТВИТЕЛЬНЫХ В НЕМЕЦКОМ ЯЗЫКЕ»
Я и моя семья Ich und meine Familie:
Die Lateinische Sprache
Das große Rätsel der Satzglieder
«Akkusativ – образование, тренировка, контроль»
Teil II: Phrasen und Phrasenstruktur
Meine Traumferien Каникулы моей мечты
Склонение прилагательных
Die Heimat Klasse 7. Man fährt nach Osten man fährt nach Westen, aber zu Hause ist es am besten!
Tasks UNDERSTAND KNOW COMPREHEND know comprehend understandit ž, n, d, c, r, s, t, a, n, d w, t žn dcr stan dwt [žn] – [dcr] – [stan] – [dwt] SELECTION.
(Pronomina, Fürwörter)
Grundzüge der Morphologie des Deutschen Hilke Elsen ISBN: © 2014 Walter de Gruyter GmbH, Berlin/Boston Abbildungsübersicht / List of.
Wortarten Verben - veränderbare (flektierbare) Wortart, die eine Tätigkeit, ein Geschehen, einen Vorgang oder einen Zustand bezeichnet - konjugierbar.
IB+IA_Anf Structura limbii Sommersemester 2015 Dr. Ileana-Maria RATCU.
Funktionale Unifikations-Grammatik (FUG)   Hauptmerkmale der FUG.
Funktionale Unifikations-Grammatik (FUG)  Hauptmerkmale der FUG.
Lexikalisch-Funktionale-Grammatik  Formaler Aufbau der F-Strukturen  Funktionale Beschreibungen  Funktionale Annotationen  Von der K-Struktur zur F-Struktur.
Merkmale und Merkmalstrukturen
Lexikalische Semantik
Die Grammatik versucht Wörter und Sätze zu ordnen
Michael Waltisberg Moderne arabische Schriftsprache III Lektion 27.
Deutsche zusammengesetze Wörter
Das Verb - глагол Handlungen (Tätigkeiten, Vorgänge, Zustände)‏ Kategorie des Aspekts, des verbalen Genus, des Modus, des Tempus, des Person, des Numerus.
Laura Benčíková Laura Benčíková 2.Bc 2.Bc NjHi NjHi 2014/ /2015.
Methodische Gesichtspunkte für das analytische Lesen 5.Studienjahr.
Das Zahlwort. Die Zahlwörter bezeichnen: -eine Zahl oder (in Verbindung mit Substantiven) eine bestimmte Anzahl von Gegenständen: Grundzahlwörter; -Den.
WORTARTEN deklinierbare, konjugierbare, unflektierbare Wortarten
Wortarten Übersicht Scheicher 2009.
Was aus der S1 Klasse behalten werden sollte
der die das Auftragskasten: Substantiv | Nomen | Hauptwort
ADJEKTIVDEKLINATION.
Vorlesung 12 Nominalphrase
Partizpialkonstruktionen
Wortarten und Satzglieder
الدرس الاول.
 Präsentation transkript:

Das kombinatorische Wörterbuch von ETAP Syntaxanalyse des Russischen im maschinellen Übersetzungssystem ETAP-3 Prof. Dr. F. Guenthner, R. Zangenfeind Referentin: Elena Levushkina LMU München CIS Das kombinatorische Wörterbuch von ETAP 11.06.2008

Typen der Lexeminformation Im Gegensatz zu den allgemeinen Regeln werden die Schablonen- und Wörterbuchregeln nur auf die Phrasen angewandt, deren lexikalisches Potential das verlangen könnte. Die Wortinformation wird in zwei Typen unterteilt: Klassifikatonsinformation – Information über die Wortmerkmale, auf die Systemregeln verweisen können (Wortart, syntaktische und semantische Merkmale, Abhängichkeiten der Aktanten im RM) Operationsinformation – Information über die Schablonen- oder Wörterbuchregeln.

Klassifikationsinformation im KW Ein Wortartikel beschreibt genau ein Lexem (eine Bedeutung des Wortes). Er fängt mit einer Kopfzeile an, die Artikelnummer und den Lexemnamen enthält. Wenn das Wort lexikalisch-grammatikalische Homonyme besitzt, enthält der Name jedes Lexems einen Index ЧТО1 (союз) vs. ЧТО2 (союзное слово) Klassifikationsinformation wird in einem Artikel in vier Bereichen wiedergegeben. Jeder Bereich wird mit einem speziellen Zeichen eingeführt: POR: Wortart SYNT: syntaktische Merkmale DES: semantische Merkmale Di,j: Zeilen, die das RM beschreiben (TRANS: Triviale Übersetzung eines russischen Lexems in Englisch)

Klasse A enthält außer den kanonischen Adjektiven Wortartbereich In diesem Bereich nach dem POR-Zeichen wird das Symbol eines Wortarts angegeben. S (Substantiv), A (Adjektiv), ADV (Adverb), NUM (Zahlwort), V (Verb), CONJ (Konjunktion), PR (Präposition), PART (Partikel), COM (die erste Komponente der zusammengesetzten Wörter wie франко-русский) Klasse A enthält außer den kanonischen Adjektiven Pronominaladjektive: этот, тот Possesivpronominale Adjektive: мой, твой, ваш, наш Interrogativpronomen: какой, чей Indefinitpronominale Adjektive: другой, некоторый, любой Ordnungszahlwörter: первый, второй Komplexe Pronominaladjektive: какой-то, кое-какой

Klasse S enthält außer den kanonischen Subatantiven Wortartbereich Klasse S enthält außer den kanonischen Subatantiven Personalpronomen что2, кто Interrogativpronomen который Relativpronomen некто, нечто Reflexivpronomen себя Negativpronomen никто, ничто Demonstrativpronomen это1, то1 Komplexe Substantivpronomen кое-кто, кое-что, кто-либо, что-то Klasse ADV enthält außer den Adverbien Einführungswörter und Wendungen естественно, вероятно, по всей видимости Pronominaladverbien где, когда2, там, туда Prädikativa жаль, можно, некогда Quantifikatoren мало, много, несколько

Bereich der syntaktischen Merkmale Unter syntaktischen Merkmalen versteht man Abkürzungen der Wortmerkmale, die die Worteinbindung in die einen syntaktischen Konstruktionen erlauben und nicht in die anderen количест две большой важности проблемы *две большой важности проблемы Zusammenhang zwischen syntaktischen Merkmalen und morphologischen Charakteristiken (m, f, n, belebt): Klassifikationsrolle bei den Substantiven (syntaktische Merkmale) Flexion bei den Adjektiven und Verben (morphologische Merkmale)

Syntaktische Merkmale der Verben ВВОД-1: Verben, die einen Nebensatz eingeführt mit der Präposition что, чтобы als ersten Aktanten haben und die mit der Konjunktion как in der Einführungskonstruktion verwendet werden können ВОДИТЬСЯ, ВЫЯСНЯТЬСЯ, ОКАЗАТЬСЯ, ПОЛАГАТЬСЯ… Некоторые сотрудники, как выяснилось в ходе расследования, не соблюдали элементарных правил техники безопасности ВВОД-2: Verben, die einen Nebensatz eingeführt mit der Präposition что, чтобы als zweiten Aktanten haben und die mit der Konjunktion как in der Einführungskonstruktion verwendet werden können ВИДЕТЬ, ВЫЯСНЯТЬ, ГОВОРИТЬ, ДУМАТЬ, СЧИТАТЬ… Некоторые сотрудники, как выяснила группа в ходе расследования, не соблюдали элементарных правил техники безопасности

Syntaktische Merkmale der Verben ГРАД: Verben, die eine Steigerungssituation beschreiben und Adverbien wie очень, весьма, немного, чуть-чуть anschließen können ВЫРАСТИ, ЛЮБИТЬ, УСТАВАТЬ, ХОТЕТЬ, ОБИДЕТЬСЯ… Он немного обиделся на меня ИЗМЕН: Verben, die Veränderung des Zustandes oder der Lage im Raum bedeuten und mit der adverbialen Bestimmung wie на три дня verwendet werden können ВСТАВАТЬ, ПРИХОДИТЬ, УЕЗЖАТЬ, ЗАМОЛЧАТЬ… Он уехал на неделю в командировку МГНОВ: Verben der augenbliklichen Handlung, die nicht mit den adverbialen Dauerbestimmung wie долго, неделю, три дня verwendet werden können ВЕЛЕТЬ, ДОСТИГАТЬ, КАСАТЬСЯ, НАХОДИТЬ, ПРИХОДИТЬ *судно целый день приходило в порт

Syntaktische Merkmale der Verben МОД: Modalverben МОЧЬ, УМЕТЬ, ХОТЕТЬ… РДОП: transitive Verben, die den Wechsel von Akkusativ des Objekts gegen Genitiv im Negierungskontext zulassen ДЕЛАТЬ, ЕСТЬ, ПИТЬ, ЧИТАТЬ, ВИДЕТЬ… Все читали эту книгу -> Никто не читал этой книги РДОПЛОТР: transitive Verben, die den Wechsel von Nominativ des Subjekts gegen Genitiv im Negierungskontext zulassen БЫТЬ, БЫВАТЬ, ИМЕТЬСЯ, СУЩЕСТВОВАТЬ, ПОСТУПАТЬ… Такие сведения в институт еще не поступали -> Таких сведений в институт еще не поступало

Syntaktische Merkmale der Substantive ЖЕНСК; МУЖСК; СРЕДН АГЕНС: Substantive, die agentive Objekte sein können bei der Passivform des Verbes ЧЕЛОВЕК, АЛГОРИТМ, СОЛНЦЕ Запрос обрабатывается компьютером ВРЕМ: Substantive mit der Bedeutung eines Zeitpunkts oder -intervals ГЕОГР: Subtantive mit der Bedeutung eines geographischen Objekts, die keine Eigennamen sind ГОРА, ГОРОД, РЕКА, СТРАНА… ДЕН: Währungsnamen ИЗМЕР: Maßeinheiten ИСЧИСЛ: zählbare Substantive, die in Mengen- und Sammelgruppen verwendet werden können ЛИЧН: Personalpronominale Nomen

Syntaktische Merkmale der Substantive ПРОФ: Substantive in Maskulinum, die einen Beruf bezeichnen und ein Verb oder Adjektiv in Femininum zulassen ВРАЧ, ДИРЕКТОР, ПИЛОТ… В комнату вошла администратор гостиницы СОВОК: Substantive mit der Bedeutung einer Gesamtheit, die prädikative Konstruktionen bilden können БОЧКА, ГРУППА, ЗАВОД, ЯЩИК… Коров было огромное стадо ТВОРОБСТ: Substantive mit der zeitlichen Bedeutung, die im Instrumental als adverbiale Bestimmung auftreten können ВЕСНА, ВРЕМЯ, ПОРА… приехать зимой, встречаться летней порой

Semantische Merkmale Richtigkeit der syntaktischen Konstruktionen hängt oft von den semantischen Kongruenz der Wörter ab. Beiordnende (сочинительные) Konstruktionen sind ein anderer Teil des symantischen Sprachsystems, wo semantische Kongruenz geprüft werden muss. *Оборудование поступило на завод и в феврале In der beschriebenen ETAP-Version werden 18 semantische Merkmale (Deskriptoren) verwendet Es werden hauptsächlich semantische Merkmale der Substantive und Verben beschrieben.

Semantische Merkmale Für die Prüfung der semantischen Kongruenz werden zwei Prädikate benutzt: CORDES und CODES Bedingung CORDES der deskriptiven Kongruenz zwischen dem Hauptwort X und dem regierten Wort Y ist erfüllt, falls Y eins der Descriptoren besitzt, die in der entsprechenden Spalte des RMs von X aufgeführt sind, oder Y hat gar keinen Descriptor oder in der RM-Spalte von X sind keine Descriptoren aufgeführt. Bedingung CODES der deskriptiven Kongruenz zwischen den Wörtern X und Y, die Bestand einer beiordnenden Konstruktion sind, ist erfüllt, falls X und Y mind. einen gemeinsamen Deskriptor haben oder einer von den beiden gar keinen Deskriptor besitzt

Deskriptoren in ETAP-3 ВЕЛИЧИНА: Maßeinheiten wie год, доллар, метр ВЕЩЕСТВО: z.B. воздух, газ, масло ВРЕМЯ: Zeitwörter wie будущее, десятилетие ДЕЙСТВИЕ: Handlung, z.B. работа, анализ, измерять ИНФОРМАЦИЯ: z.B данные, опыт, уравнение, смысл КРИСТАЛЛ: Subatantive mit der Bedeutung eines Teils, einer Menge oder einer Klasse der Objekte z.B. порция, слой, часть, компонент Покрасить дверь голубой краской Покрасить дверь двумя слоями голубой краски ЛИЦО: eine Person oder Organisation – агентство, оператор МЕХАНИЗМ: Bezeichnungen der Geräte, Mechanismen wie z.B. детектор, компьютер

Deskriptoren in ETAP-3 ОТНОШЕНИЕ: контраст, граничить ПАРАМЕТР: messbare Parameter wie температура, цена, масса ПРЕДМЕТ: unbelebtes Objekt ПРОСТРАНСТВО: ein Objekt, für das seine physische Größe relevant ist, z.B. Аэропорт, область ПРОЦЕСС: Situationen mit einem passiven Subjekt, dessen Zustand sich verändert – рост, таять СВОЙСТВО: langfristige Eigenschaften von Objekten, Prozessen, Handlungen wie опасность, удобство СОСТОЯНИЕ: возможность, нужда, лежать СФЕРА: Fachgebiete wie биология, промышленность ФАКТ: Ereignisse, z.B. авария, происшествие ЭНЕРГИЯ: Substantive wie ток, ион, напряжение

RM-Bereich Im RM-Bereich werden Rektionsmerkmale der Prädikate beschrieben, d.h. welche Anforderungen stellt das gegebene Prädikat an die Kandidate für seine Argumente (Aktante). Ein Rektionsmodell wird als eine Zeilenmenge dargestellt. Jede Zeile wird mit dem Zeichen Di,j eingeführt und ethält eine Term- oder Lexemmenge. RM für das Wort СРАВНЕНИЕ D1.1:РОД, ´ЛИЦО´ D1.2:ТВОР D2.1:РОД D3.1:С3 D4.1:ПО1

Operationsinformation In einen Wortartikel vom KW können zwei Arten der Operationsinformation eingeschlossen werden: Ein Verwies auf eine Schablonenregel oder Eine ganze Regel Regeltypen: Syntaktische Analyse Normaliesierung Semantisierung

Beispiel zum Wortartikel 03918 ДАВЛЕНИЕ POR S SYNT СРЕДН, ЕД!, ПАРАМ, ХАРАКТТВОР DES ´ДЕЙСТВИЕ´, ´ПРОЦЕСС´, ´ФАКТ´ D1 1 РОД D2 1 НА1 D3 1 В1, ´ВЕЛИЧИНА´ D3 2 ИМ, ´ИЗМЕР´ TRAF АТРИБ 15

Literatur Ю.Д. Апресян et al.: Лингвистический процессор для сложных информационных систем. Москва 1992 (Kapitel 6.1)