Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
Breaking the Language Barrier
Personal Translator (Program za automatsko prevođenje) - Osnove - - Leksikon - Autor: Vera Aleksić , Grac
2
Uvod Lingatec je jedan od vodećih proizvođača iz oblasti jezičke tehnologije: mašinsko prevođenje, prepoznavanje govora, sinteza govora Personal Translator je komercijalni program za prevođenje. Istorija razvoja: 80-tih godina: LMT, logic based MT (McCord, IBM) 1996: PT en<->de (linguatec, IBM) 1999: PT fr<->de (linguatec) 2007: PT en<->fr,pt,es,it (linguatec,IBM) Das ist meine Notiz
3
Pregled glavnih funkcija (prevod, TM, Namer, SmartCorrect, sinteza govora)
Das ist meine Notiz
4
Leksikon kao elektronski rječnik
Monolingvalne informacije (izvorni i ciljni jezik): Vrsta riječi Morfologija Sintaksa Semantika Transfer: Prevod(i) Ograničenja/uslovi Domen/Profesija Primjeri Das ist meine Notiz
5
Lexikon: kodiranje novih riječi od strane korisnika
Das ist meine Notiz
6
Osnove Personal Translatora
Gramatika se zasniva na modelu “proreza i ispunjivača” (slot-and-filler-grammar); napisana je u Prologu analiza se bazira na primjeni lingvističkih pravila (od verzije PT006 kombinovano sa statističkim metodama za rješavanje višeznačnosti u kontekstu) analiza je “lexicon-driven”, to znači: leksikon mora da sadrži sve morfološke, sintaksičke, semantičke i pragmatičke informacije, potrebne za prevod ne samo gramatika, nego i leksikon uključuje veliki broj akuratno uređenih pravila za analizu -> transfer -> generisanje Das ist meine Notiz
7
Šematski prikaz transfera
semantička analiza transfer sinteza sintaktička analiza Das ist meine Notiz izvorni text ciljni text
8
Leksikon: informacije potrebne za analizu
Leksikon je u bazi podataka DB2 (interni naziv: TransLexis) Parametri unosaka (entries): n(NSense,SemType,NSlots) v(VerbSense,SemVType,Subj,Slots) adj(AdjSense,SemAType,Slots) adv(AdvSense,SemType,Slots) det(DetSense,Number,DType) prep(PrepSense,ModType,ObjType) pron(PronType,PronSense,Number,Dtype) propn(SemPType,Number) subconj(Semtype) qual(Semtype,Side,Qtype) ... Das ist meine Notiz
9
Leksikon: informacije potrebne za transfer i sintezu
Uslovi za prevod i ograničenja: Domen Regionalne varijante br/am engl; pt/br pt ... Osobenosti riječi u originalu broj; upotreba (adv,pred, atr ...); modus; forma (pap)... “Prorezi i ispunjivači” obavezni/optionalni prorezi; ispunjeni, prazni, nerealizovani; osobine ispunjivača Test konteksta Strukturalne promjene: dodjela argumenata ciljne riječi argumentima originala promjena vrste riječi (adj->n; adv->vb; n->adj) brisanje, dodavanje ili pomjeranje konstituenata (člana, objekta, refleksivne zamjenice itd.....) Das ist meine Notiz
10
Lemma Homonym1 = (POS 1) (definisan preko pos i/ili infl, gd…; obl-attr: stem, sense) Stem / Secondary stem (obl-atr: scope ) Inflection (obl-attr: de: gd,infl,fuge; fr,it,pt,es: gd; nu wenn plt, sgt; irr…) Sense1: (definisan preko syn/sem/slots; dalji attr: prio,reg,style) (Slots: [Slot1,Slot2,…|Slotn]) (argumentska struktura) Translation1: (prevod; attr: conds, xfs, seq) • Conditions: [AdjConstrs,Syn/Sem1,…|Syn/Semn] (globalni: domen,reg, style; slot- realizacija; morph sl; syn:path tests) • Transformations: [TargetSlot1,…|TargetSlotn] -> xf(Transfos) (strukturalne izmjene u ciljnom jeziku) Translation2: Word • Conditions: [AdjConstrs,Syn/Sem1,…|Syn/Semn] • Transformations: [TargetSlot1,…|TargetSlotn] -> xf(Transfos) Translationn ... (default) Concept (semantički tipovi uređeni hijerarhijski; ontologija) Domen (tematski tipovi uređeni hijerarhijski) Sense2: ... Homonym2 Das ist meine Notiz
11
Značenja su nezavisna, ako su prorezi obligatorni:
verlassen [subj(n),rflx1(a)|comp1(p([auf|acc]) '|' dass)] [subj(n)|obj1(n)] U suprotnom je raspored važan: einbrechen [subj(n),comp1(ptcl(ein))|comp(p([in|acc]))] (1) [subj(n),comp1(ptcl(ein))|obj(n)] (2) Primjer: Er bricht in das Haus ein. (1) Er bricht die Mauer ein. (2) Er bricht ein. (1) Tehnički bi bilo moguće kombinovati gornje dvije argumentske strukture u ovakvu jednu: [subj(n),comp1(ptcl(ein)),obj(n)|comp(p([in|acc]))]
12
Problemi kod prevoda višeznačnih izraza
Morfološki npr. razlaganje složenica (Stau-becken, Staub-ecken) Leksički npr. homonimija: (Mandel, Schimmel, Bank...) Sintaktički idiomi i fraze (not at all; at all levels) Sintaktičko-semantički inverzija (Gras frisst die Kuh) Referencijalni prevod zamjenica (Das Mädchen ist traurig. Es hat seine Tasche veroloren). Das ist meine Notiz
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.