Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Breaking the Language Barrier

Ähnliche Präsentationen


Präsentation zum Thema: "Breaking the Language Barrier"—  Präsentation transkript:

1 Breaking the Language Barrier
Personal Translator (Program za automatsko prevođenje) - Osnove - - Leksikon - Autor: Vera Aleksić , Grac

2 Uvod Lingatec je jedan od vodećih proizvođača iz oblasti jezičke tehnologije: mašinsko prevođenje, prepoznavanje govora, sinteza govora Personal Translator je komercijalni program za prevođenje. Istorija razvoja: 80-tih godina: LMT, logic based MT (McCord, IBM) 1996: PT en<->de (linguatec, IBM) 1999: PT fr<->de (linguatec) 2007: PT en<->fr,pt,es,it (linguatec,IBM) Das ist meine Notiz

3 Pregled glavnih funkcija (prevod, TM, Namer, SmartCorrect, sinteza govora)
Das ist meine Notiz

4 Leksikon kao elektronski rječnik
Monolingvalne informacije (izvorni i ciljni jezik): Vrsta riječi Morfologija Sintaksa Semantika Transfer: Prevod(i) Ograničenja/uslovi Domen/Profesija Primjeri Das ist meine Notiz

5 Lexikon: kodiranje novih riječi od strane korisnika
Das ist meine Notiz

6 Osnove Personal Translatora
Gramatika se zasniva na modelu “proreza i ispunjivača” (slot-and-filler-grammar); napisana je u Prologu analiza se bazira na primjeni lingvističkih pravila (od verzije PT006 kombinovano sa statističkim metodama za rješavanje višeznačnosti u kontekstu) analiza je “lexicon-driven”, to znači: leksikon mora da sadrži sve morfološke, sintaksičke, semantičke i pragmatičke informacije, potrebne za prevod ne samo gramatika, nego i leksikon uključuje veliki broj akuratno uređenih pravila za analizu -> transfer -> generisanje Das ist meine Notiz

7 Šematski prikaz transfera
semantička analiza transfer sinteza sintaktička analiza Das ist meine Notiz izvorni text ciljni text

8 Leksikon: informacije potrebne za analizu
Leksikon je u bazi podataka DB2 (interni naziv: TransLexis) Parametri unosaka (entries): n(NSense,SemType,NSlots) v(VerbSense,SemVType,Subj,Slots) adj(AdjSense,SemAType,Slots) adv(AdvSense,SemType,Slots) det(DetSense,Number,DType) prep(PrepSense,ModType,ObjType) pron(PronType,PronSense,Number,Dtype) propn(SemPType,Number) subconj(Semtype) qual(Semtype,Side,Qtype) ... Das ist meine Notiz

9 Leksikon: informacije potrebne za transfer i sintezu
Uslovi za prevod i ograničenja: Domen Regionalne varijante br/am engl; pt/br pt ... Osobenosti riječi u originalu broj; upotreba (adv,pred, atr ...); modus; forma (pap)... “Prorezi i ispunjivači” obavezni/optionalni prorezi; ispunjeni, prazni, nerealizovani; osobine ispunjivača Test konteksta Strukturalne promjene: dodjela argumenata ciljne riječi argumentima originala promjena vrste riječi (adj->n; adv->vb; n->adj) brisanje, dodavanje ili pomjeranje konstituenata (člana, objekta, refleksivne zamjenice itd.....) Das ist meine Notiz

10 Lemma Homonym1 = (POS 1) (definisan preko pos i/ili infl, gd…; obl-attr: stem, sense) Stem / Secondary stem (obl-atr: scope ) Inflection (obl-attr: de: gd,infl,fuge; fr,it,pt,es: gd; nu wenn plt, sgt; irr…) Sense1: (definisan preko syn/sem/slots; dalji attr: prio,reg,style) (Slots: [Slot1,Slot2,…|Slotn]) (argumentska struktura) Translation1: (prevod; attr: conds, xfs, seq) • Conditions: [AdjConstrs,Syn/Sem1,…|Syn/Semn] (globalni: domen,reg, style; slot- realizacija; morph sl; syn:path tests) • Transformations: [TargetSlot1,…|TargetSlotn] -> xf(Transfos) (strukturalne izmjene u ciljnom jeziku) Translation2: Word • Conditions: [AdjConstrs,Syn/Sem1,…|Syn/Semn] • Transformations: [TargetSlot1,…|TargetSlotn] -> xf(Transfos) Translationn ... (default) Concept (semantički tipovi uređeni hijerarhijski; ontologija) Domen (tematski tipovi uređeni hijerarhijski) Sense2: ... Homonym2 Das ist meine Notiz

11 Značenja su nezavisna, ako su prorezi obligatorni:
verlassen [subj(n),rflx1(a)|comp1(p([auf|acc]) '|' dass)] [subj(n)|obj1(n)] U suprotnom je raspored važan: einbrechen [subj(n),comp1(ptcl(ein))|comp(p([in|acc]))] (1) [subj(n),comp1(ptcl(ein))|obj(n)] (2) Primjer: Er bricht in das Haus ein. (1) Er bricht die Mauer ein. (2) Er bricht ein. (1) Tehnički bi bilo moguće kombinovati gornje dvije argumentske strukture u ovakvu jednu: [subj(n),comp1(ptcl(ein)),obj(n)|comp(p([in|acc]))]

12 Problemi kod prevoda višeznačnih izraza
Morfološki npr. razlaganje složenica (Stau-becken, Staub-ecken) Leksički npr. homonimija: (Mandel, Schimmel, Bank...) Sintaktički idiomi i fraze (not at all; at all levels) Sintaktičko-semantički inverzija (Gras frisst die Kuh) Referencijalni prevod zamjenica (Das Mädchen ist traurig. Es hat seine Tasche veroloren). Das ist meine Notiz


Herunterladen ppt "Breaking the Language Barrier"

Ähnliche Präsentationen


Google-Anzeigen