Breaking the Language Barrier

Slides:



Advertisements
Ähnliche Präsentationen
SCHWACHE VERBEN IM PRÄSENS
Advertisements

Autor: Vera Aleksić , Graz Breaking the Language Barrier Sprachtechnologieprodukte der Firma Linguatec, München: - Personal Translator
Schulen in Deutschland
EINFÜHRUNG UVOD NJEMAČKI JEZIK.
Man sagt, dass es nur 1 Minute braucht,
Provjere i provjera kompetencija - sastavljanje testova Dean Mencinger (predložak sastavile Marijana Vučić - Pećnik i Natalija Andraković Kostanjevac,
Test 1 Test 2 Test 3. Test 4 Test 5 Test 6 Test 7 Test 8 Test 9.
Preterit Preterit pravilnih glagola se gradi od: glagolske osnove i nastavaka: npr. wohnen 1.-te 2.-test 3.- te 1.-ten 2.-tet 3.-ten.
Tvorba prezenta u njemačkome jeziku © Dalibor Joler,
Ponavljanje Klik auf Deutsch 5. Präsens (sadašnjost) Monika ________ gern Pizza und _________ gern Cola. (essen/trinken) __________ du lange am Morgen?
1 Abteilung | | © Bosch Thermotechnik GmbH Alle Rechte vorbehalten, auch bzgl. jeder Verfügung, Verwertung, Reproduktion, Bearbeitung,
PCNEWS-Datenbanken ( ). Homepage-Elemente.
Drugi kolokvijum Za drugi kolokvijum iz Nemačkog 2 podrazumeva se gradivo10, 11. i 12. lekcije iz knjige “BERLINER PLATZ 1”
Interrogatives and Verbs
Izgovor i pisanje nemačkih glasova
tvorba prezenta u njemačkome jeziku
Rečenice s veznikom dass
9. Andrićev simpozij posvećen romanu „Gospođicaˮ
Prvi kolokvijum Za prvu godinu učenja nemačkog jezika podrazumeva znanje iz prve tri lekcije iz knjige “BERLINER PLATZ 1”
Pronominaladverbien Zamjenički prilozi.
Prvi kolokvijum Za drugu godinu učenja nemačkog jezika podrazumeva znanje iz 7, 8. i 9. lekcije iz knjige “BERLINER PLATZ 1”
Test I i II Zimski semestar 2017/18 Za prvi i drugi test iz nemačkog jezika 3 obuhvaćeno je gradivo iz i 15 lekcije iz knjige “BERLINER PLATZ 2.
Test III i IV letnji semestar 2017/18 Za 3.i 4. i test iz Nemačkog jezika 2 predviđene su lekcije 10, 11 i 12 iz knjige “BERLINER PLATZ 1.
Mile Mamić JEZIČNI SAVJETI (1997)
EMINA JOVIĆ Srpski pogledi na odnose između bosanskog/bošnjačkog, hrvatskog i srpskog jezika u poslednjih dvadeset godina (1991‒2011) Institut für Slawistik.
Daniel Dugina Institut für Slawistik Karl-Franzenz-Universität Graz Mladi o Andriću u internetu Workshop Graz,
BAU 2015 Prezentacija Zagreb
INTERNET ENCIKLOPEDIJE
Dr. Muriz Hadžikadunić, red.prof
Test.
Milica Vukadinovic, GIZ DKTI programme
Die Farben Boje.
PLANIRANJE U ZAPADNOJ EUROPI
MENADŽERSKO ODLUČIVANJE
DIJELOVI MOSTA Najprikladnije je prikazati dijelove mosta na primjeru (protežnoga) grednog mosta. Svaki most, bez obzira na vrst rasponskoga sklopa,
Povijest matematike Doba renesanse
Osnovni pojmovi (pragmatika, komunikacija, sredstva komunikacije)
STRATEGIJA NOVIH POSLOVA
WIR VERSICHERN DAS WUNDER MENSCH.
O njemačkim tuđicama u književnom tekstu Ive Andrića »Na Drini ćuprija« Zrinka Ćoralić & Adna Smajlović (Bihać / Sanski Most, Bosna i Hercegovina)
erste Hälfte des 20. Jahrhunderts
Andrićev Gralis-Korpus za period od do 1941.
(Morfofonološki procesi u paradigmi fleksije i derivacije
Radionica REPARIS Date
Problemi tehnoloških odpadnih voda iz tekstilne in usnjarsko predelovalne industrije ter živilsko predelovalne industrije doc.dr. Darko Drev, univ.dipl.inž.kem.inž.
Alma Halidović (Tuzla) Filozofski fakultet Univerziteta u Tuzli Odsjek za njemački jezik i književnost Upotreba konektora ako.
Tvorba i uporaba perfekta:
OSTALGIJA Dejan Đukić.
Der mazedonische Artikel und seine BKS- und russischen Korrelate
Zakaj se učiti nemščino?
Poslovi banaka sa stanovništvom
Tržište certifikata .....
DIJAGNOSTIKA OVLAŽENIH TRANSFORMATORA
Direktor tvrtke Eko toplota energetika d.o.o.
Sto jezičnih savjeta Ivana Brabeca
SABINA ZULIĆ Institut für Slawistik der Karl-Franzens-Universität Graz
Gebruder Weiss Dobanovci Srbija
Jesu li dobri socijalni odnosi ključ poboljšanja škola?
Niti jedan razvoj moderne znanosti nije imao dublji
H E M I J A?????? -Zašto se led topi ili voda isparava?
Njemačka, Austrija i Švajcarska na zimskim olipimpijskim igrama ( )
Dodatna oprema BT-50 Ante Bartulović Mazda Hrvatska Intro:
Negativne osobine pismenog izražavanja
Kroatien.
KOMPENZACIJSKI MENADŽMENT 4. Sustavi plaća na temelju ocjenjivanja
Fonološka i morfološka analiza erdeljskog dijalekta
Erasmus iskustvo u Braunschweigu
Ćopićeve i Živkovićeve
Ćopićeve i Živkovićeve
 Präsentation transkript:

Breaking the Language Barrier Personal Translator 2008 (Program za automatsko prevođenje) - Osnove - - Leksikon - Autor: Vera Aleksić 29.03.2008, Grac

Uvod Lingatec je jedan od vodećih proizvođača iz oblasti jezičke tehnologije: mašinsko prevođenje, prepoznavanje govora, sinteza govora Personal Translator je komercijalni program za prevođenje. Istorija razvoja: 80-tih godina: LMT, logic based MT (McCord, IBM) 1996: PT en<->de (linguatec, IBM) 1999: PT fr<->de (linguatec) 2007: PT en<->fr,pt,es,it (linguatec,IBM) Das ist meine Notiz

Pregled glavnih funkcija (prevod, TM, Namer, SmartCorrect, sinteza govora) Das ist meine Notiz

Leksikon kao elektronski rječnik Monolingvalne informacije (izvorni i ciljni jezik): Vrsta riječi Morfologija Sintaksa Semantika Transfer: Prevod(i) Ograničenja/uslovi Domen/Profesija Primjeri Das ist meine Notiz

Lexikon: kodiranje novih riječi od strane korisnika Das ist meine Notiz

Osnove Personal Translatora Gramatika se zasniva na modelu “proreza i ispunjivača” (slot-and-filler-grammar); napisana je u Prologu analiza se bazira na primjeni lingvističkih pravila (od verzije PT006 kombinovano sa statističkim metodama za rješavanje višeznačnosti u kontekstu) analiza je “lexicon-driven”, to znači: leksikon mora da sadrži sve morfološke, sintaksičke, semantičke i pragmatičke informacije, potrebne za prevod ne samo gramatika, nego i leksikon uključuje veliki broj akuratno uređenih pravila za analizu -> transfer -> generisanje Das ist meine Notiz

Šematski prikaz transfera semantička analiza transfer sinteza sintaktička analiza Das ist meine Notiz izvorni text ciljni text

Leksikon: informacije potrebne za analizu Leksikon je u bazi podataka DB2 (interni naziv: TransLexis) Parametri unosaka (entries): n(NSense,SemType,NSlots) v(VerbSense,SemVType,Subj,Slots) adj(AdjSense,SemAType,Slots) adv(AdvSense,SemType,Slots) det(DetSense,Number,DType) prep(PrepSense,ModType,ObjType) pron(PronType,PronSense,Number,Dtype) propn(SemPType,Number) subconj(Semtype) qual(Semtype,Side,Qtype) ... Das ist meine Notiz

Leksikon: informacije potrebne za transfer i sintezu Uslovi za prevod i ograničenja: Domen Regionalne varijante br/am engl; pt/br pt ... Osobenosti riječi u originalu broj; upotreba (adv,pred, atr ...); modus; forma (pap)... “Prorezi i ispunjivači” obavezni/optionalni prorezi; ispunjeni, prazni, nerealizovani; osobine ispunjivača Test konteksta Strukturalne promjene: dodjela argumenata ciljne riječi argumentima originala promjena vrste riječi (adj->n; adv->vb; n->adj) brisanje, dodavanje ili pomjeranje konstituenata (člana, objekta, refleksivne zamjenice itd.....) Das ist meine Notiz

Lemma Homonym1 = (POS 1) (definisan preko pos i/ili infl, gd…; obl-attr: stem, sense) Stem / Secondary stem (obl-atr: scope ) Inflection (obl-attr: de: gd,infl,fuge; fr,it,pt,es: gd; nu wenn plt, sgt; irr…) Sense1: (definisan preko syn/sem/slots; dalji attr: prio,reg,style) (Slots: [Slot1,Slot2,…|Slotn]) (argumentska struktura) Translation1: (prevod; attr: conds, xfs, seq) • Conditions: [AdjConstrs,Syn/Sem1,…|Syn/Semn] (globalni: domen,reg, style; slot- realizacija; morph sl; syn:path tests) • Transformations: [TargetSlot1,…|TargetSlotn] -> xf(Transfos) (strukturalne izmjene u ciljnom jeziku) Translation2: Word • Conditions: [AdjConstrs,Syn/Sem1,…|Syn/Semn] • Transformations: [TargetSlot1,…|TargetSlotn] -> xf(Transfos) Translationn ... (default) Concept (semantički tipovi uređeni hijerarhijski; ontologija) Domen (tematski tipovi uređeni hijerarhijski) Sense2: ... Homonym2 Das ist meine Notiz

Značenja su nezavisna, ako su prorezi obligatorni: verlassen [subj(n),rflx1(a)|comp1(p([auf|acc]) '|' dass)] [subj(n)|obj1(n)] U suprotnom je raspored važan: einbrechen [subj(n),comp1(ptcl(ein))|comp(p([in|acc]))] (1) [subj(n),comp1(ptcl(ein))|obj(n)] (2) Primjer: Er bricht in das Haus ein. (1) Er bricht die Mauer ein. (2) Er bricht ein. (1) Tehnički bi bilo moguće kombinovati gornje dvije argumentske strukture u ovakvu jednu: [subj(n),comp1(ptcl(ein)),obj(n)|comp(p([in|acc]))]

Problemi kod prevoda višeznačnih izraza Morfološki npr. razlaganje složenica (Stau-becken, Staub-ecken) Leksički npr. homonimija: (Mandel, Schimmel, Bank...) Sintaktički idiomi i fraze (not at all; at all levels) Sintaktičko-semantički inverzija (Gras frisst die Kuh) Referencijalni prevod zamjenica (Das Mädchen ist traurig. Es hat seine Tasche veroloren). Das ist meine Notiz