Arvutipõhine tõlkimine

Arvutipõhine tõlkimine on tõlkimise vorm, mille puhul tõlkija kasutab tõlkimise abivahendina arvutitarkvara.[1]

Kuigi arvutipõhises tõlkes kasutatakse masinate abi, ei tohiks seda segi ajada masintõlkega.

Ülevaade

muuda

Tänapäevased automaatse masintõlke süsteemid ei ole võimelised iseseisvalt kõrge kvaliteediga tõlkeid tootma: enamasti vajab nende väljund inimeste poolset toimetamist, et kõrvaldada vead ning parandada tõlke kvaliteeti. Arvutipõhine tõlkimine ühendab tarkvara kasutamise käsitsi toimetamisega, muutes tõlkimise nii interaktiivseks protsessiks, kuhu on kaasatud nii inimene kui ka arvuti.[2]

Mõned kaasaegsemad arvutipõhise tõlke lahendused sisaldavad ka masintõlke (MT) võimalust. Reeglina võimaldavad kõrgema hinnaga MT moodulid tõlkijal kasutada mitmekülgsemat tõlketööriistade komplekti, mis võib muuhulgas sisaldada terminihalduse funktsioone ning erinevaid lingvistilisi vahendeid. Hoolikalt kohandatud sõnastikud, mis põhinevad korrektsel terminoloogial, parandavad masintõlke täpsust ning muudavad seega tõhusamaks kogu tõlkeprotsessi.

Tööriistad

muuda

Arvutipõhine tõlkimine on laiapõhjaline ja täpselt piiritlemata mõiste, mis hõlmab väga erinevaid vahendeid, alustades suhteliselt lihtsa ehitusega tööriistadest ning lõpetades keerukate vahenditega. Nende hulgast võib välja tuua järgmised:

  • Tõlkemälu tööriistad (TM tööriistad), mis hõlmavad andmebaasi teksti segmentidest algkeeles ning nende tõlketest ühes või mitmes sihtkeeles.[3]
  • Õigekirjakontroll, kas sisseehitatud tekstitöötlusprogrammiga või selleks ette nähtud lisaprogrammiga.
  • Grammatikakontroll, jällegi sisseehitatud tekstitöötluse tarkvara või lisaprogrammi kujul.
  • Terminihaldusesüsteemid, mis võimaldavad tõlkijatel oma terminipanka elektroonsel kujul hallata. Siia kuuluvad lihtsakoelised tabelid, mis on koostatud tõlkija tekstitöötluse tarkvara abil; andmebaasid, mis on loodud selliste programmidega nagu FileMaker Pro, või – töökindlamate (ja kallimate) lahenduste tagamiseks – spetsiifilisema suunitlusega tarkvarapakette (ESÕ MultiTerm, LogiTerm, Termex, jne) kasutades.
  • Elektroonilised sõnastikud, üks- või kakskeelsed
  • Terminoloogia andmebaasid, mis on ligipääsetavad peaarvuti või interneti kaudu, näiteks ESTERM 
  • Täistekstiotsingu tööriistad, mis võimaldavad kasutajal teha päringu juba tõlgitud tekstide või eri tüüpi viitedokumentide hulgas
  • Konkordantsi tööriistad: programmid, kus kasutaja saab otsida sõnu või termineid neile vastavas kontekstis, ühe- või mitmekeelses korpuses.
  • Joondusvahendid: tööriistad, mis võimaldavad omavahel joondada algteksti segmendid ning nende tõlked, mida saab seejärel analüüsida täisteksti otsingu tööriista või konkordantsi funktsiooni abil
  • Projektijuhtimise tarkvara, mis võimaldab struktureerida keerukaid tõlkeprojekte, suunata erinevaid ülesandeid erinevatele inimestele ning jälgida iga ülesande täitmisprotsessi

Mõisted

muuda

Tõlkemälu tarkvara

muuda

Tõlkemälu programmid säilitavad andmebaasina varem tõlgitud algtekstid ja nende sihttekstid ning võimaldavad uute tekstide tõlkimisel ligipääsu sarnastele (potentsiaalselt kasulikele) varasemate tekstide segmentidele.[4]

Sellised programmid jaotavad algteksti käepärasteks ühikuteks – segmentideks. Segmentidesse jaotamine käib kindlate reeglite alusel[5]. Segment võib olla algteksti lause või lausesarnane kogum (pealkiri, nimekirja element). Samuti võivad segmentideks olla mahukamad tekstiosad (lõigud) või väiksemad osad (osalaused). Võimalusel (olenevalt andmebaasi sisust) pakub programm iga segmendi juures varasemast tõlkest pärit sarnase segmendi taaskasutamiseks. Kui sobivat vastet mälus ei ole, saab tõlkija segmendile uue tõlke sisestada. Pärast segmendi tõlke kinnitamist lisab programm uue tõlkevaste andmebaasi ja liigub järgmise segmendi juurde. Olemas on ka selline tõlkemälu lähenemine, mis ei vaja andmebaasi, vaid põhineb hoopis joondatud viitedokumentidel.

Mõned tõlkemälu programmid toimivad kui eraldiseisvad keskkonnad, samas kui teised funktsioneerivad lisandprogrammidena, mis lubavad lisada erinevates vormingutes dokumente, nt tabeleid, või HTML-koodi, mida kasutatakse tõlkemäluprogrammi abil.

Keelepõhine otsingumootori tarkvara

muuda

Keelepõhine otsingumootori tarkvara on enamasti internetipõhine süsteem, mis toimib sarnaselt interneti otsingumootoritega, kuid interneti asemel teeb see otsinguid suures tõlkemälukogumis, kuhu on salvestatud varem tõlgitud laused, lausefragmendid, fraasid ning isegi terved lõigud, mis langevad kokku algdokumendi segmentidega.

Keelepõhised otsingumootorid on loodud selleks, et teostada kaasaegse otsingutehnoloogia abil otsinguid, mis põhinevad algteksti sõnadel neile sobivas kontekstis. Nii tagatakse, et otsingu tulemused kannavad algteksti segmentidega sama tähendust. Sarnaselt traditsiooniliste tõlkemälu tööriistadega sõltub keelepõhise otsingumootori väärtus tugevalt otsinguks kasutatavast tõlkemälude kogumikust.

Terminihalduse tarkvara

muuda

Terminihalduse tarkvara abil saab tõlkija algdokumendis esinevaid termineid terminibaasist automaatselt otsida. Paljudel tõlkeabiprogrammidel ilmuvad asjakohased vasted automaatselt tõlkemälu liidese aknasse, või on vastavad terminid kättesaadavad terminibaasi sissekandena, mis avaneb kindla klahvikombinatsiooni kasutamisel.[4]

Joondamistarkvara

muuda

Joondamisprogrammides jaotatakse nii algtekst kui ka sihttekst segmentideks, algteksti segmendid ühendatakse seejärel tõlgitud segmentidega, loomaks tõlkemälu või mõnd muud viiteallikat. Paljud joondusprogrammid võimaldavad tõlkijatel valesti paardunud segmente käsitsi korrigeerida.

Interaktiivne masintõlge

muuda

Interaktiivse masintõlke puhul üritab automaatne süsteem ennustada, millise tõlke teeks inimtõlkija, pakkudes välja hüpoteetilisi tõlkevariante. Need variandid võivad olla terviklikud laused või lauseosad.

Viited

muuda
  1. Bowker, Lynne (2002). Computer-aided Translation Technology. Ottawa: University of Ottawa Press. p. 144.
  2. Barrachina, Sergio; et al. (2009). "Statistical Approaches to Computer-Assisted Translation" (PDF). Computational Linguistics35 (1): 3–28. doi:10.1162/coli.2008.07-055-r2-06-29ISSN 0891-2017.
  3. Christensen, Tina Paulsen; Schjoldager, Anne. "Translation-Memory (TM) Research: What Do We Know and How Do We Know It?" (PDF). Hermes44.
  4. 4,0 4,1 "Terminology Management and MT" (PDF). Circuit117.
  5. Toimetaja tõlkebüroo (22. september 2017). "Tõlkimine ja tõlketarkvara". Vaadatud 6. septembril 2019.