Keeletehnoloogia
Keeletehnoloogia (inglise language technology) on erialadevaheline valdkond, mis tegeleb keelelise informatsiooni – teksti ja kõne – arvutitöötluseks vajalike meetodite uurimise ja rakenduste arendamisega. Keeletehnoloogia põhineb teadmistel keele ehitusest ja funktsioneerimisest ning hõlmab mitmeid valdkondi, nagu lingvistika, psühholoogia, kognitiivsed teadused, arvutiteadus, tehisintellekt, signaalitöötlus, matemaatika, statistika jm.[1]
Keeletehnoloogia hõlmab arvutilingvistikat, milles tegeldakse eelkõige kirjaliku keele arvutitöötluse teoreetiliste aspektidega, ning loomuliku keele töötlusest, mis keskendub inimese ja arvuti vahelisele suhtlusele. Arvutilingvistikat peetakse pigem lingvistika haruks, loomuliku keele töötlust aga arvutiteaduse osaks.[1]
Keeletehnoloogid kasutavad arvutilingvistikas välja töötatud teooriaid, et luua rakendusi (nt arvutiprogramme), mis võimaldavad inimkeelt arvuti abil töödelda ja mõista. Tänapäeval on keeletehnoloogia tuntumateks valdkondadeks masintõlge, kõnetuvastus, kõnesüntees, arvutileksikoloogia, dialoogisüsteemid ja tekstikaeve.
Keeletehnoloogia peamised komponendid on keeleressursid ja keeletarkvara.[1]
Terminikasutus
muudaTermin "keeletehnoloogia" võeti kasutusele 1990. aastal, kui infotehnoloogia edenedes hakkas arvutilingvistika alal tekkima vajadus spetsiifilisema eristuse järele.[1]
Keeletehnoloogiat on kitsamalt tähistatud ka terminiga "inimkeeletehnoloogia" (inglise human language technology) – inimkeele käsitlemiseks loodud tarkvarasüsteemid.[2]
Sageli käsitatakse "keeletehnoloogiat" ja "loomuliku keele töötlust" sama mõistena.
Keeletehnoloogia areng Eestis
muudaKeeletehnoloogia sai Eestis alguse 1950. aastail, kui Tartu Ülikoolis loodi masintõlke uurimisrühm, et automaatselt tõlkida matemaatilisi tekste vene keelest eesti keelde (uurimisrühm tegutses Ülo Kaasiku juhtimisel). Järgnevalt alustati keele arvutitöötlust Eesti Keele Instituudis ning kõneanalüüsi ja -sünteesi uuringuid Tallinna Tehnikaülikoolis. Need kolm asutust on ka tänapäeval peamised keeletehnoloogia uurimis- ja arenduskeskused Eestis.[1] Tartu Ülikoolis tegutseb Arvutiteaduse Instituudis keeletehnoloogia õppetool, Eesti Keele Instituudis tegeldakse kõnesünteesi ja arvutileksikograafiaga ning Tallinna Tehnikaülikoolis on foneetika ja kõnetehnoloogia labor. 2020. aastal loodi Eesti Keele Instituuti keeletehnoloogia kompetentsikeskus, kelle ülesanded on hallata keeleandmestikke, arendada keeletehnoloogiat, tellida ja juhtida keeletehnoloogia projekte, teha rahvusvahelist keeletehnoloogiaalast koostööd, keeletehnoloogia turundus- ja teavitustegevust ning nõustamist.
1994. aastal kaasati Eesti arvutilingvistid ja keeletehnoloogid Euroopa Liidu COPERNICUS-programmi, mille tulemusel avanes Eesti keeletehnoloogia uurimisrühmadel võimalus osaleda rahvusvahelistes projektides.[1] Lisaks teadus- ja tehnoloogiauuringutele on Eesti keeletehnoloogia arengut toetatud ka kõrghariduse tasemel. Tartu Ülikoolis saab õppida nii keeletehnoloogiat[3] kui arvutilingvistikat[4].
Alates 2006. aastast rahastatakse keeletehnoloogia projekte riiklikest programmidest. Aastatel 2006–2010 oli käigus programm "Eesti keele keeletehnoloogiline tugi", aastatel 2011–2017 "Eesti keeletehnoloogia" ja alates 2018. aastast on töös "Eesti keeletehnoloogia 2018–2027".[5][6]
Vaata ka
muudaViited
muuda- ↑ 1,0 1,1 1,2 1,3 1,4 1,5 Meister, Einar 2018. Keeletehnoloogia ja eesti keel. – Sõida tasa üle silla: Raamat eesti keelest ja meelest (toim. Raimo Raag, Jüri Valge), Tallinn-Tartu: EKSA 2018. ISBN 9789949604623. Libris ID: 199gnpx2z084rpjb
- ↑ Krista Liin, Kadri Muischnek, Kaili Müürisep, Kadri Vider: Eesti keel digiajastul = The Estonian language in the digital age Springer, 2012.
- ↑ "Informaatika ja infotehnoloogia". Tartu Ülikooli matemaatika-informaatikateaduskonna koduleht. Originaali arhiivikoopia seisuga 20.09.2020. Vaadatud 04.01.2019.
- ↑ "Tartu Ülikooli õppekavad: eesti ja soome-ugri keeleteadus". 2018. Originaali arhiivikoopia seisuga 10.07.2018. Vaadatud 04.01.2019.
- ↑ Eesti keeletehnoloogia programmi koduleht (kasutatud 04.01.2019)
- ↑ Riiklik programm "Eesti keeletehnoloogia (2011-2017)" vana.keeletehnoloogia.ee