Kõnesüntees: erinevus redaktsioonide vahel

Eemaldatud sisu Lisatud sisu
Winniepuhh (arutelu | kaastöö)
Resümee puudub
PResümee puudub
4. rida:
 
== Ajalugu ==
[[1779]]. aastal ehitas Peterburis elanud Taani teadlane [[:en:Christian Gottlieb Kratzenstein|Christian Gottlieb Kratzenstein]] inimese kõnetrakti mudeleid, mis suutsid tekitada viit vokaali. Nende eeskujul lõi [[1791]]. aastal [[Ungari]] teadlane [[Wolfgang von Kempelen]] akustilis-mehaanilise kõnemasina, mis suutis tänu keele ja huulte mudeli lisamisele tekitada peale vokaalide ka konsonante. Tegemist oli mehaaniliste aparaatidega, mis jäljendasid inimese kõnetrakti tööd rääkimise ajal. Analoogseid mehaanilisi ja poolelektroonilisi süsteeme ehitati ja arendati ilma suurema eduta 1960. aastateni. <ref name="lemmetty">Lemmetty, Sami 1999: [http://research.spa.aalto.fi/publications/theses/lemmetty_mst/thesis.pdf ''Review of Speech Synthesis Technology''.] Master's thesis. Helsinki University of Technology.</ref>
 
1920. aastatel tehti esimesi katsetusi kõne elektroonilise sünteesiga. Esimeste tulemusteni jõuti kolmekümnendate aastate keskel, mil [[:en:Bell Labs|Belli laborites]] ehitati [[VOCODER]] ja selle eeskujul [[Homer Dudley]] loodud [[VODER]] [[1939]]. aastal. Viimane koosnes heli- ja müraallikast, põhitooni kõrgust juhtivast pedaalist ja sõrmedega juhitavatest filtritest. Esimese formantsünteesil põhineva süntesaatori PAT ehitas Walter Lawrence [[1953]]. aastal.
 
Esimene artikulatoorne kõnesüntesaator loodi [[1958]]. aastal [[Massachusetts]]is [[Massachusettsi Tehnoloogiainstituut|MITiMassachusettsi Tehnoloogiainstituudi]] laborites. Üks esimesi teksti kõneks teisendatavaid (Text-To-Speech, TTS) kõnesüntesaatoreid ehitati Jaapanis [[1968]]. aastal. [[1980]]. aastatel oli turul juba hulk kommertssüsteeme.
 
[[1990]]. alustati kompilatiivse kõnesünteesiga, mille puhul võeti aluseks kõnekorpustes olevad üksused ja ühendati need omavahel seotud kõneks. Esimeseks tuntumaks süsteemiks sai [[MBROLA]].
 
=== Eestis ===
* Formantsüntees 1970. ja 1980. aastatel [[Keele ja Kirjanduse Instituut|Keele ja Kirjanduse Instituudis]] (praeguses [http://portaal.eki.ee/ Eesti Keele Instituudis]) ning [http://www.ioc.ee/ Küberneetika Instituudis] ([[Mart Remmel]], Meelis Mihkla, Eugen Künnap, Olev Künnap, Arvo Ott, [[Imre Siil]], Einar Meister, Maidu Raudsepp).
* Difoonsüntees (alates 1997–2003) [http://portaal.eki.ee/ Eesti Keele Instituudis], [http://www.ioc.ee/ Küberneetika Instituudis] ja Filosoft OÜs (Meelis Mihkla, Einar Meister, Arvo Eek).
* Kompilatiivne ehk korpuspõhine süntees (alates 2006) Eesti Keele Instituudis ([https://www.etis.ee/portaal/isikuCV.aspx?PersonVID=37518 Meelis Mihkla]).
* Audiovisuaalne kõnesüntees (alates 2010) Küberneetika Instituudis (Einar Meister, Rainer Metsvahi)
20. rida:
== Sünteesimeetodid ==
Kõnesünteesi puhul kasutatakse erinevaid sünteesimeetodeid <ref name="meister_alumae">Meister, Einar.; Alumäe, Tanel 2010: [http://www.horisont.ee/node/1490 ''Kuidas arvuti kuulab ja kõneleb. Horisont, 5.''.] Master's thesis. Helsinki University of Technology.</ref>:
* Artikulatoorne süntees – mudel, mille puhul imiteeritakse inimese kõneorganite[[kõneelund]]ite tegevust.
* Formantsüntees – elektrooniline mudel, kus heliallikas imiteerib häälekurdude võnkumist ja filter kõnetrakti resonantssagedusi.
* Kompilatiivne e. korpuspõhine süntees – lahendus, mis põhineb kõnekorpuses olevate salvestatud naturaalse kõne kõnelõikude (foneemide, difoonide, trifoonide, silpide, morfeemide, sõnade, lausete jne) omavahelisel ühendamisel.
** Difoonsüntees (sünteesi aluseks on kahest naaberfoneemist koosnevad lõigud)
** Muutuva pikkusega segmentide valimine (sünteesi aluseks on erinevaeri pikkusega kõnelõigud)
 
== Rakendused ==
43. rida:
== Välislingid ==
* [http://heli.eki.ee Eestikeelne kõnesüntees]
* [https://www.keeletehnoloogia.ee/et/konverentsid EKT ja EKKTT konverentside materjalid.]
* [http://www.filosoft.ee/ Filosoft OÜ]
* [https://www.keeletehnoloogia.ee/et/ekt-projektid/subtiitrite-helindamise-ja-tele-eetrisse Subtiitrite helindamine]