Distributiivne semantika

Distributiivne semantika on teadusharu, mis uurib ja arendab teooriaid ja meetodeid keeleelementide tähenduslike sarnasuste mõõtmiseks ja kategoriseerimiseks nende distributsiooni kaudu. Lähenemise alus on distributiivse semantika hüpotees, mille järgi esinevad sarnase tähendusega sõnad sarnases kontekstis.

Distributiivse semantika hüpotees

Distributiivse semantika hüpotees lingvistikas on tuletatud keelekasutuse semantilisest teooriast: sõnu, mida kasutatakse ja mis esinevad sarnastest kontekstides, kalduvad väljendama sarnast tähendust^[1]. Hüpoteesi kõige levinum definitsioon on J. R. Firthi levitatud "a word is characterized by the company it keeps" (sõna kirjeldab tema kontekst)^[2] . Distributiivse semantika hüpoteesi võib pidada statistilise semantika aluseks. Kuigi hüpotees ise jõudis teadusesse lingvistika (täpsemalt fonoloogia) kaudu^[3], on sellele tähelepanu pööratud ka kognitiivteaduses sõnakasutuse konteksti uurimisel^[4]. Sarnasuslik üldistuslik keeleõppeteooria toetub just distributiivse semantika hüpoteesile: idee, mille kohaselt suudavad lapsed harvaesinevaid sõnu kasutada just sarnaste sõnade distributsiooni kaudu^[5]^[6].

Distributiivse semantika modelleerimine

Distributiivne semantika võimaldab mudelites rakendatuna mõõta keeleelementide (nt sõnatähenduste, tekstide) sarnasusi^[3]. Mudelite üldine tööpõhimõte on järgmine: distributiivne info (lingvistilise elemendi esinemistingimused teiste elementide suhtes) kogutakse kokku vektoritena (ehk leitakse sõnade vektoresitused) ning seejärel esitatakse elementide tähenduslik sarnasus nende vektorite sarnasuse kaudu^[7]. Vektorite abil on võimalik uurida erinevaid sarnasusi: temaatilise sarnasuste leidmiseks vaadeldakse seda, millistes tekstiosades (nt pealkirjas, sisuosas, tabelis jne) keeleelement esineb; paradigmaatilised sarnasused põhinevad koosesinemisel ehk milliste teiste elementidega keeleelement koos esineb. Samasugust infot sisaldavaid vektoreid saab kasutada ka süntagmaatiliste sarnasuste leidmisel, kui vaadata süvitsi vektori osi.

Distributiivse ja tähendusliku sarnasuse seoseid uuritakse mitmesuguseid mudeleid rakendades: distributiivset semantikat modelleeritakse näiteks varjatud semantilise analüüsi^[8], teemamodelleerimise, süntaksi- ja sõltuvuspõhiste^[9] mudelitega. Mudelid kasutavaid erinevaid sätteid, nt milline on konteksti aken (ehk kui palju elemente loetakse konteksti), kuidas arvestatakse sageduse osakaalu või millist sarnasusmõõdikut (nt koosinussarnasus, eukleidiline kaugus) rakendatakse vektoritevahelise kauguse mõõtmisel.

Neid distributiivse semantika mudeleid, mis kasutavad kontekstina keeleelemente nimetatakse vektorruumi ehk semantilise ruumi ehk sõnaruumi mudeliteks^[10]^[11], mis tuletavad sõnade tähenduse samas kontekstis koosesinemise põhjal. Sellised mudelid esitavad sõnatähenduste ruumilise esituse, kus tähenduslikku sarnasust esitatakse sõnadevahelise kaugusena selles ruumis.

Rakendused

Distributiivse semantika mudeleid kasutatakse edukalt mitmesuguste ülesannete lahendamisel. Näiteks:

sarnase tähendusega sõnade ja püsiühendite tuvastamisel;
sõnade klasteranalüüsil nende tähenduse alusel;
tesauruste ja mitmekeelsete sõnastike koostamisel;
sõnade erinevate tähenduste eristamisel;
teemamodelleerimisel;
tekstižanrite tuvastamisel, tekstidokumentide klasterdamisel;
nimetuvastamisel;
andmekaeves;
tundmusanalüüsis.

Tarkvara

Viited

↑ Harris, Zellig. (1954). "Distributional structure". Word (Inglise keeles). Kd 10. Lk 146–162.{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)
↑ Firth, John Rupert. (1957). "A synopsis of linguistic theory, 1930-1955". Studies in linguistic analysis (Inglise keeles).{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)
↑ ^3,0 ^3,1 Sahlgren, Magnus. (2008). "The distributional hypothesis". Italian Journal of Disability Studies (Inglise keeles). Kd 20. Lk 33–53. {{raamatuviide}}: eiran tundmatut parameetrit |PDF= (juhend)CS1 hooldus: tundmatu keel (link)
↑ McDonald, Scott; Ramscar, Michael. (2001). "Testing the distributional hypothesis: The influence of context on judgements of semantic similarity". Proceedings of the 23rd Annual Conference of the Cognitive Science Society (PDF) (Inglise keeles). Lk 611–616.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link) CS1 hooldus: tundmatu keel (link)
↑ Gleitman, Lila R. (2002). "Verbs of a feather flock together II: The child's discovery of words and their meanings". The Legacy of Zellig Harris: Language and information into the 21st century: Philosophy of science, syntax and semantics. Current issues in Linguistic Theory (Inglise keeles). John Benjamins Publishing Company. Lk 209–229. ISBN 9781588112460.{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)
↑ Yarlett, Daniel. (2008). Language Learning Through Similarity-Based Generalization (Inglise keeles). Stanford University.{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)
↑ Rieger, Burghard B. (1992). On Distributed Representations in Word Semantics (Inglise keeles). ICSI Berkeley 12-1991.{{raamatuviide}}: CS1 hooldus: koht sisaldab numbrit (link) CS1 hooldus: tundmatu keel (link)
↑ Deerwester, Scott; Dumais, Susan T.; Furnas, George W.; Landauer, Thomas K.; Harshman, Richard. (1990). "Indexing by Latent Semantic Analysis". Journal of the American Society for Information Science (Inglise keeles). Kd 41. Lk 391–407.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link) CS1 hooldus: tundmatu keel (link)
↑ Padó, Sebastian; Lapata, Mirella. (2007). "Dependency-based construction of semantic space models". Computational Linguistics (Inglise keeles). Kd 33. MIT Press. Lk 161–199.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link) CS1 hooldus: tundmatu keel (link)
↑ Schütze, Hinrich. (1993). "Word Space". Advances in Neural Information Processing Systems (Inglise keeles). Kd 5. Lk 895–902. Originaali arhiivikoopia seisuga 10. jaanuar 2018. Vaadatud 8. märtsil 2018.{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)
↑ Sahlgren, Magnus (2006). The Word-Space Model (PDF) (Inglise keeles). Stockholm University.{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)

[1] Harris, Zellig. (1954). "Distributional structure". Word (Inglise keeles). Kd 10. Lk 146–162.{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)

[2] Firth, John Rupert. (1957). "A synopsis of linguistic theory, 1930-1955". Studies in linguistic analysis (Inglise keeles).{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)

[:0-3] 3,0 ^3,1 Sahlgren, Magnus. (2008). "The distributional hypothesis". Italian Journal of Disability Studies (Inglise keeles). Kd 20. Lk 33–53. {{raamatuviide}}: eiran tundmatut parameetrit |PDF= (juhend)CS1 hooldus: tundmatu keel (link)

[4] McDonald, Scott; Ramscar, Michael. (2001). "Testing the distributional hypothesis: The influence of context on judgements of semantic similarity". Proceedings of the 23rd Annual Conference of the Cognitive Science Society (PDF) (Inglise keeles). Lk 611–616.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link) CS1 hooldus: tundmatu keel (link)

[5] Gleitman, Lila R. (2002). "Verbs of a feather flock together II: The child's discovery of words and their meanings". The Legacy of Zellig Harris: Language and information into the 21st century: Philosophy of science, syntax and semantics. Current issues in Linguistic Theory (Inglise keeles). John Benjamins Publishing Company. Lk 209–229. ISBN 9781588112460.{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)

[6] Yarlett, Daniel. (2008). Language Learning Through Similarity-Based Generalization (Inglise keeles). Stanford University.{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)

[7] Rieger, Burghard B. (1992). On Distributed Representations in Word Semantics (Inglise keeles). ICSI Berkeley 12-1991.{{raamatuviide}}: CS1 hooldus: koht sisaldab numbrit (link) CS1 hooldus: tundmatu keel (link)

[8] Deerwester, Scott; Dumais, Susan T.; Furnas, George W.; Landauer, Thomas K.; Harshman, Richard. (1990). "Indexing by Latent Semantic Analysis". Journal of the American Society for Information Science (Inglise keeles). Kd 41. Lk 391–407.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link) CS1 hooldus: tundmatu keel (link)

[9] Padó, Sebastian; Lapata, Mirella. (2007). "Dependency-based construction of semantic space models". Computational Linguistics (Inglise keeles). Kd 33. MIT Press. Lk 161–199.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link) CS1 hooldus: tundmatu keel (link)

[10] Schütze, Hinrich. (1993). "Word Space". Advances in Neural Information Processing Systems (Inglise keeles). Kd 5. Lk 895–902. Originaali arhiivikoopia seisuga 10. jaanuar 2018. Vaadatud 8. märtsil 2018.{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)

[11] Sahlgren, Magnus (2006). The Word-Space Model (PDF) (Inglise keeles). Stockholm University.{{raamatuviide}}: CS1 hooldus: tundmatu keel (link)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]