Anafoor (keeleteadus)

Anafoor ehk tagasiviide on asesõna, mis on samaviiteline mõne juba tekstis esinenud sõna või fraasiga[1]. Anafoori eesmärk on vältida sõna või fraasi kordusi ja muuta seeläbi tekst sujuvamaks[2]. Anafooriks võib olla asesõna (ehk pronoomen) või asemäärsõna (ehk proadverb)[2]. Kuna esmaviitamisel kasutatakse tüüpiliselt nimisõnafraasi, siis üldjuhul asendab anafoor tekstis just nimisõnafraase[2].

Sõna anafoor pärineb vanakreeka keelesest sõnast ἀναφορά, mis omakorda tuleneb sõnadest ἀνά, mis tähendab "tagasi", ja φέρω, mis tähendab "kandma" ehk lihtsustatult peetakse antud sõna all silmas tagasitoomist või kordust[3][4].

Anafoori ja katafoori erinevus muuda

Anafoori vastandiks on katafoor ehk edasiviide, mis on asesõna, mis viitab sellele järgnevale sõnale või fraasile[5]. Seega on katafoori puhul tegemist esmaviitamisega ja anafoori korral kordusviitamisega[6]. Alati siiski katafoori ja anafoori vahel eristust ei tehta ja sellisel juhul nimetatakse kõiki samaviitelisi pronoomeneid anafoorideks[1].

Näitelaused anafoori ja katafoori erinevusest:

  1. Islandil purskas vulkaan, see põhjustas tõrkeid kogu Euroopa lennuliikluses. - Anafoor see asendab lauses, sellele eelnevat nimisõnafraasi Islandil purskas vulkaan.
  2. See, et buss jäi hiljaks, ei olnud kellegi jaoks üllatus. - Katafoor see asedab lauses sellele järgnevat nimisõnafraasi buss jäi hiljaks.

Otsene ja kaudne anafoor muuda

Eristatakse otsest ja kaudset anafoori:

Otsese anafoori puhul on asendussõna ja viitealuse vaheline seos kas: samasus, sünonüümsus, üldistus või spetsialiseerumine.[7]. Kaudse anafoori alla kuuluvad sellised seosed, kus asendussõna referent on osa mingist tervikust või kuulub mingisse määratud hulka ja viitealus ongi see tervik või määratud hulk. [8].

Lausesisene ja lauseväline anafoor muuda

Anafoor võib olla lausesisene või lauseväline. Lausesisese anafoori korral asub anafoori poolt asendatav sõna või fraas anafooriga samas lauses ja lausevälise anafoori puhul väljaspool anafoori sisaldavat lauset[9].

Näitelaused lausesisesest ja lausevälisest anafoorist:

  • Emal tuli mõte kooki küpsetada, aga selleks pidi ta kõigepealt poes käima. - Emal ja sellele viitav anafoor ta asuvad samas lauses.
  • Kass ronis poisile sülle. Poisi paitamise peale hakkas ta vaikselt nurruma. - Kass ja sellele viitav anafoor ta asuvad kahes erinevas lauses.

Üldiselt kehtib reegel, mida rohkem on mingi sõna või fraas tekstis fookuses, seda lühemini saab sellele viidata (nt asesõnadega see ja ta)[1]. Sellest tulenevalt saab lausevälise anafoori korral tavaliselt eeldada, et lause või fraas, mida anafoor asendab, ei asu tekstis anafoorist eriti kaugel - nt üldjuhul ei viida tekstiselguse mõttes neid eraldi lõikudesse.

Ellips muuda

Ellipsit on käsitletud asenduse eriliigina – nullasendusena. Ellipsid jagunevad kontekstiellipsiks, grammatiliseks ellipsiks ja situatsiooniellipsiks selle järgi, kust leiab elliptilise elemendi tõlgendamiseks vajaliku lähtevormi. Lähtevormi leidmise kontekstiks võib olla lihtlause, liitlause osalause. [10]

Anafoor eesti keeles muuda

Pronominaalse viite asendussõnad eesti keeles on personaalpronoomenid ehk isikulised asesõnad (nt mina, tema), demonstratiivpronoomenid ehk näitavad asesõnad (nt see, too), possessiivpronoomenid ehk omastavad asesõnad (nt enda, oma) ja pronumeraalid ehk asearvsõnad (nt mitmes) [11]: Eesti keeles viidatakse sageli 3. isikule (tema) anafoorselt. Personaalpronoomeni saab eesti keeles anafoores viitamise korral lausest välja jätta: Naine kõndis tee peal. Äkki näeb… [12] Tema ja ta võib eesti keeles viidata nii elusale kui elutule referendile, aga see viitab enamasti elutule referendile. See-d kasutatakse ka definiitse määratlejana siis, kui referenti on juba mainitud. Definiitset määratlejat see kasutatakse, kui referenti on juba varasemas tekstis mainitud (nt Toas oli üks tüdruk. See vaatas aknast välja) [13]:

Anafoorsed pronoomenid (asesõnad) eri keeltes muuda

saksa keeles dies, das, es [14]. vene keeles этот, (это, эта), тот, (та, то), он (она, оно) [15]

Anafooride lahendamine muuda

Anafooride lahendamine on loomuliku keele töötluses esinev ülesanne, mille eesmärk on leida, millisele sõnale või fraasile viitab anafoor[16]. Anafooride lahendamist peetakse arvutisemantikas keeruliseks ülesandeks, kuna see nõuab nii süntaksi, semantika kui ka teksti ümbritseva konteksti analüüsi[17]. Anafooride lahendamist kasutatakse selliste ülesannete täitmiseks nagu näiteks masintõlge, automaatne sisukokkuvõtte koostamine ja automaatvastamine küsimustele (sh juturobotid)[18]. Kuna iga keel on erinev, siis ka sõnadevahelised seosed, sh need, mis seovad anafoore nende poolt viidatud sõnade või fraasidega, on erinevad. Seetõttu on tihti loodud lahendused keele spetsiifilised või nõuavad konfigureerimist üleviimisel ühest keelest teise[19].

Anafoori automaatset lahendamist jagatakse klassikaliselt kolmeks sammuks[20]:

  1. Anafoori leidmine tekstis.
  2. Potentsiaalsete kanditaatide tuvastamine, millele anafoor võib viidata.
  3. Parima sõna või fraasi valimine eelmisest punktis leitud kandidaatide seast.

Esimese sammu puhul peab silmas pidama, et mitte kõik asesõnad ei ole anafoorid. Tegu võib olla katafooriga, asesõnaga, mis teksti jooksul ei täpsustu või deiktilise kõnega, millel puudub seda ümbritsev kontekst.

Näitelaused asesõnadega, mis ei ole anafoorid (tasub märkida, et antud asesõnad võivad muutuda anafoorseteks juhul kui neid sisaldavad laused on osa pikemast teksist):

  • Miski oli lapse ära hirmutanud. - asesõna miski jääb täpsustamata.
  • Saad sa mulle ulatada taldriku? - asesõna sa viitab isikule kellega kõneletakse, aga ilma ümbritseva kontekstita ei saa me seda vastavusse viia ühegi kindla isikuga.

Teise sammu juures on sageli otsinguala skoop piiratud diskursuse osaga, mis kirjaliku keele puhul väljendub tavaliselt lõiguna. Juhul kui programm ei erista sisendtekstis lõikusi võidakse määrata ka väärtus n, mis näitab, mitut lauset enne anafoori sisaldavat lauset kaasatakse otsingualasse (otsingualasse kuulub alati ka anafoori sisaldav lause ise). n väärtus võib muutuda vastavalt, sellele, missugusele anafoorile kandidaate otsitakse[20].

Kolmandas sammus kirjeldatud valiku tegemiseks kandidaatide seast võidakse rakendada erinevaid piirangu ja eelistus reegleid[21]. Siin tuleb selgelt välja, miks ei ole tihti võimalik ühes keeles rakendatud reegleid teise keelde üle kanda - nt soopõhistel keeltel (nt inglise) on üheks oluliseks reegliks, et anafoori ja sellele vastava kandidaadi sood ei oleks konfliktsed[3], kuna kolmanda isiku asesõna "ta" ei erista sugu, siis ei ole seda reeglit võimalik eesti keele peal rakendada.

Ajalugu muuda

Töö anafooride lahendamise probleemi kallal hakkas 1960-ndatel aastatel. Tollal loodud lahendused, mis olid alamosad suurematest süsteemidest, olid reeglipõhised (ingl rule-based) ja peamiselt töötasid mustrituvastusel ja olid häälestatud valdkonna põhiste teadmistega (ingl knowledge-rich approach). Seetõttu olid need efektiivsed, vaid vastavate programmide spetsiifilisetel sisenditel. Selle vastandina hakati arendama lahendusi, mis ei sõltuks analüüsitava teksti sisust või tausta teadmistest (ingl domain knowledge), vaid lingvistilistest reeglitest (ingl knowledge-poor approach) ja tuleksid toime erinevate sisenditega ning oleks seega universaalsemad. 1990-ndatel hakkasid levima korpusepõhised lähenemised, kus kasutatakse anafooride lahendamiseks statistikat ja/või masinõpet. Korpusepõhiste masinõppemudelite populaarsus on kestnud tänapäevani tänu nende heale skaleeruvusele ja toimetulekule oodatust erinevatel sisenditel. Samuti ühendatakse tihti eri lähenemisi ja nii võib näiteks algoritmi eri osadele olla rakendatud nii reeglipõhiseid kui ka masinõppe põhiseid meetodeid. Milliseid metoodikaid kasutada anafoori lahendamise algoritmi koostamisel oleneb palju programmi eesmärgiks ja lõplikust kasutusviisist, seega võib ka tänapäeval spetsiifilistes programmides olla põhjendatud kasutada puhtalt reeglipõhiseid algoritme.[21]

Viited muuda

  1. 1,0 1,1 1,2 Pajusalu, Renate (2009). Sõna ja tähendus. Tallinn: Eesti Keele Sihtasutus. Lk 181–183.
  2. 2,0 2,1 2,2 Pajusalu, Renate (2017). "Viiteseosed". Eesti keele süntaks. Tartu: Tartu Ülikooli Kirjastus. Lk 566–567.
  3. 3,0 3,1 Sukthanker, Rhea; Poria, Soujanya; Cambria, Erik; Thirunavukarasu, Ramkumar (juuli 2020). "Anaphora and coreference resolution: A review". Vaadatud 19. jaanuaril 2024.
  4. "Võõrsõnade leksikon". Eesti Keele Instituut. Vaadatud 19. jaanuaril 2024.
  5. "Võõrsõnade leksikon". Eesti Keele Instituut. Vaadatud 19. jaanuaril 2024.
  6. Pajusalu, Renate (2017). "Viiteseosed". Eesti keele süntaks. Tartu: Tartu Ülikooli Kirjastus. Lk 573–575.
  7. Mitkov, Ruslan (2007). Anaphora Resolutsion (inglise). Eastbourne, London: Pearson Education, Longman. Lk 269.
  8. Mitkov, Ruslan (2007). Anaphora Resolutsion. Eastbourne, London: Pearson Education, Longman. Lk 269.
  9. Lakhmani, Priya; Singh, Smita; Mathur, Pratistha (märts 2014). "Gazetteer Method for Resolving Pronominal Anaphora in Hindi Language" (PDF). Vaadatud 21. jaanuaril 2024.
  10. Metslang, Helle; Erelt, Mati; Habicht, Külli; Hennoste, Tiit; Kasik, Reet; Teras, Pire; Viht, Annika; Asu, Eva Liina; Lindström, Liina; Lippus, Pärtel; Pajusalu, Renate; Plado, Helen; Rääbis, Andriela; Veismann, Ann (2023). Eesti grammatika. Tartu: Tartu Ülikooli Kirjastus. Lk 802.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link)
  11. Pajusalu, Renate. "Pronouns and reference in Estonian". STUF (inglise). 62 (1/2): 122–139.
  12. Lindström, Liina. "Kõnelejale ja kuulajale viitamise vältimise strateegiad eesti keeles". Emakeele Seltsi aastaraamat (55): 88–118.
  13. Pajusalu, Renate. "Pronouns and reference in Estonian". STUF. 62 (1/2): 122–139.
  14. Dipper, Stefanie; Rieger, Christine; Seiss, Melanie; Zinsmeier, Heike. Anaphora Processing and Applications. Abstract Anaphors in German and English, 2011, 96-107
  15. Nørgård‐Sørensen, Jens. "Pronouns and their reference in Russian". Scando-Slavica. 44 (1): 171–186.
  16. Garrod, Simon. "Anaphora Resolution". sciencedirect.com. Vaadatud 14. jaanuaril 2024.
  17. Carbonell, J. G.; Brown, R. D. (15. aprill 1988). "Anaphora Resolution: A Multi.Strategy Approach" (PDF). Vaadatud 14. jaanuaril 2024.
  18. Liang, T.; Wu, D.-S. (2003). "Automatic Pronominal Anaphora Resolution in English Texts" (PDF). aclanthology.org. Vaadatud 14. jaanuaril 2024.
  19. Wolna, Agata; Durlik, Joanna; Wodniecka, Zofia (11. jaanuar 2022). "Pronominal anaphora resolution in Polish: Investigating online sentence interpretation using eye-tracking". Vaadatud 21. jaanuaril 2024.
  20. 20,0 20,1 Mitkov, R. (2003). Anaphora Resolution. The Oxford Handbook of Computational Linguistics (inglise). Oxford: Oxford University Press. Lk 266–283.
  21. 21,0 21,1 Poesio, Massimo; Stuckardt, Roland; Versley, Yannick (2016). Anaphora Resolution: Algorithms, Resources, and Applications (inglise). Berlin: Heidelberg. Lk 3–9.