Keelekorpus: erinevus redaktsioonide vahel

Eemaldatud sisu Lisatud sisu
Anastassias (arutelu | kaastöö)
Resümee puudub
Anastassias (arutelu | kaastöö)
Resümee puudub
5. rida:
Korpuste tähtsuse tõstmiseks uuringute jaoks, kasutatakse [[Märgendamine|märgendamist]] (annotatsiooni)<ref name="korpusedVene"> Keelekorpused (vene keeles) [https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%80%D0%BF%D1%83%D1%81_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%B2''Корпус текстов''.]</ref>, sest märgendamata tekstikogude (tekstoteegide) rakendamisvõimalused on piiratud. Analüüsitava materjali maht on tavaliselt suur ja tasakaalustatud kujul on rohkem võimalusi objektiivsete uurimistulemuste saavutamiseks.
 
Eristatakse mitu erinevat märgendamise tehnikat<ref name="märgendamine"> Mis on arvutilingvistika? [http://www.emakeeleselts.ee/omakelomakeel/2004_1/Ariva.pdf''lk. 35-36''.]</ref>:
 
* Tehniline - eraldatakse tekstiosad: pealkirjad, laused, lõigud, fraasid mõnel juhtudel nähtused, mis võrreldes tavaliste sõnadega võivad käituda väga erinevalt (lühendid, numbrid);