Keelekorpus: erinevus redaktsioonide vahel
Eemaldatud sisu Lisatud sisu
Resümee puudub |
Resümee puudub |
||
5. rida:
Korpuste tähtsuse tõstmiseks uuringute jaoks, kasutatakse [[Märgendamine|märgendamist]] (annotatsiooni)<ref name="korpusedVene"> Keelekorpused (vene keeles) [https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%80%D0%BF%D1%83%D1%81_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%B2''Корпус текстов''.]</ref>, sest märgendamata tekstikogude (tekstoteegide) rakendamisvõimalused on piiratud. Analüüsitava materjali maht on tavaliselt suur ja tasakaalustatud kujul on rohkem võimalusi objektiivsete uurimistulemuste saavutamiseks.
Eristatakse mitu erinevat märgendamise tehnikat<ref name="märgendamine"> Mis on arvutilingvistika? [http://www.emakeeleselts.ee/
* Tehniline - eraldatakse tekstiosad: pealkirjad, laused, lõigud, fraasid mõnel juhtudel nähtused, mis võrreldes tavaliste sõnadega võivad käituda väga erinevalt (lühendid, numbrid);
|