Andmeanalüütika

Andmeanalüütika on andmeteaduse meetodite praktiline rakendamine suurandmete automatiseeritud töötlemisel, mille tulemusena valmivad diagrammid, prognoosid ja soovitused aitavad ka ilma programmeerimis- või statistikahariduseta inimestel langetada tõenduspõhiseid otsuseid."[1] Tarmo Toiger on öelnud, et "Andmeanalüütika on sisuliselt andmete parem ja tõhusam kasutamine, rakendades selleks mitmeid analüütilisi mudeleid." Analüütika on ka andmete ettevalmistamine ja modelleerimine paremate otsuste tegemiseks.[2]

Andmeanalüütika meetodid ja tehnoloogiad muuda

Andmeanalüütika meetodeid ja tehnoloogiaid on mitmeid. Pikema ajalooga on näiteks andmekaeve (data mining) ja selle jaoks loodud tarkvaralahendused (nt Weka, RapidMiner). Andmekaeve on arvutiteaduse interdistsiplinaarne alamvaldkond, mis arendab meetodeid ning vahendeid, mille abil on võimalik suurtest andmehulkadest mustreid leida ning seejärel tulemusi inimestele esitada sellises vormis, mida nad mõistavad ja saavad ka ise kasutada.[1]

Üldjuhul ei toimu andmekaeve reaalajas, vaid retrospektiivse uuringuna (ehk kõigepealt andmed kogutakse ja seejärel analüüsitakse), milles kasutatakse masinõppe, statistika ja andmebaaside meetodeid. Andmekaeveks ja andmete visualiseerimiseks kasutatakse teadustöös üha sagedamini spetsiaalselt selleks otstarbeks loodud tasuta tarkvarapaketti Weka ja programmeerimiskeelt R.[1]

Andmeanalüütika visualiseerimine muuda

Andmeanalüütikas pööratakse väga palju tähelepanu analüüsi tulemuste ja keerukate mudelite visualiseerimisele. Need võimalused, mis tekivad andmeid visualiseerides ja mudelitega katsetades, on toonud andmeanalüütika tavakasutajatele varasemast oluliselt lähemale.[1]

Andmeanalüütika rakendusvaldkonnad muuda

Nii ettevõtted kui ka riigiasutused koguvad oma igapäevase töö käigus väga palju erinevaid andmeid, aga nende kasutamine otsustusprotsessides või ärilistel eesmärkidel on kas puudulik või olematu. Andmed on väärtuslik vara ja sellega tuleb osata ümber käia. Andmeanalüütika eesmärk ongi panna kogutud andmed organisatsiooni heaks tööle. On aga tarvis ka inimesi, kellel on nii vajaminevad oskused kui ka tahe kasutada andmestikku oma täies ulatuses ning investeerida süsteemidesse, mis seda ka võimaldavad.[2]

Andmeanalüütikat kasutavad näiteks pangad (ja ka lihtsalt krediitkaardifirmad), et kaardipettuseid tuvastada. Igas minutis teevad pankade kliendid oma krediitkaartidega kümneid tuhandeid tehinguid ja seda nii Eestis, välismaal kui ka Eestis olles välismaa intenetipoodides. Näiteks suudab andmeanalüüsi tarkvara hetkega tuvastada ja blokeerida pangakaardi, mille sooritati viimane tehing kell 10:05 Tallinnas ja juba 10:40 üritab keegi sama kaardiga maksta teisel pool maakera.[1]

Andmeanalüütikat saavad kasutada ka tegelikult kõik ettevõtted ja nende osakonnad, kes tegelevad pidevalt uute töötajate värbamisega. Andmeanalüütika võimaldab progrnoosida värbamise vajadust, valida sobivad töötajad, monitoorida nende soovitust ja analüüsida neid aspekte, mis vajavad parandamist või arendamist. Tulemuste saamiseks ettevõttes on väga oluline koguda võimalikult täpset informatsiooni ja veristada sellest koguinfost mittevajalik.[3]

Maanteeamet kasutab andmeanalüüsi tarkvara Tableau, mis võimaldab otsida trende ja seoseid tuhandete teekatte- ja ilmasensorite kogutud andmete hulgast ning võrrelda neid interaktiivsete graafikute kujul liiklusõnnetuste või ilmaprognooside mudelitega. [1]

Lihtsaim ja tuntuim andmeanalüütika lahendus (eriti veebilehe omanike või haldajate jaoks) on aga Google'i tarkvara Google Analytics, mis pakub mitmekülgset piltlikku ülevaadet veebilehe külastatavuse kohta.[1] Tarkvara suudab jälgida, infot koguda, säilitada ja esitada kõike lehel toimuvat (näiteks külastuste arv, külastuste koht, klikkide arv, lehel liikumise teekond, lehel viibimise aeg ja palju muud).

Soovitusteenused muuda

Andmeanalüütika arengutrendid ja levik järgivad mitut varasemat tehnoloogiat. Headeks näideteks siinkohal on näiteks internet või GPS-süsteem. Kui hetkel on selle peamisteks kasutajateks militaar- ja finantsvaldkondade organisatsioonid, siis juba lähiaastatel ennustavad eriala eksperdid andmeanalüütika lihtsamate teenuste levikut paljudesse erinevatesse valdkondadesse. Üheks lihtsamaks andmeanalüütikal põhinevaks rakenduseks on soovitusteenused (inglise keeles recommender systems), mis kasutaja profileerimise ja mudeldamise põhjal soovitavad talle mõnda toodet või teenust, mis talle tema kohta kogutud informatsiooni põhjal sobida võiks.[1]

Andmekuraator muuda

Andmeanalüütika valdkonna idufirma Dremio looja ja mõjuka Apache Arrow raamistiku arendamise eestvedaja Tomer Shiran ennustab ka andmekuraatori ameti teket. Andmekuraator oleks infovahendajaks Tableau ja R-i rakendusi kasutavate andmeteadlaste ning äritarkvara arendamise ja haldamisega tegelevate tarkvarainseneride vahel. Kuraatorid peaksid tundma mõlema osapoole tegevusvaldkondi ehk nad peaksid valdama nii andmekaeve ja visualiseerimise meetodeid kui ka andmepõhiste rakenduste programmeerimist. Kasvab kiiresti vajadus ka tippjuhtide andmeanalüütika kompetentsi järele, sest andmepõhine otsustamine muutub tulevikus paljude organisatsioonide jaoks väga tähtsaks aspektiks.[1]

Viited muuda

  1. 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 HITSA. "Analüütika ja suurandmed". Originaali arhiivikoopia seisuga 8.12.2019. Vaadatud 8.12.2019.
  2. 2,0 2,1 Toiger, Tarmo (6.03.2019). "Tarmo Toiger: puudulik andmeanalüütika on saamata jäänud kasu". Kandideeri. Originaali arhiivikoopia seisuga 30.09.2020. Vaadatud 11.12.2019.
  3. Kütt, Kadri (11.02.2019). "Andmeanalüütika aitab inimesi juhtida". Director. Vaadatud 11.12.2019.