Wikidata

vaba ja kõigile avatud teadmusbaas, mida loovad ja toimetavad vabatahtlikud kaastöölised

Wikidata (eestipäraselt Vikiandmed) on vabatahtlike kaastööliste koostöös toimetatav teadmusbaas, mis on mõeldud olema Vikipeedia ja selle sõsarprojektide ühiselt jagatud andmeallikas. Kuna baasis olevad andmed litsentsitakse avalikku omandisse, siis on Wikidata piiramatult kasutatavad ka kolmandatele osapooltele. Teadmusbaas kasutab Wikibase tarkvara ning teadmusbaasi haldab Wikimedia Foundation.

Wikidata logo
Wikidata avaleht

Wikidata on Vikipeedia taristu mõttes analoogne Wikimedia Commonsiga, mis on Vikipeedia ja sõsarprojektide ühiselt jagatud meediapank.

Wikidatas on üle 100 miljoni andmeüksuse.

Teadmuspanga kontseptsioon muuda

Wikidata on iseseisev struktureeritud linkandmete projekt, mille eesmärgiks on luua universaalne andmeontoloogia ning täita see ajakohase ning usaldusväärse andmesisuga autoriteetsetest andmeallikatest. Ulatuslike andmetega täidetud ja ajakohane teadmuspank oleks Vikipeedia jaoks vahend sisu kvaliteedi tagamisel ning Wikidatas kasutatav semantilistest kolmikutest koosnev subjekt-predikaat andmestruktuur võimaldaks andmesisu abil genereerida väiteid ning lauseid mistahes keeles ning panna sellega aluse uue põlvkonna andmepõhisele entsüklopeediale.[1]

Wikidata arenduses seati esialgu eesmärgiks juurutada andmete kasutamist Vikipeedias kolmes faasis:

  1. Vikipeedia keeleversioonide vaheliste keelelinkide lahendamine Wikidata baasil
  2. Vikipeedia eri infokastides esitatud andmete lahendamine Wikidata baasil
  3. Vikipeedia artiklites esitatud väidete jm andmesisu sidumine Wikidataga[2][3]

2018. aasta alguses oli Wikidata seisus, kus loodavate andmeüksuste ning kasutajate arv tõusis kiiresti[4] ning lahendamist ootasid küsimused ülemontoloogia loomisega ning selle kureerimisega[5], ka põhjustasid arutelusid andmeallikate viidatus ning automaatsed andmete importimise ja uuendamise vahendid ning nende haldus[6]. Seejuures oli Wikidata juba võtnud üle DBpedia ja Freebase'i ülesanded ning on laialdaselt kasutusel eri infoühiskonna teenuste juures, ka on Wikidatas olemas terviklikud andmehulgad eri valdkondadest, nt geneetikast.[7]

Andmete struktuur muuda

 
Andmeüksus ulmekirjanik Douglas Adamsi kirje näitel

Andmed on Vikiandmete teadmusbaasis esitatud andmeüksustena (ingl k item). Igal üksusel on unikaalne identifikaator kujul Q1234567, üksus võib olla nii konkreetne objekt või isik, liiginimi, mõiste vmt, st mistahes mis on olemas ning unikaalsena identifitseeritav. Iga üksuse juurde kuuluvad avaldused (ingl k statement) selle üksuse kohta, mis on väljendatud omadustena (ingl k property või attribute), mille abil omistatakse üksustele väärtusi (ingl k value). Väärtused võivad olla nt arvandmed, pildid, aga ka teised Wikidata andmeüksused.

Ka omadused on varustatud unikaalsete identifikaatoriga kujul P12345 ning need seovad omavahel andmeüksusi ja andmeid või andmeüksusi üksteisega ning annavad sellega teadmuspangas talletatud väidetele sisu. Kui andmeüksused võivad olla semantilise kolmiku mõttes subjekti ja predikaadi positsioonis, siis omadused on alati koopula ehk siduva verbi positsioonis.[8][9]

Wikidata tavakasutaja puutub kokku peamiselt andmeüksuste loomise või nende muutmisega, nt uute avalduste lisamisega olemasolevatele üksustele vmt. Omaduste loomine on aga juba seotud Wikidata spetsiifilise ontoloogiaga ning uue omaduse loomise ettepanek tähendab, et olemasolev ontoloogia ei ole maailma kirjeldamiseks piisav ning vajab täiendamist. Uute omaduste loomise taotlused vaadatakse Wikidata kaastööliste poolt ühiselt läbi ning kui nende järele on vajadus, siis need kinnitatakse.[10]

Arenduslugu muuda

Wikidata sai alguse 30. oktoobril 2012[11] ning oli Wikimedia Foundationi esimene uus projekt alates 2006. aastast. Esimese faasina loodi andmebaas intervikilinkidest, millele Vikipeedia eri keeleversioonidel puudus ligipääs. Wikidata lingistikku rakendati esimest korda 14. jaanuaril 2013 ungarikeelses Vikipeedias[12]. 30. jaanuaril järgnesid heebrea ja itaalia Vikipeediad[13], 13. veebruaril inglise Vikipeedia. Kõigis ülejäänud keeleversioonides (sh eestikeelses Vikipeedias) võeti Wikidata kasutusele 6. märtsil 2013[14].

Wikidata üks kolmest eesmärgist on pakkuda ühisest allikast teatud andmetüüpe (nt sünnikuupäevi) Wikimedia projektidele nagu Vikipeedia. Intervikilinkide järel on Wikidata töö teise faasi jõudmisel hakatud pakkuma ka teisi andmetüüpe, sh lisaks Wikimedia Commonsi pildifailidele, geograafilistele koordinaatidele, kuupäevadele jmt ka linkandmeid paljudest autoriteetsetest avaandmete kogudest. Vikipeedia keeleversioonidel on neile andmetele täielik ligipääs alates aprillist 2016.[15]

Kolmandas faasis hakatakse Vikipeedias olevaid nimekirju, tabeleid jm andmetel põhinevat sisu automaatselt genereerima Wikidata põhjal ning üleminek sellesse faasi alles käib.

Vaata ka muuda

Viited muuda

  1. Claudia Müller-Birn (2015). "Peer-production system or collaborative ontology engineering effort: what is Wikidata?". OpenSym '15 Proceedings of the 11th International Symposium on Open Collaboration. Vaadatud 18. märts 2018.
  2. Wikidata, Meta-Wiki, Lydia Pintscheri muudatus 14:14, 2 August 2012
  3. "Data Revolution for Wikipedia". Wikimedia Deutschland. 30. märts 2012. Originaali arhiivikoopia seisuga 11. september 2012. Vaadatud 11. september 2012.
  4. Martin Poulter (14. september 2017). "Report from Wikimania". Bodleian Digital Library blog.
  5. "Wikidata:WikiProject Ontology". Wikidata koduleht.
  6. Navino Evans (30. november 2017). "Importing data into Wikidata – Current challenges and ideas for future development". Histropedia blogi.
  7. Sebastian Burgstaller-Muehlbacher (1. jaanuar 2016). "Wikidata as a semantic framework for the Gene Wiki initiative". Database, Volume 2016.
  8. "Wikidata:Wikipedia — Understanding Wikidata". Wikidata koduleht.
  9. "Wikidata:Glossary". Wikidata koduleht.
  10. "Wikidata:Property proposal". Wikidata veebileht.
  11. Wikidata(arhiveeritud 30. oktoobri 2012 seisuga aadressil )
  12. Pintscher, Lydia (14. jaanuar 2013). "First steps of Wikidata in the Hungarian Wikipedia". Wikimedia Deutschland. Vaadatud 15. jaanuar 2013.
  13. Pintscher, Lydia. "Wikidata coming to the next two Wikipedias". Wikimedia Deutschland. Vaadatud 31. jaanuar 2013.
  14. Pintscher, Lydia (6. märts 2013). "Wikidata now live on all Wikipedias". Wikimedia Deutschland. Vaadatud 8. märts 2013.
  15. Lydia, Pintscher (27. aprill 2016). "Wikidata support: arbitrary access is here". Commons:Village pump. Vaadatud 1. veebruar 2018.

Välislingid muuda