Lineaarne korrelatsioonikordaja

Lineaarne korrelatsioonikordaja ehk Pearsoni korrelatsioonikordaja r kasutab hajuvusdiagrammi informatsiooni ning on kõige levinum kordaja. Excel'is r = CORREL(X,Y)

Korrelatsioonikordaja r omab tähendust vaid pidevatele ja normaaljaotusega tunnustele.

Mida lähemal on r absoluutväärtus ühele, seda tugevamalt on tunnused omavahel seotud.

Matemaatiline definitsioon muuda

Lineaarne korrelatsioonikordaja r avaldub kujul[1]ː

 ,

kus n on juhuslike suuruste X ja Y väärtuste   ja   paaride arv (valimi maht),   ja   aritmeetilised keskmised ning   ja   vastavad standardhälbed.

Omadused muuda

  • Väärtus asub lõigus –1 kuni 1 -1≤r≤1.
  • Kui tunnused on kasvavalt seotud on r>0.
  • Kui tunnused on kahanevalt seotud, on r<0.
  • Kui tunnused on sõltumatud, siis r =0.
  • Nõrk seos: kordaja |r|< kui 0.3
  • Keskmine seos: kordaja 0.3< |r| < 0.7.
  • Tugev seos: kordaja |r|> 0.7.

Puudused muuda

  • Mõjutub erinditest (paar erindit võivad “venitada” kordaja suureks, kuigi tegelikult on seos nõrk) – erind välja jätta
  • Mõjutub kolmandast tunnusest ehk punktid moodustavad mingi kolmanda tunnuse suhtes tõusva (langeva) pilve – uurida kordajaid kolmanda tunnuse väärtuste kaupa
  • Tunneb ära vaid lineaarse seose, muu seose korral (ruutfunktsionaalne seos vms) võib anda tulemuseks nõrga või olematu sõltuvuse.

Kõigil juhtudel on üldjuhul probleem nähtav hajuvusdiagrammilt.

Vaata ka muuda

Viited muuda

  1. Ako Sauga (2020). Statistika õpik majanduseriala üliõpilastele. Tallinn: Tallinna Tehnikaülikooli kirjastus. Lk 398. ISBN 978-9949-83-519-5.