Kahe valimi t-test

Kahe valimi t-test on üks statistiline test, üks t-testidest. See kontrollib kahe valimi keskmiste järgi, kas kahe üldkogumi keskmised on omavahel võrdsed (alternatiiviks on see, et üks keskmistest on teisest väiksem).

Kahe valimi t-testil on kaks varianti:

  • kahe sõltumatu valimi jaoks, kusjuures mõlemal üldkogumil on sama standardhälve
  • kahe mittesõltumatu valimi jaoks.

Kui kaks sõltumatut valimit pärinevad erineva standardhälbega üldkogumitest, siis tuleb kasutada Welchi testi.

Testi idee muuda

Kahe valimi t-test kontrollib (lihtsaimal juhul) kahe valimi keskmiste   ja   järgi, kas vastavate üldkogumite keskmised on erinevad.

Joonis näitab kahte üldkogumit (mustad punktid) ja kahte valimit (sinised ja punased punktid), mis on üldkogumitest juhuslikult valitud. Valimite keskmised   ja   saab valimitest, arvutada, üldkogumite keskmised   ja   on aga tundmatut. Joonisel on üldkogumid nii konstrueritud, et nende keskmised on võrdsed:  . Nüüd oletatakse ajaloosündmuste tõttu või teoreetilistel kaalutlustel, et üldkogumite keskväärtused   ja   on erinevad.

Lihtsaimal juhul kontrollib test

  • nullhüpotees]i, et üldkogumite keskmised on võrdsed ( ), *alternatiivhüpoteesi vastu, et üldkogumite keskmised on erinevad ( ).
 

Kui valimid on sobivalt valitud, näiteks lihtsate juhuvalimitena, siis on valimi 1 keskmine   suure tõenäosusega üldkogumi 1 keskmise   lähedal ja valimi 2 keskmine   suure tõenäosusega üldkogumi 2 keskmise   lähedal. See tähendab, kaugus punase ja musta punktiirjoone vahel ning kaugus sinise ja musta punktiirjoone vahel on suure tõenäosusega väikesed.

  • Kui   ja   vaheline kaugus ehk sinise ja punase punktiirjoone vaheline kaugus on väike, siis on ka üldkogumite keskmised   ja   lähestikku. Siis ei saa nullhüpoteesi tagasi lükata.
  • Kui   ja   vaheline kaugus ehk sinise ja punase punktiirjoone vaheline kaugus on suur, siis on ka üldkogumite keskmised   ja   teineteisest kaugel. Siis võib nullhüpoteesi tagasi lükata.

Täpsed arvutused on järgnevates jaotistes.

Kahe valimi t-test sõltumatute valimite korral muuda

Et uurida kahe võrdse tundmatu standardhälbega   üldkogumi keskmiste vahesid, kasutatakse kahe valimi t-testi. Selleks peavad mõlemad üldkogumid olema normaaljaotusega või valimid nii suured, et rakendub tsentraalne piirteoreem, (valimite suurus ületab 30). Testi jaoks valitakse n-elemendiline valim   1. üldkogumist ja sellest sõltumatult m-elemendiline valim   2. üldkogumist. Vastavate sõltumatute valimimuutujate   ja   keskväärtuste kohta kehtib siis   ja  , kus   ja   on üldkogumite keskmised. Kui keskmiste vahe jaoks on ette antud arv  , siis ütleb nullhüpotees, et

 

ja alternatiivhüpotees, et

 .

Statistiliseks kriteeriumiks osutub

 

kus  ja   on vastavad valimikeskmised ja

 

kaalutud dispersioon, mis arvutatakse valimite dispersioonide   ja   kaalutud keskmisena.

Statistilisel kriteeriumil   on nullhüpoteesi korral   vabadusastmega t-jaotus. Kontrollväärtus (statistilise kriteeriumi realisatsioon valimi korral) saadakse siis kujul

 

kus   ja   on valimist arvutatavad keskväärtused ja

 

kaalutud dispersiooni realisatsioon, mis arvutatakse valimite dispersioonidest   ja  .

Olulisnivool   lükatakse nullhüpotees alternatiivi kasuks tagasi, kui

 

Teise võimalusena võib sama statistilise kriteeriumiga   testida järgmisi hüpoteese:

  •   versus   ja nullhüpotees lükatakse tagasi, ui  .
  •   versus   ja nullhüpotees lükatakse tagasi, kui  .

Märkus muuda

Kui üldkogumite dispersioonid ei ole võrdsed, siis tuleb teha Welchi test.

Näide 1 muuda

Tuleb võrrelda väetisesorte. Selleks kasutatakse 25 väetisena ühesuurust portsjonit, nimelt   portsjonit väetist sordist A ja   portsjonit väetist sordist B. Eeldatake, et saakidel on normaaljaotus ja dispersioonid on võrdsed. Esimese sordi puhul on keskmine saak   valimi dispersiooniga   ja teise sordi puhul on keskmine saak   dispersiooniga  . Kaalutud keskmiseks saame

 .

Siit saame kontrollväärtuse

 .

See väärtus on suurem kui   vabadusastmega t-jaotuse 0,975-kvantiil  . Järelikult saab  -ise usaldusega väita, et väetisesortide toimes on erinevus.

Kahe valimi t-test mittesõltumatute valimite korral (paarisvõrdluse t-test) muuda

 
Seotud ja mitteseotud t-testi I tüüpi viga sõltuvalt korrelatsioonist. Simuleeritud juhuarvud pärinevad kahemõõtmelisest normaaljaotusest dispersiooniga 1. Olulisusnivoo on 5 % ja juhtumite arv 60.
 
Seotud ja mitteseotud t-testi I tüüpi viga sõltuvalt korrelatsioonist. Simuleeritud juhuarvud pärinevad kahemõõtmelisest normaaljaotusest dispersiooniga 1. Olulisusnivoo on 5 % ja juhtumite arv 60.

Siin on   und   kaks paarikaupa erinevat valimit, mis on saadud näiteks samade uuritavate üksuste kahest mõõtmisest (korduvmõõtmine). Valimid võivad olla paarikaupa mittesõltumatud ka muudel põhjustel, näiteks kui  -i ja  -i väärtused on partnerluses olevate naiste ja meeste näidud ning huvi pakuvad soolised erinevused.

Selleks et testida nullhüpoteesi, et normaaljaotusega üldkogumil on võrdsed keskmised, võib testida ühe valimi t-testi abil hüpoteesi, et vahede   keskmine on null. Praktikas peab väiksemate valimite ( ) korral olema täidetud tingimus, et vahedel on üldkogumis normaaljaotus. Piisavalt suurte valimite korral jaotuvad paaride vahed ligikaudselt normaaljaotusega ümber üldkogumi vahe aritmeetilise keskmise. Tingimuste täidetuse suhtes ei ole t-test kuigi tundlik.[1]

Näide 2 muuda

Et testida uut ravimeetodit kolesterooli taseme alandamiseks, määratakse 10 katsealusel kolesterooli tase enne ja pärast ravi. Saadakse järgmised näidud:

Enne ravi: 223 259 248 220 287 191 229 270 245 201
Pärast ravi: 220 244 243 211 299 170 210 276 252 189
Vahe: 3 15 5 9 −12 21 19 −6 −7 12

Näitude vahede aritmeetiline keskmine on   ja valimi standardhälve on  . Kontrollväärtuseks saame

 .

Et  , siis  . Seega ei saa nullhüpoteesi, et kolesteriini taseme keskväärtused on enne ja pärast ravi võrdsed, nii et ravil pole toimet, olulisusnivool   tagasi lükata. Et  , siis ka ühepoolne alternatiiv, et ravi alandab kolesterooli taset, statistiliselt oluline. Kui ravil üldse toime on, pole see nii suur, et seda võiks nii väikse valimi pealt avastada.

Welchi test muuda

  Pikemalt artiklis Welchi test

Welchi testi puhul arvutatakse statistiline kriteerium sarnaselt nagu kahe valimi t-testi puhul:

 

Ent sellel kriteeriumil ei ole nullhüpoteesi korral t-jaotust, vaid seda lähendatakse t-jaotuse abil vabadusastmete arvu muutmise teel (vaata ka Behrensi-Fisheri probleem):

 

kus   ja   on üldkogumite standardhälvete hinnangud valimite järgi ning   ja   on valimite suurused.

Kuigi Welchi test on välja töötatud spetsiaalselt juhtumiks, kus  , ei tööta ta hästi, kui vähemalt üks jaotus on mittenormaalne ning juhtumite arvud on väikesed ja väga erinevad  ). [2][3]

Alternatiivsed testid muuda

t-testi kasutatakse selleks, et testida hüpoteese ühe või kahe tundmatu standardhälbega normaaljaotusega üldkogumitest võetud valimi keskväärtuste kohta.

Viited muuda

  1. Jürgen Bortz. Statistik für Human- und Sozialwissenschaftler, 6. trükk, Springer: Berlin 2005, ISBN 3-540-21271-X, lk 142.
  2. R. R. Wilcox. Statistics for the Social Sciences, Academic Press Inc 1996, ISBN 978-0127515403.}}
  3. D. G. Bonnet, R. M. Price. Statistical inference for a linear function of medians: Confidence intervals, hypothesis testing, and sample size requirements. – Psychological Methods, kd 7, nr 3, 2002.

Välislingid muuda