Kvartiilid on kirjeldavas statistikas tunnuse väärtused variatsioonireal, mis jagavad variatsioonirea neljaks ligikaudu võrdseks osaks.

  • Keskmine kvartiil ehk 2. kvartiil e. 50-protsentiil e 0,5 kvantiil ehk mediaan on tunnuse väärtus, millest suuremaid ja väiksemaid tunnuseid on variatsioonireas ligikaudu võrdselt.
  • Alumine kvartiil e. 1. kvartiil e. 25-protsentiil ehk 0,25 kvantiil (lühendid LQ ja Q1) on tunnuse väärtus, millest väiksemaid või võrdseid tunnuseid on ligikaudu 25%
  • Ülemine kvartiil e. 3. kvartiil e 75-protsentiil ehk 0,75 kvantiil (lühendid UQ ja Q3) on tunnuse väärtus, millest suuremaid või võrdseid tunnuseid on ligikaudu 25%

Ülemise ja alumise kvartiili vahele jääb 50% tunnuste väärtustest. Seda vahemikku nimetatakse kvartiilhaardeks.

Ülemist ja alumist kvartiili saab defineerida ka tõenäosuslikult – variatsioonirea 1. kvartiil on selline tunnuse väärtus x, millest väiksemate väärtuste esinemise tõenäosus variatsioonireas on kõige rohkem 1/4. 3. kvartiil on selline tunnuse väärtus x, millest väiksemate väärtuste esinemise tõenäosus on kõige rohkem 3/4.

Ülemise ja alumise kvartiili arvutamise meetodeid

muuda

Kvartiilide arvutamiseks on kasutusel erinevaid meetodeid, mis annavad pisut erinevaid tulemusi. Eristatakse nn. klassikalisi meetodeid, mis on mõeldud ennekõike kvartiilide arvutamiseks, ja meetodeid, mis on mõeldud protsentiilide arvutamiseks, kusjuures 25-protsentiil, 50-protsentiil ja 75-protsentiil vastavad vastavalt 1., 2. ja 3. kvartiilile.

Klassikalised meetodid

muuda

Tukey meetod

muuda

Tukey meetod on John Tukey välja töötatud meetod, mille eesmärk oli teha kvartiilide leidmine võimalikult lihtsaks.

Selle meetodi järgi:

  • järjestatakse variatsioonirea elemendid väärtuste kasvamise järjekorras;
  • jagatakse variatsioonirida pooleks nii, et mõlemale poole jääb võrdne arv elemente (leitakse mediaan);
  • kui variatsioonireas on paaritu arv elemente, lisatakse mediaanväärtus mõlemale poolele;
  • leitakse mõlema poole mediaan.

Näiteks:

Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8}
1. mediaan jaotab rea pooleks: 1, 2, 3, 4, - 5, 6, 7, 8    – mediaan on 4,5
2. alumine kvartiil: 1, 2, - 3, 4     - alumine kvartiil on 2,5
3. ülemine kvartiil: 5, 6, - 7, 8     - ülemine kvartiil on 6,5

Valemina:

Kui n on paaritu arv, siis LQ= (n+3)/4; UQ= (3n+1)/4;
Kui n on paarisarv, siis LQ= (n+2)/4; UQ= (3n+2)/4

kus n on elementide arv variatsioonireas

Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8}
n=8, mis on paarisarv. Järelikult 
LQ=(8+2)/4= 2,5
UQ=(3×8+2)/4= 6,5


Moore'i ja McCabe'i meetod

muuda

Moore'i ja McCabe'i meetod on edasiarendus Tukey meetodist. Kui variatsioonireas on paaritu arv elemente, siis erinevalt Tukey meetodist ei lisata mediaanväärtust kummalegi poolele. Muul juhul on tulemus sama.

Kui n on paaritu arv, siis LQ= (n+1)/4; UQ=(3n+3)/4
Kui n on paarisarv, siis LQ= (n+2)/4; UQ=(3n+2)/4

kus n on elementide arv variatsioonireas

Mendenhalli ja Sincichi meetod

muuda

Selle meetodiga leitakse alumine kvartiil valemiga L = (n+1)/4, kus n on elementide arv ja L näitab alumisele kvartiilile vastava elemendi järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse ülespoole. Ülemine kvartiil leitakse valemiga U = (3n+3)/4, kus n on elementide arv ja U näitab ülemise kvartiili järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse allapoole.

Näiteks:

Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8}
1. L= (8+1)/4= 2,25 -> L=2, alumine kvartiil on 2. element ehk 2
2. U= (3×8+3)/4= 6,75 -> L=7, ülemine kvartiil on 7. element ehk 7 

Mendenhalli ja Sincichi 1. variatsioon

muuda

Kasutusel on ka sama meetodi variatsioon, kus L ja Q väärtust ei ümardata, vaid leitakse lineaarse interpolatsiooni abil lähimate väärtuste vahele jääv sobiv väärtus. Näiteks kui L=2,25, siis leitakse teise (L täisosa) ja sellele järgneva (kolmanda) elemendi vahel väärtus, mis on 1/4 kaugusel (L väärtuse murdosa 0,25) 2. elemendi väärtusest. (Antud näites on 2. ja 3. elemendi vahel sobivas kohas 2,25)

Mendenhalli ja Sincichi 2. variatsioon

muuda

Kasutusel on ka sama meetodi variatsioon, kus L=(n+1)/4, kus n on elementide arv ja L näitab alumisele kvartiilile vastava elemendi järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse ülespoole. Ülemine kvartiil leitakse valemiga U = (3n+2)/4, kus n on elementide arv ja U näitab ülemise kvartiili järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse allapoole.

Freundi ja Perlesi meetod

muuda

See on vähekasutatud meetod, mille järgi L = (n+3)/4, kus n on elementide arv ja L-nda elemendi väärtus on alumine kvartiil. Kui L pole täisarv, kasutatakse väärtuse leidmiseks lineaarset interpolatsiooni. Ülemise kvartiili leidmisel U = (3n+1)/4, kus n on elementide arv ja U-nda elemendi väärtus on ülemine kvartiil. Kui U pole täisarv, kasutatakse väärtuse leidmiseks lineaarset interpolatsiooni.

Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8}
1. L=(8+3)/4= 2,75 alumine kvartiil on 2,75
2. U=(3×8+1)/4= 6,25 ülemine kvartiil on 6,25

Muud meetodid

muuda

Muud meetodid sarnanevad muude protsentiilide arvutamise meetoditega, kus leitakse vastavalt 25-protsentiili alumise kvantiili ja 75-protsentiili ülemise kvantiili jaoks.

Kirjandust

muuda