Polünomiaalne regressioon

Polünomiaalne regressioon (polynomial regression) on statistikas regressioonanalüüsi meetod, kus sõltumatu muutuja x ning sõltuva muutuja y seos avaldatakse kui kaalutud summa x üheliikmelistest polünoomidest.^[1] Kuigi polünomiaalne regressioon võimaldab muutujate x ja y vahele mittelineaarset seost, kuulub see lineaarregressiooni alla, kuna üksliikmete kordajad on lineaarsed.^[2] Sellel põhjusel saab kordajate leidmiseks kasutada lineaarregressiooni kordajate leidmise meetodeid, näiteks vähimruutude meetodit.

Üldkuju muuda

Regressioonanalüüsi eesmärk on kirjeldada sõltuva muutuja y väärtust sõltumatu muutuja x alusel. Lihtsaimal juhul, esimest järku polünoomiaalse regressiooni korral vastavus

y=\beta _{0}+\beta _{1}x+\varepsilon ,\,

on kasutusel, kus x on sõltumatu tunnus, $\beta _{0}$ ja $\beta _{1}$ on konstandid – vastava osaliikme kordajad, $\varepsilon$ näitab juhuslikku määramatut viga, ning y on sõltuv tunnus.^[3] Selle vastavuse kohaselt x muutmine ühe ühiku võrra muudab oodatavat y väärtust $\beta _{1}$ ühiku võrra. Esimese järgu korral on polünomiaalne ning lineaarne regressioon samasuguse vastavusega.

Tavaliselt ei ole esimest järku polünomiaalne regressioon piisavalt täpne tunnuste vastavuse kirjeldamiseks. Siis võib olla abi järgu suurendamisest, teist järku polünomiaalse regressiooni vastavuse

y=\beta _{0}+\beta _{1}x+\beta _{2}x^{2}+\varepsilon .\,

korral sõltumatu tunnuse x muutmine väärtuselt x väärtusele x+1 muudab oodatavat sõltuva tunnuse y väärtust $\beta _{1}+\beta _{2}(2x+1)$ võrra. Kuna muutuse suurus sõltub x väärtusest, siis tunnuste x ja y suhe ei ole enam lineaarne. Vastavusele x astmeid juurde lisades saab koostada üldkuju.

Üldkuju kui k-järku polünomiaalse regressiooni korral on tunnuste x ja y vastavuseks

y=\beta _{0}+\beta _{1}x+\beta _{2}x^{2}+\beta _{3}x^{3}+\cdots +\beta _{k}x^{k}+\varepsilon .\,

Tundmatute parameetrite $\beta _{0}$ , $\beta _{1}$ , ... leidmise suhtes on regressioonifunktsioon endiselt lineaarne.^[4] Üldiselt on regressioonianalüüsis tavaks kujunenud, et kui mudel tugineb osaliikmele astmel k, siis lisatakse mudelisse ka kõik väiksema astmega osaliikmed, isegi kui nende kordaja ei pruugi tulemust märkimisväärselt mõjutada.^[2]

Polünomiaalset regressiooni saab esitada ka maatrikskujul.

Parameetrite leidmine muuda

Polünomiaalse regressiooni kui lineaarregressiooni erijuhu parameetrite leidmiseks saab kasutada erinevaid meetodeid. Enim on levinud vähimruutude meetod, nimetatud ka kui tavaline vähimruutude meetod. Vähimruutude meetodi kohaselt valitakse lahend hälvete ruutude summade minimeerimise kaudu. Selleks arvutatakse seost iseloomustavatest punktidest kauguste ruudud leitud seosest ning liidetakse need kokku.^[5] Seda protsessi erinevate parameetritega korrates leitakse lahend, mis erineb tegelikest andmetest võimalikult vähe. Kuna hälbed tõstetakse ruutu, võivad üksikud regressioonikõverast kaugel asuvad punktid oluliselt mõjutada regressioonikõvera parameetrite väärtusi. Sellised punktid võivad tähistada vigaseid sisendandmeid, aga ka ebasobivat regressioonikõverat.

Viited muuda

↑ Markus Ellisaar. "Mittelineaarsed regressioonmudelid" (PDF).
↑ ^2,0 ^2,1 "Polynomial Regression".
↑ Katrin Niglas. "Regressioonanalüüs" (PDF).
↑ Ene Käärik. "E-kursuse "Andmeanalüüs II" materjalid" (PDF).
↑ "Regressioonanalüüs. Vähimruutude meetod". Originaali arhiivikoopia seisuga 29. aprill 2018.

[1] Markus Ellisaar. "Mittelineaarsed regressioonmudelid" (PDF).

[:0-2] 2,0 ^2,1 "Polynomial Regression".

[3] Katrin Niglas. "Regressioonanalüüs" (PDF).

[4] Ene Käärik. "E-kursuse "Andmeanalüüs II" materjalid" (PDF).

[5] "Regressioonanalüüs. Vähimruutude meetod". Originaali arhiivikoopia seisuga 29. aprill 2018.

[1]

[2]

[3]

[4]

[5]