Anscombe'i kvartett: erinevus redaktsioonide vahel

Eemaldatud sisu Lisatud sisu
Resümee puudub
Resümee puudub
 
1. rida:
{{Toimeta}}[[File:Anscombe's quartet 3.svg|right|425px|thumb|Anscombe'i kvartett. Kõikide [[Hajuvusdiagramm|hajumisdiagrammide]] korral on [[lineaarne korrelatsioonikordaja]] 0,816. Ülal vasakul on tüüpiline korrelatiivne seos, mille tugevuse hindamiseks lineaarne korrelatsioonikordaja sobib. Ülal paremal funktsionaalne mittelineaarne seos. Alumistel diagrammidel on selgesti eristavad [[Erind|erindid]].]]
{{Toimeta}}[[File:Anscombe's quartet 3.svg|right|425px|thumb|Kõik neli andmehulka omavad samu arvkarakteristikute väärtusi, kuid on ilmselgelt erinevad]]
 
'''Anscombe'i kvartett''' on näide [[statistika]]s, mille eesmärk on [[Korrelatsioonanalüüs|korrelatsioonanalüüsis]] [[Lineaarne korrelatsioonikordaja|lineaare korrelatsioonikordaja]] leidmise korral [[Hajuvusdiagramm|hajuvusdiagrammide]] tutvumise tähtsuse rõhutamine.<ref>{{Raamatuviide|autor=Ako Sauga|pealkiri=Statistika õpik majanduseriala üliõpilastele|aasta=2020|koht=Tallinn|kirjastus=Tallinna Tehnikaülikooli kirjastus|lehekülg=27|isbn=978-9949-83-519-5|url=https://www.ester.ee/record=b5292465*est}}</ref> Nimelt iseloomustab lineaarne korrelatsioonikordaja vaid lineaarse seose tugevust. Juhul kui punktikogum järgib mingit mittelineaarset kõverat või sisaldab [[Erind|erindeid]], siis seose tugevuse hindamiseks lineaarne korrelatsioonikordaja ei sobi.
'''Anscombe'i kvartett''' on [[statistika]]s hoiatav näide sellest, kuidas neli oluliselt erinevat andmehulka võivad omada samu statistiliste arvkarakteristikute väärtusi. Näite nimetus tuleneb tema tutvustajast statistikust [[Francis Anscombe]]'ist, kes 1973. aastal demonstreeris sellega andmete visuaalse esitlemise vajalikkust statistiliste üldistuste tegemisel, enne kui hakata andmete omavahelisi suhteid statistiliselt analüüsima.
 
'''Anscombe'i kvartett''' on [[statistika]]s hoiatav näide sellest, kuidas neli oluliselt erinevat andmehulka võivad omada samu statistiliste arvkarakteristikute väärtusi. Näite nimetus tuleneb tema tutvustajast statistikust [[Francis Anscombe]]'ist, kes 1973. aastal demonstreeris sellega andmete visuaalse esitlemise vajalikkust statistiliste üldistuste tegemisel, enne kui hakata andmete omavahelisi suhteid statistiliseltstatistilises analüüsimaanalüüsis.
 
== Näite lähem kirjeldus ==
64. rida ⟶ 66. rida:
| 4.122 or 4.127 <small>(ümmardatud 3 komakohani)</small>
|-
| ''x''-i ja ''y''-i [[korrelatsioonlineaarne korrelatsioonikordaja]] on kõigil juhtudel
| 0.816 <small>(ümardatud 3 komakohani)</small>
|-
| [[Lineaarregressioon|Lineaarregressiooni]] tulemusel saadud joon on
| lineaarse regressiooni (''linear regression'') joon on kõigil juhtudel
| ''<math>y''&nbsp; =&nbsp; 3.,00&nbsp; +&nbsp;0.500'' 5,00 x''</math> <small>(ümardatud vastavalt 2 ja 3 komakohani)</small>
|}
 
84. rida ⟶ 86. rida:
 
Alumisel paremal joonisel on näha, kuidas üksik [[erind]] (''outlier'') võib põhjustada piisavalt suure korrelatsioonikoefitsiendi isegi siis, kui kahe muutuja suhe ei ole lineaarne.
 
== Viited ==
{{Viited}}
 
==Välislingid==
*[http://www.upscale.utoronto.ca/GeneralInterest/Harrison/Visualisation/Visualisation.html Department of Physics, University of Toronto]