Kako oceniti standardna odstopanja (SD)

Standardni odklon in območje sta oba merila širjenje nabora podatkov. Vsaka številka nam na svoj način pove, kako so podatki razmaknjeni, saj so oboje merilo spreminjanja. Čeprav med EU ni izrecne zveze območje in standardni odklon, obstaja a pravilo palca kar je koristno za povezavo teh dveh statističnih podatkov. Ta odnos se včasih imenuje pravilo obsega za standardni odmik.

Pravilo o območju govori o tem, da je standardni odklon vzorca približno enak četrtini obsega podatkov. Z drugimi besedamis = (Največja - najmanjša) / 4. To je zelo enostavna formula, ki jo je treba uporabiti in jo je treba uporabljati le kot zelo grobo ocena standardnega odklona.

Primer

Če si želite ogledati primer, kako deluje pravilo obsega, bomo pogledali naslednji primer. Recimo, da začnemo z vrednostmi podatkov 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Te vrednosti imajo a pomeni od 17 in standardni odklon približno 4.1. Če namesto tega najprej izračunamo razpon naših podatkov kot 25 - 12 = 13 in nato to število razdelimo na štiri, ocenjujemo standardni odklon kot 13/4 = 3,25. Ta številka je sorazmerno blizu pravemu standardnemu odklonu in je dobra za grobo oceno.

instagram viewer

Zakaj deluje?

Morda se zdi, da je pravilo dosega nekoliko nenavadno. Zakaj deluje? Ali se vam ne zdi povsem samovoljno, če razpon razdelite na štiri? Zakaj ne bi razdelili na drugo število? V resnici se dogaja nekaj matematične utemeljitve.

Spomnimo se lastnosti krivulja zvona in verjetnosti iz a standardna normalna porazdelitev. Ena značilnost je povezana s količino podatkov, ki spada v določeno število standardnih odstopanj:

  • Približno 68% podatkov je znotraj enega standardnega odstopanja (večjega ali nižjega) od povprečja.
  • Približno 95% podatkov je v dveh standardnih odstopanjih (višjih ali nižjih) od povprečne vrednosti.
  • Približno 99% je v treh standardnih odstopanjih (višjih ali nižjih) od povprečne vrednosti.

Število, ki ga bomo uporabili, ima 95%. Lahko rečemo, da imamo 95% od dveh standardnih odstopanj pod povprečjem do dveh standardnih odstopanj nad srednjo vrednostjo 95% naših podatkov. Tako bi se skoraj vsa naša normalna porazdelitev raztegnila na linijski odsek, ki je dolg skupaj štiri standardne odklone.

Niso vsi podatki običajno razporejeni in so oblikovani z krivuljo zvonca. Toda večina podatkov je dovolj obnašana, da odhod dveh standardnih odstopanj od povprečja zajame skoraj vse podatke. Ocenjujemo in pravimo, da so štirje standardni odkloni približno velikosti obsega, zato je razpon, deljen s štirimi, grobi približek standardnega odklona.

Uporabe za območje pravila

Pravilo obsega je koristno v številnih nastavitvah. Prvič, zelo hitro se oceni standardni odklon. Standardni odklon zahteva, da najprej najdemo sredino, nato pa odštejemo to sredino iz vsake podatkovne točke, kvadrata razlike, dodajte te, razdelite za eno manj kot število podatkovnih točk, nato pa (končno) vzemite kvadrat koren. Po drugi strani pa pravilo obsega le eno odštevanje in eno delitev.

Druga mesta, kjer je pravilo o območju, je koristno, če imamo nepopolne podatke. Formule, kot je tista za določitev velikosti vzorca, zahtevajo tri podatke: želeno meja napake, the raven zaupanja in standardni odklon populacije, ki jo preiskujemo. Velikokrat je nemogoče vedeti, kakšna je populacija standardni odklon je. S pravilom o razponu lahko ocenimo to statistiko in nato vemo, kako obsežen bi moral biti naš vzorec.