Odstopanje med prebivalstvom kaže na to, kako razširiti nabor podatkov. Na žalost je običajno nemogoče natančno vedeti, kaj je ta populacijski parameter. Za nadomeščanje pomanjkanja znanja uporabljamo temo iz nečednostnih statistik intervali zaupanja. Videli bomo primer, kako izračunati interval zaupanja za populacijsko odstopanje.
Formula intervala zaupanja
Formula za (1 - α) interval zaupanja o variaciji populacije. Določa ga naslednji niz neenakosti:
[ (n - 1)s2] / B < σ2 < [ (n - 1)s2] / A.
Tukaj n je velikost vzorca, s2 je odstopanje vzorca. Število A je točka porazdelitve hi-kvadrat s n -1 stopinj svobode, pri kateri je natančno α / 2 območja pod krivuljo levo od A. Na podoben način je tudi številka B je točka enake hi-kvadratne porazdelitve z natančno α / 2 površine pod krivuljo na desni strani B.
Uvodnice
Začnemo z nizom podatkov z 10 vrednostmi. Ta niz podatkov je bil pridobljen z navadnim naključnim vzorcem:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
Potrebna bi bila nekaj raziskovalnih podatkov, da bi pokazali, da ne obstajajo odpuščeni. Z izgradnjo a
steblo in listna ploskev vidimo, da so ti podatki verjetno iz distribucije, ki je približno običajno distribuirana. To pomeni, da lahko nadaljujemo z iskanjem 95-odstotnega intervala zaupanja za odstopanje prebivalstva.Vzorec variacije
Odstopanje populacije moramo oceniti z vzorčno varianco, označeno s s2. Torej začnemo z izračunom te statistike. V bistvu jih povprečimo vsota kvadratnih odstopanj od srednje. Vendar pa ne, da bi to vsoto delili s n delimo ga s n - 1.
Ugotavljamo, da je povprečna vrednost vzorca 104,2. S pomočjo tega imamo vsoto kvadratnih odstopanj od srednje vrednosti, ki jo poda:
(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6
To vsoto delimo z 10 - 1 = 9, da dobimo odstopanje vzorca 277.
Chi-Square razdelitev
Zdaj se preidemo na našo hi-kvadratno distribucijo. Ker imamo 10 podatkovnih vrednosti, jih imamo 9 stopinj svobode. Ker želimo srednjih 95% naše distribucije, potrebujemo 2,5% v vsakem od obeh repov. Posvetujemo se s tablico ali programsko opremo chi-kvadrat in vidimo, da vrednosti tabel 2.7004 in 19.023 zajemata 95% površine distribucije. Te številke so A in Boz.
Zdaj imamo vse, kar potrebujemo, in pripravljeni smo sestaviti svoj interval zaupanja. Formula za levo končno točko je [(n - 1)s2] / B. To pomeni, da je naša leva končna točka:
(9 x 277) /19.023 = 133
Pravo končno točko najdemo z zamenjavo B s A:
(9 x 277) /2.7004 = 923
In tako smo 95% prepričani, da se razlike med prebivalstvom gibljejo med 133 in 923.
Standardno odstopanje prebivalstva
Ker je standardni odklon kvadratni koren variance, bi to metodo lahko uporabili za izgradnjo intervala zaupanja za standardni odklon populacije. Vse, kar bi morali narediti, je, da vzamemo kvadratne korenine končnih točk. Rezultat bi bil 95-odstotni interval zaupanja za standardni odklon.