Uporaba statističnih tabel je pogosta tema na številnih tečajih statistike. Čeprav programska oprema dela izračune, je še vedno pomembna spretnost branja tabel. Videli bomo, kako uporabiti tabelo vrednosti za hi-kvadratno porazdelitev za določitev kritične vrednosti. Tabela, ki jo bomo uporabili, je ki se nahaja tukajVendar so druge tablice chi-kvadrat postavljene na načine, ki so zelo podobni tej.
Kritična vrednost
Uporaba tabele s kvadratom chi, ki jo bomo preučili, je določitev kritične vrednosti. Kritične vrednosti so pomembne pri obeh hipotezni testi in intervali zaupanja. Za preskuse hipotez nam kritična vrednost kaže mejo tega, kako skrajno statistiko testa moramo zavreči ničelno hipotezo. Za intervale zaupanja je kritična vrednost ena od sestavin, ki sega v izračun stopnje napake.
Za določitev kritične vrednosti moramo vedeti tri stvari:
- Število stopinj svobode
- Število in vrsta repov
- Raven pomembnosti.
Stopnje svobode
Prva pomembna postavka je število stopinj svobode. Ta številka nam pove, kateri od
šteti neskončno veliko hi-kvadratnih distribucij, ki jih bomo uporabili pri svojem problemu. Način, kako določimo to številko, je odvisen od natančne težave, ki jo uporabljamo hi-kvadratna porazdelitev s. Sledijo trije pogosti primeri.- Če delamo a test testa, potem je število stopenj svobode eno manj kot število rezultatov za naš model.
- Če gradimo a interval zaupanja za populacijsko odstopanje, potem je število stopenj svobode za eno manj od števila vrednosti v našem vzorcu.
- Za hi-kvadrat test neodvisnosti dveh kategoričnih spremenljivk, imamo dvosmerno tabelo ob nepredvidljivih dogodkih r vrstice in c stolpcev. Število stopinj svobode je (r - 1)(c - 1).
V tej tabeli število stopenj svobode ustreza vrstici, ki jo bomo uporabili.
Če tabela, s katero delamo, ne prikazuje natančnega števila stopenj svobode, ki jih zahteva naša težava, potem obstaja pravilo, ki ga uporabljamo. Število stopinj svobode zaokrožimo na najvišjo vloženo vrednost. Recimo, da imamo 59 stopinj svobode. Če ima naša tabela samo vrstice za 50 in 60 stopinj svobode, potem uporabljamo vrstico s 50 stopinjami svobode.
Repi
Naslednja stvar, ki jo moramo upoštevati, je število in vrsta repov, ki se uporabljajo. Čisti kvadratna porazdelitev je nagnjena v desno, zato se običajno uporabljajo enostranski testi, ki vključujejo desni rep. Če pa izračunamo dvostranski interval zaupanja, bi morali upoštevati a dvotirni test z desnim in levim repom v naši distribuciji chi-kvadrat.
Raven zaupanja
Končni podatek, ki ga moramo vedeti, je raven zaupanja ali pomembnosti. To je verjetnost, ki jo običajno označujemo s alfa. Nato moramo to verjetnost (skupaj s podatki o naših repih) prevesti v pravi stolpec, ki ga bomo uporabili v naši tabeli. Ta korak je velikokrat odvisen od tega, kako je izdelana naša tabela.
Primer
Na primer, upoštevali bomo test dobrega prileganja za dvanajststransko matrico. Naša ničelna hipoteza je, da so enake verjetnosti, da bodo vse strani zvite, zato ima vsaka stran 1/12 verjetnosti, da se bo valjala. Ker je 12 izidov, je 12 -1 = 11 stopinj svobode. To pomeni, da bomo za izračune uporabili vrstico z oznako 11.
Dober test kondicije je preizkus z enim repom. Rep, ki ga uporabljamo za to, je pravi rep. Predpostavimo, da je stopnja pomembnosti 0,05 = 5%. To je verjetnost v desnem repu distribucije. Naša lestvica je postavljena za verjetnost v levem repu. Torej mora biti leva od naše kritične vrednosti 1 - 0,05 = 0,95. To pomeni, da uporabimo stolpec, ki ustreza 0,95, in vrstico 11, da damo kritično vrednost 19,675.
Če je statistika hi-kvadrata, ki jo izračunamo iz naših podatkov, večja ali enaka19.675, potem ničelno hipotezo zavrnemo s 5-odstotno pomembnostjo. Če je naša statistika hi-kvadrat manjša od 19.675, potem bomo mi ne zavrne nična hipoteza.