Včasih je v statistiki koristno videti izdelane primere težav. Ti primeri nam lahko pomagajo ugotoviti podobne težave. V tem članku se bomo sprehodili po postopku vodenja statističnih podatkov o rezultatih, ki zadevajo dva populacijska sredstva. Ne samo, da bomo videli, kako voditi a preizkus hipotez o razliki dveh populacijskih sredstev bomo tudi konstruirali a interval zaupanja za to razliko. Metode, ki jih uporabljamo, včasih imenujemo test dveh vzorcev t in interval zaupanja dva vzorca t.
Izjava problema
Recimo, da želimo preizkusiti matematično sposobnost otrok v razredu. Vprašanje, ki ga imamo morda, je, če imajo stopnje višjega razreda višje povprečne ocene.
Enostavni naključni vzorec 27 tretjerazrednih učencev dobi matematični test, njihovi odgovori so dobljeni, rezultati pa imajo povprečno oceno 75 točk z oceno vzorčni standardni odklon od 3 točk.
Preprost naključni vzorec 20 petih razredov dobi isti matematični test in njihovi odgovori so ocenjeni. Povprečna ocena petih razredov je 84 točk z vzorčnim standardnim odstopanjem 5 točk.
Glede na ta scenarij postavljamo naslednja vprašanja:
- Ali nam vzorčni podatki zagotavljajo dokaz, da povprečna ocena testa prebivalstva vseh petih razredov presega povprečno oceno rezultatov populacije vseh tretjih grederjev?
- Kakšen je 95-odstotni interval zaupanja za razliko v povprečnih rezultatih testov med populacijami tretjih grederjev in petih razredov?
Pogoji in postopek
Izbrati moramo, kateri postopek bomo uporabili. Pri tem se moramo prepričati in preveriti, ali so izpolnjeni pogoji za ta postopek. Prosimo, da primerjamo dva sredstva prebivalstva. Eno zbirko metod, ki jih lahko uporabimo za to, so metode za dvo-vzorčne t-postopke.
Za uporabo teh t-postopkov za dva vzorca moramo poskrbeti, da izpolnjujejo naslednji pogoji:
- Imamo dva preprosta naključna vzorca iz dveh zanimivih populacij.
- Naši preprosti naključni vzorci ne predstavljajo več kot 5% populacije.
- Oba vzorca sta med seboj neodvisna in med osebami ni nobenega ujemanja.
- Spremenljivka je običajno porazdeljena.
- Obe populaciji sta povprečni odklon in standardni odklon neznana.
Vidimo, da je večina teh pogojev izpolnjena. Odgovorili so nam, da imamo preproste naključne vzorce. Populacija, ki jo preučujemo, je velika, saj je na teh stopnjah na milijone študentov.
Pogoj, ki ga ne moremo samodejno domnevati, je, če se ocene rezultatov običajno porazdelijo. Ker imamo dovolj veliko velikost vzorca, zaradi robustnosti naših t-postopkov spremenljivke ne potrebujemo, da se normalno porazdeli.
Ker so pogoji izpolnjeni, opravimo nekaj predhodnih izračunov.
Standardna napaka
Standardna napaka je ocena standardnega odklona. Za to statistiko dodamo vzorčno varianco vzorcev in nato vzamemo kvadratni koren. Tako dobimo formulo:
(s1 2 / n1 + s22 / n2)1/2
Z uporabo zgornjih vrednosti vidimo, da je vrednost standardne napake
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
Stopnje svobode
Konzervativni približek lahko uporabimo za svoje stopinj svobode. To morda podcenjuje število stopinj svobode, vendar je to veliko lažje izračunati kot z uporabo Welchove formule. Uporabimo manjšo od obeh velikosti vzorca, nato pa od te številke odštejemo eno.
V našem primeru je manjši od obeh vzorcev 20. To pomeni, da je število stopenj svobode 20 - 1 = 19.
Preizkus hipoteze
Preizkusiti želimo hipotezo, da imajo učenci petih razredov povprečno oceno testa, ki je večja od povprečne ocene učencev tretjih razredov. Pustimo μ1 je povprečna ocena populacije vseh petih razredov. Podobno pustimo μ2 je povprečna ocena populacije vseh tretjih grederjev.
Hipoteze so naslednje:
- H0: μ1 - μ2 = 0
- Ha: μ1 - μ2 > 0
Statistika preskusa je razlika med vzorčnimi sredstvi, ki se nato deli s standardno napako. Ker za oceno standardnega odstopanja populacije uporabljamo vzorčne standardne odklone, je testna statistika iz t-porazdelitve.
Vrednost testne statistike je (84 - 75) /1.2583. To je približno 7,15.
Zdaj določimo, kakšna je vrednost p za ta test hipoteze. Gledamo vrednost testne statistike in kje se nahaja na t-distribuciji z 19 stopinjami svobode. Za to razdelitev imamo 4,2 x 10-7 kot naša p-vrednost. (Eden od načinov za določitev tega je uporaba funkcije T.DIST.RT v Excelu.)
Ker imamo tako majhno p-vrednost, zavračamo nično hipotezo. Ugotovimo, da je povprečna ocena testnih razredov za pete razredce višja od povprečne ocene za tretje grederje.
Interval zaupanja
Ker smo ugotovili, da obstaja razlika med srednjimi ocenami, zdaj določimo interval zaupanja za razliko med tema dvema sredstvima. Imamo že veliko tistega, kar potrebujemo. Interval zaupanja za razliko mora imeti oceno in mero napake.
Oceno razlike dveh sredstev je enostavno izračunati. Preprosto ugotovimo razliko med vzorčnimi sredstvi. Ta razlika v vzorcu pomeni oceno razlike v populacijskem sredstvu.
Za naše podatke je razlika v vzorčnih sredstvih 84 - 75 = 9.
Mejo napake je nekoliko težje izračunati. Za to moramo ustrezno statistiko pomnožiti s standardno napako. Statistiko, ki jo potrebujemo, ugotovimo s pregledovanjem tabele ali statistične programske opreme.
Spet z uporabo konzervativnega približevanja imamo 19 stopinj svobode. Za 95-odstotni interval zaupanja vidimo, da t* = 2.09. Lahko bi uporabili T.INV funkcija v Excelul izračunati to vrednost.
Zdaj vse sestavimo in vidimo, da je naša mera napake 2,09 x 1,2583, kar je približno 2,63. Interval zaupanja je 9 ± 2,63. Interval znaša 6,37 do 11,63 točke na testu, ki so ga izbrali petošolci in tretjerazredniki.