Intervali zaupanja so ključni del inferencialne statistike. Lahko uporabimo nekaj verjetnosti in informacij iz a porazdelitev verjetnosti za oceno populacijskega parametra z uporabo vzorca. Izjava a interval zaupanja se naredi tako, da je enostavno napačno razumljen. Ogledali si bomo pravilno razlago intervalov zaupanja in raziskali štiri napake, ki so bile storjene na tem področju statistike.
Kaj je interval zaupanja?
Interval zaupanja se lahko izrazi v območju vrednosti ali v naslednji obliki:
Ocenite ± Območje napake
Interval zaupanja se običajno navede s stopnjo zaupanja.Skupne ravni zaupanja so 90%, 95% in 99%.
Ogledali si bomo primer, kjer želimo uporabiti vzorec srednje vrednosti za sklepanje o povprečju populacije. Predpostavimo, da je to rezultat intervala zaupanja med 25 in 30. Če rečemo, da smo 95% prepričani, da je neznana populacija pomeni je vsebovan v tem intervalu, potem resnično trdimo, da smo interval našli z metodo, ki v 95% časa daje pravilne rezultate. Dolgoročno bo naša metoda 5% časa neuspešna. Z drugimi besedami, ne bomo uspeli zajeti resnične povprečne populacije samo enega od vsakih 20-krat.
Napaka # 1
Zdaj si bomo ogledali vrsto različnih napak, ki jih lahko naredimo pri obravnavi intervalov zaupanja. Ena napačnih trditev, ki se pogosto navaja o intervalu zaupanja pri 95-odstotni stopnji zaupanja, je, da obstaja 95-odstotna možnost, da interval zaupanja vsebuje resnično povprečje prebivalstva.
Razlog, da gre za napako, je pravzaprav precej subtilen. Ključna ideja, ki se nanaša na interval zaupanja, je, da uporabljena verjetnost vstopi v sliko metoda, ki se uporablja, pri določanju intervala zaupanja je, da se nanaša na metodo, ki je rabljen.
Napaka # 2
Druga napaka je razlaga 95-odstotnega intervala zaupanja, ki pravi, da 95% vseh vrednosti podatkov v populaciji spada v interval. Ponovno 95% spregovori o metodi testa.
Da bi ugotovili, zakaj je zgornja trditev napačna, bi lahko pomislili na običajno populacijo z a standardni odklon od 1 in povprečno 5. Vzorec, ki je imel dve podatkovni točki, vsaka z vrednostmi 6, ima vrednost vzorca 6. 95-odstotni interval zaupanja za povprečje prebivalstva bi bil 4,6 do 7,4. To se očitno ne prekriva s 95% normalna porazdelitev, tako da ne bo vsebovalo 95% prebivalstva.
Napaka # 3
Tretja napaka je reči, da 95-odstotni interval zaupanja pomeni, da 95% vseh možnih vzorčnih sredstev spada v območje intervala. Znova razmislite o primeru iz zadnjega razdelka. Vsak vzorec velikosti dva, ki je bil sestavljen iz samo vrednosti, manjših od 4,6, bi imel povprečje manjše od 4,6. Tako ta vzorčna sredstva ne bi bila v tem intervalu zaupanja. Vzorci, ki ustrezajo temu opisu, predstavljajo več kot 5% celotne količine. Zato je napačno reči, da ta interval zaupanja zajame 95% vseh vzorčnih sredstev.
Napaka # 4
Četrta napaka pri obravnavanju intervalov zaupanja je misel, da so edini vir napak. Medtem ko obstaja veliko napako, povezano z intervalom zaupanja, obstajajo tudi druga mesta, ki lahko napake prelevijo v statistično analizo. Nekaj primerov tovrstnih napak je lahko posledica napačne zasnove eksperimenta, pristranskosti vzorčenja ali nezmožnosti pridobivanja podatkov iz določene podskupine populacije.