Preizkus hipoteze za primerjavo dveh deležev

V tem članku bomo preučili korake, potrebne za izvedbo a preizkus hipotezali preskus pomembnosti za razliko dveh deležev prebivalstva. To nam omogoča, da primerjamo dva neznana razmerja in sklepamo, če nista enaka drug drugemu ali če je eden večji od drugega.

Pregled in ozadje hipoteznega testa

Preden se lotimo posebnosti našega testa hipotez, si bomo ogledali okvir testov hipotez. V preizkusu pomembnosti skušamo pokazati, da je izjava o vrednosti prebivalstva parameter (ali včasih narava samega prebivalstva) verjetno drži.

Za to izjavo zbiramo dokaze z izvajanjem statistični vzorec. Iz tega vzorca izračunamo statistiko. Vrednost te statistike je tisto, kar uporabljamo za določitev resničnosti izvirne izjave. Ta postopek vsebuje negotovost, vendar lahko to negotovost količinsko določimo

Celoten postopek za preizkus hipotez je naveden v spodnjem seznamu:

  1. Prepričajte se, da so izpolnjeni pogoji, ki so potrebni za naš test.
  2. Jasno navedite nične in alternativne hipoteze. Alternativna hipoteza lahko vključuje enostranski ali dvostranski test. Določiti bi morali tudi stopnjo pomembnosti, ki jo bomo označili z grško črko alfa.
    instagram viewer
  3. Izračunajte testno statistiko. Vrsta statistike, ki jo uporabljamo, je odvisna od posameznega testa, ki ga izvajamo. Izračun temelji na našem statističnem vzorcu.
  4. Izračunaj p-vrednost. Statistični test lahko prevedemo v p-vrednost. Vrednost p je verjetnost naključja, ki proizvede vrednost naše testne statistike pod predpostavko, da je ničelna hipoteza resnična. Splošno pravilo je, da manjša kot je p vrednost, večji so dokazi proti ničelni hipotezi.
  5. Naredite zaključek. Končno uporabimo vrednost alfa, ki je bila že izbrana kot vrednost praga. Pravilo odločitve je, da če je p-vrednost manjša ali enaka alfa, zavračamo ničelno hipotezo. Sicer mi ne zavrne nična hipoteza.

Zdaj, ko smo videli okvir za test hipotez, bomo videli posebnosti testa hipotez za razliko dveh deležev prebivalstva.

Pogoji

Preizkus hipoteze za razliko dveh deležev prebivalstva zahteva, da so izpolnjeni naslednji pogoji:

  • Imamo dva preprosti naključni vzorci od velike populacije. Tu "velik" pomeni, da je populacija vsaj 20-krat večja od velikosti vzorca. Velikosti vzorcev bodo označene s n1 in n2.
  • Posamezniki v naših vzorcih so bili izbrani neodvisno drug od drugega. Tudi same populacije morajo biti neodvisne.
  • V obeh naših vzorcih je vsaj 10 uspehov in 10 neuspehov.

Dokler so ti pogoji izpolnjeni, lahko nadaljujemo s testom hipotez.

Nule in alternativne hipoteze

Zdaj moramo razmisliti o hipotezah za naš preizkus pomembnosti. Ničelna hipoteza je naša izjava brez učinka. V tem posebnem testu hipotez je naša nična hipoteza, da ni razlike med obema populacijama. To lahko zapišemo kot H0: str1 = str2.

Alternativna hipoteza je ena od treh možnosti, odvisno od posebnosti tega, za kar testiramo:

  • Ha: str1 je večja od str2. To je enostranski ali enostranski test.
  • Ha: str1 je manj kot str2. To je tudi enostranski test.
  • Ha: str1 ni enako str2. To je dvorezen oz dvostranski test.

Kot vedno je treba tudi zato, da smo previdni, uporabiti dvostransko alternativno hipotezo, če ne bomo imeli smer v mislih, preden dobimo svoj vzorec. Razlog za to je, da je ničelno hipotezo težje zavrniti z dvostranskim testom.

Tri hipoteze lahko na novo napišemo z navedbo kako str1 - str2 je povezano z vrednostjo nič. Če smo natančnejši, bi nična hipoteza postala H0:str1 - str2 = 0. Morebitne alternativne hipoteze bi bile napisane kot:

  • Ha: str1 - str2 > 0 je ekvivalent izjave "str1 je večja od str2."
  • Ha: str1 - str2 <0 je ekvivalent izjave "str1 je manj kot str2."
  • Ha: str1 - str2 ≠ 0 je ekvivalent izjave "str1 ni enako str2."

Ta enakovredna formulacija nam v resnici pokaže nekoliko več tega, kar se dogaja v ozadju. V tem testu hipoteze delamo dva parametra str1 in str2 v en sam parameter str1 - str2. Nato preizkusimo ta nov parameter glede na vrednost nič.

Statistika testa

Formula testne statistike je podana na zgornji sliki. Sledi razlaga vsakega od pogojev:

  • Vzorec iz prve populacije ima velikost n1. Število uspehov tega vzorca (kar v neposredni formuli ni neposredno razvidno) je k1.
  • Vzorec iz druge populacije ima velikost n2. Število uspehov tega vzorca je k2.
  • Razmerja vzorcev so str1-je = k1 / n1 in p2-hat = k2 / n2 .
  • Nato uspehe iz obeh vzorcev združimo ali združimo in pridobimo: p-klobuk = (k1 + k2) / (n1 + n2).

Kot vedno bodite previdni pri vrstnem redu operacij. Pred odvzemom kvadratnega korena je treba izračunati vse pod radikalom.

Vrednost P

Naslednji korak je izračun p-vrednosti, ki ustreza naši testni statistiki. Za svojo statistiko uporabljamo običajno normalno distribucijo in se posvetujemo s tabelo vrednosti ali uporabljamo statistično programsko opremo.

Podrobnosti našega izračuna vrednosti p so odvisne od alternativne hipoteze, ki jo uporabljamo:

  • Za Ha: str1 - str2 > 0, izračunamo delež normalne porazdelitve, ki je večji od Z.
  • Za Ha: str1 - str2 <0, izračunamo delež normalne porazdelitve, ki je manjši od Z.
  • Za Ha: str1 - str2 ≠ 0, izračunamo delež normalne porazdelitve, ki je večji od |Z|, absolutna vrednost Z. Po tem, da upoštevamo dejstvo, da imamo dvotirni test, delež podvojimo.

Pravilo odločitve

Zdaj se odločimo, ali bomo zavrnili ničelno hipotezo (in s tem sprejeli alternativo) ali neupravičeno zavrnili ničelno hipotezo. To odločitev sprejemamo tako, da primerjamo svojo p-vrednost s stopnjo alfa pomembnosti.

  • Če je p-vrednost manjša ali enaka alfi, zavračamo ničelno hipotezo. To pomeni, da imamo statistično pomemben rezultat in da bomo sprejeli alternativno hipotezo.
  • Če je p-vrednost večja od alfa, potem nične hipoteze ne zavrnemo. To ne dokazuje, da je nična hipoteza resnična. Namesto tega pomeni, da nismo dobili dovolj prepričljivih dokazov, ki bi zavrgli nično hipotezo.

Posebna opomba

The interval zaupanja za razliko dveh deležev prebivalstva ne združuje uspehov, medtem ko test hipoteze. Razlog za to je, da naša nična hipoteza to predpostavlja str1 - str2 = 0. Interval zaupanja tega ne predvideva. Nekateri statistiki ne združijo uspeha tega preskusa hipotez in namesto tega uporabljajo rahlo spremenjeno različico zgornjega statističnega testa.

instagram story viewer