Preizkus za naključno zaporedje

Glede na a zaporedje podatkov, se lahko vprašamo, ali je zaporedje prišlo do naključnih pojavov ali če podatki niso naključni. Naključnost je težko prepoznati, saj je zelo težko preprosto pogledati podatke in ugotoviti, ali so bili ustvarjeni po naključju ali ne. Ena metoda, s pomočjo katere lahko ugotovimo, ali je zaporedje resnično nastalo po naključju, se imenuje test teka.

Test teka je preizkus pomembnosti oz preizkus hipotez. Postopek tega preskusa temelji na zagonu ali zaporedju podatkov, ki imajo določeno lastnost. Da bi razumeli, kako deluje preizkus teka, moramo najprej preučiti koncept teka.

Zaporedja podatkov

Začeli bomo s primerom voženj. Upoštevajte naslednje zaporedje naključnih številk:

6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5

Eden od načinov za razvrščanje teh števk je razdelitev na dve kategoriji, bodisi četrte (vključno s števkami 0, 2, 4, 6 in 8) ali neparne (vključno s števkami 1, 3, 5, 7 in 9). Ogledali si bomo zaporedje naključnih števk in parne številke označili kot E, liho število pa kot O:

instagram viewer

E E O E E O O E E E E E E E E E O O

Proge je lažje razbrati, če to ponovno napišemo, da so vsi Os skupaj in vsi Es skupaj:

EE O EE OO E O EEEEE O EE OO

Preštejemo število blokov parnih ali neparnih številk in vidimo, da obstaja skupno deset voženj za podatke. Štiri vožnje so dolge ena, pet ima dolžino dve in ena ima dolžino pet

Pogoji

S katerokoli test pomena, pomembno je vedeti, kateri pogoji so potrebni za izvedbo testa. Za preskus tečevanja bomo lahko vsako vrednost podatkov iz vzorca razvrstili v eno od dveh kategorij. Šteli bomo skupno število voženj glede na število števila podatkovnih vrednosti, ki sodijo v vsako kategorijo.

Test bo a dvostranski test. Razlog za to je, da premalo voženj pomeni, da verjetno ni dovolj variacij in števila voženj, ki bi nastali iz naključnega postopka. Rezultat bo preveč zagonov, če se postopek pogosto preklaplja med kategorijami, da bi ga naključno opisali.

Hipoteze in P-vrednosti

Vsak preizkus pomembnosti ima nična in alternativna hipoteza. Za preizkus teče ničelna hipoteza, da je zaporedje naključno zaporedje. Alternativna hipoteza je, da zaporedje vzorčnih podatkov ni naključno.

Statistična programska oprema lahko izračuna p-vrednost kar ustreza določeni statistični analizi. Obstajajo tudi tabele, ki dajo kritične številke ob določenem stopnja pomembnosti za skupno število voženj.

Izvaja testni primer

Naslednji primer si bomo ogledali, kako deluje preizkus teka. Recimo, da študent za nalogo prosi 16-krat kovanec in zabeleži vrstni red glav in repov, ki so se pojavili. Če končamo s tem naborom podatkov:

H T H H H T T H T T H T H T H H

Lahko se vprašamo, ali je študent dejansko naredil domačo nalogo ali je varal in zapisal niz H in T, ki so videti naključno? Test teka nam lahko pomaga. Predpostavke so za preskus teka izpolnjene, saj se podatki lahko razvrstijo v dve skupini, bodisi glava ali rep. Nadaljujemo s štetjem števila voženj. Pregrupiranje vidimo naslednje:

H T HHH TT H TT H T H T HH

Za naše podatke obstaja deset tekov s sedmimi repi je devet glav.

Ničelna hipoteza je, da so podatki naključni. Druga možnost je, da ni naključna. Za stopnjo pomembnosti alfa, ki je enaka 0,05, vidimo s posvetovanjem s pravilno tabelo, da zavračamo ničelno hipotezo, kadar je število voženj manjše od 4 ali večje od 16. Ker je po naših podatkih deset voženj, mi ne zavrne nična hipoteza H0.

Normalno približevanje

Test teka je koristno orodje za določitev, ali je zaporedje verjetno naključno ali ne. Za velik nabor podatkov je včasih mogoče uporabiti običajen približek. Ta običajni približek zahteva, da uporabimo število elementov v vsaki kategoriji in nato izračunamo povprečno in standardno deviacijo ustreznega normalna porazdelitev.