Kaj je vzorčna distribucija?

Statistično vzorčenje se v statistiki uporablja precej pogosto. V tem procesu želimo določiti nekaj o populaciji. Ker so populacije običajno velike, oblikujemo statistični vzorec tako, da izberemo podmnožico populacije, ki je vnaprej določene velikosti. S preučevanjem vzorca lahko uporabimo statistične podatke o vplivu prebivalstva.

Statistični vzorec velikosti n vključuje eno skupino n posamezniki ali subjekti, ki so bili naključno izbrani iz populacije. Tesno povezana s pojmom statističnega vzorca je porazdelitev vzorčenja.

Izvor distribucijskih vzorcev

Vzorčna porazdelitev se pojavi, ko oblikujemo več kot eno preprost naključni vzorec enake velikosti iz določene populacije. Šteje se, da so ti vzorci neodvisni drug od drugega. Če je torej posameznik v enem vzorcu, ima enaka verjetnost, da bo v naslednjem vzorcu.

Za vsak vzorec izračunamo določeno statistiko. To bi lahko bil vzorec pomeni, varianta vzorca ali delež vzorca. Ker je statistika odvisna od vzorca, ki ga imamo, bo za vsak vzorec značilna različna vrednost za statistiko, ki nas zanima. Obseg proizvedenih vrednosti je tisto, kar nam omogoča distribucijo vzorčenja.

instagram viewer

Porazdelitev vzorčenja za sredstva

Za primer bomo razmislili o porazdelitvi vzorčenja za srednjo vrednost. Srednja vrednost populacije je parameter, ki običajno ni znan. Če izberemo vzorec velikosti 100, potem srednjo vrednost tega vzorca enostavno izračunamo tako, da seštejemo vse vrednosti skupaj in nato delimo s skupnim številom podatkovnih točk, v tem primeru 100. En vzorec velikosti 100 nam lahko daje 50. Drugi tak vzorec ima lahko 49. Drugi 51 in še en vzorec bi lahko imel povprečno 50,5.

Razdelitev teh vzorčnih sredstev nam daje vzorčno porazdelitev. Želeli bi razmisliti o več kot štirih vzorčnih sredstvih, kot smo storili zgoraj. Z več vzorčnimi sredstvi bi imeli dobro predstavo o obliki porazdelitve vzorčenja.

Zakaj nas skrbi?

Vzorčne porazdelitve se lahko zdijo precej abstraktne in teoretične. Vendar pa obstaja nekaj zelo pomembnih posledic njihove uporabe. Ena glavnih prednosti je, da odpravljamo spremenljivost, ki je prisotna v statistiki.

Recimo, da začnemo s populacijo s srednjo vrednostjo μ in standardnim odklonom σ. Standardni odklon nam omogoča meritev, kako razširjena je porazdelitev. To bomo primerjali s porazdelitvijo vzorčenja, dobljeno s preprostimi naključnimi vzorci velikosti n. Vzorčna porazdelitev srednje vrednosti bo še vedno imela vrednost μ, toda standardni odklon je drugačen. Standardni odklon za porazdelitev vzorčenja postane σ / √ n.

Tako imamo naslednje

  • Velikost vzorca 4 nam omogoča razporeditev vzorčenja s standardnim odklonom σ / 2.
  • Velikost vzorca 9 nam omogoča razporeditev vzorčenja s standardnim odklonom σ / 3.
  • Velikost vzorca 25 nam omogoča razporeditev vzorčenja s standardnim odklonom σ / 5.
  • Velikost vzorca 100 nam omogoča razporeditev vzorčenja s standardnim odklonom σ / 10.

V praksi

V praksi statistike redko oblikujemo vzorčne razdelitve. Namesto tega obravnavamo statistiko, pridobljeno iz preprostega naključnega vzorca velikosti n kot da so ena točka vzdolž ustrezne porazdelitve vzorčenja. To ponovno poudarja, zakaj želimo imeti relativno velike vzorčne velikosti. Večja kot je velikost vzorca, manj je variacij, ki jih bomo dobili v svoji statistiki.

Upoštevajte, da razen središča in širine ne moremo reči ničesar o obliki naše porazdelitve vzorčenja. Izkazalo se je, da je pod nekaterimi dokaj širokimi pogoji Teorem o osrednji meji lahko uporabimo, da nam povemo nekaj zelo neverjetnega o obliki porazdelitve vzorčenja.