V statistika, izraz robustnost ali robustnost se nanaša na moč statističnega modela, preskusov in postopkov v skladu s posebnimi pogoji statistične analize, ki jih želi doseči študija. Glede na to, da so ti pogoji študije izpolnjeni, je mogoče modele preveriti, da so resnični z uporabo matematičnih dokazov.
Številni modeli temeljijo na idealnih situacijah, ki ne obstajajo pri delu s podatki iz resničnega sveta, in kot rezultat, lahko model daje pravilne rezultate, tudi če pogoji niso natančno izpolnjeni.
Trdna statistika je torej vsaka statistika, ki prinaša dobre rezultate, če podatki črpajo iz širokega razpona verjetnostne porazdelitve, na katere v veliki meri ne vplivajo odpuščaji ali majhni odmiki od predpostavk modela v danem nabor podatkov. Z drugimi besedami, zanesljiva statistika je odporna na napake v rezultatih.
Eden od načinov za opazovanje robustnega statističnega postopka je treba gledati dlje kot na t-postopke, ki s pomočjo hipoteznih testov določijo najbolj natančne statistične napovedi.
Upoštevanje T-postopkov
Za primer robustnosti bomo razmislili t-postopki, ki vključujejo interval zaupanja za populacijsko srednjo vrednost z neznanim standardnim odklonom populacije kot tudi hipotezne teste o populaciji.
Uporaba t-postopek predvideva naslednje:
- Nabor podatkov, s katerimi sodelujemo, je preprost naključni vzorec prebivalstva.
- Prebivalstvo, ki smo ga vzorčili, je običajno porazdeljeno.
V praksi s primeri iz resničnega življenja imajo statistiki redko populacijo, ki je običajno razporejena, zato namesto tega postane vprašanje: „Kako robustni so naši t-postopki? "
Na splošno je pogoj, da imamo preprost naključni vzorec, pomembnejši od pogoja, ki smo ga vzorčili iz normalno razporejene populacije; razlog za to je, da izrek o osrednji meji zagotavlja približno vzorčno porazdelitev normalno - večja kot je naša velikost vzorca, bližje je vzorčni porazdelitvi vzorca normalno.
Kako delujejo T-postopki kot robustna statistika
Tako robustnost za t-postopki so odvisni od velikosti vzorca in porazdelitve našega vzorca. Upoštevanje tega vključuje:
- Če je velikost vzorcev velika, kar pomeni, da imamo 40 ali več opazovanj, potem t-postopke je mogoče uporabiti tudi pri naštetih distribucijah.
- Če je velikost vzorca med 15 in 40, potem lahko uporabimo t-postopke za kakršno koli oblikovano porazdelitev, razen če ni podplutb ali visoke stopnje naklonosti.
- Če je velikost vzorca manjša od 15, potem lahko uporabimo t- postopki za podatke, ki nimajo odlitkov, enega samega vrha in so skoraj simetrični.
V večini primerov je bila robustnost ugotovljena s tehničnim delom matematične statistike in na srečo nam ni treba nujno izvesti teh naprednih matematičnih izračunov, da bi pravilno jih izkoristiti; razumeti moramo le, kakšne so splošne smernice za zanesljivost naše posebne statistične metode.
T-postopki delujejo kot robustna statistika, saj ponavadi na teh modelih prinesejo dobro zmogljivost tako, da se velikost vzorca izračuna v osnovo za uporabo postopka.