Čebiševa neenakost v verjetnosti

Čebiševa neenakost pravi, da je vsaj 1-1 /K2 Podatki iz vzorca morajo spadati K standardna odstopanja od povprečja (tukaj K je pozitiven resnično število večji od enega).

Vsak niz podatkov, ki se običajno distribuira ali ima obliko a krivulja zvona, ima več funkcij. Eden od njih obravnava širjenje podatkov glede na število standardnih odstopanj od srednje vrednosti. Pri normalni distribuciji vemo, da je 68% podatkov en standardni odklon od povprečja, 95% pa dva standardna odstopanja od povprečne vrednosti in približno 99% je v treh standardnih odstopanjih od srednje.

Če pa nabor podatkov ne bo razporejen v obliki zvonske krivulje, bi lahko bila drugačna količina znotraj enega standardnega odklona. Čebiševa neenakost zagotavlja, kako vedeti, v kateri del podatkov spada K standardni odmiki od povprečja za kaj nabor podatkov

Dejstva o neenakosti

Zgoraj neenakost lahko navedemo tudi tako, da besedno zvezo „podatki iz vzorca“ nadomestimo z porazdelitev verjetnosti. Razlog za to je, da je Čebiševa neenakost posledica verjetnosti, ki jo lahko nato uporabimo za statistiko.

instagram viewer

Pomembno je omeniti, da je ta neenakost rezultat, ki je bil dokazan matematično. Ni podobno empirični odnos med povprečjem in načinom ali pravilo palca ki povezuje obseg in standardni odklon.

Ponašanje neenakosti

Za ponazoritev neenakosti si bomo ogledali nekaj vrednosti K:

  • Za K = 2 imamo 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Torej neenakost Čebiševa pravi, da mora biti vsaj 75% podatkovnih vrednosti katere koli distribucije znotraj dveh standardnih odstopanj od povprečne vrednosti.
  • Za K = 3 imamo 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Torej, neenakost Čebiševa pravi, da mora biti vsaj 89% podatkovnih vrednosti katere koli distribucije znotraj treh standardnih odstopanj od povprečne vrednosti.
  • Za K = 4 imamo 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Torej, neenakost Čebiševa pravi, da mora biti najmanj 93,75% podatkovnih vrednosti katere koli distribucije znotraj dveh standardnih odstopanj od povprečne vrednosti.

Primer

Recimo, da smo vzorčili uteži psov v lokalnem zavetišču za živali in ugotovili, da ima naš vzorec povprečno 20 kilogramov s standardnim odstopanjem 3 kilograme. S pomočjo Čebiševe neenakosti vemo, da ima vsaj 75% psov, ki smo jih vzorčili, uteži, ki sta dva standardna odstopanja od povprečne vrednosti. Dvakratni standardni odmik nam daje 2 x 3 = 6. Odštejte jih in dodajte od povprečja 20. To nam pove, da ima 75% psov težo od 14 do 26 kilogramov.

Uporaba neenakosti

Če vemo več o distribuciji, s katero delamo, potem lahko običajno zagotovimo, da je več podatkov določeno število standardnih odstopanj od povprečja. Na primer, če vemo, da imamo normalno porazdelitev, potem je 95% podatkov dva standardna odstopanja od povprečja. Čebiševa neenakost pravi, da v tem primeru to vemo vsaj 75% podatkov predstavlja dva standardna odstopanja od povprečne vrednosti. Kot lahko vidimo v tem primeru, bi lahko bilo veliko več kot teh 75%.

Vrednost neenakosti je v tem, da nam daje "slabši primer" scenarij, v katerem o naših vzorčnih podatkih (ali porazdelitvi verjetnosti) vemo le povprečje in standardni odklon. Kadar o naših podatkih ne vemo nič drugega, Čebiševa neenakost ponuja dodaten vpogled v to, kako razširjen je nabor podatkov.

Zgodovina neenakosti

Neenakost je poimenovana po ruskem matematiku Pafnutyju Čebiševu, ki je neenakost prvič izkazal leta 1874. Deset let pozneje je neenakost Markov dokazal v svojem doktoratu. disertacija. Zaradi razlik v tem, kako v angleščini predstavljati rusko abecedo, je Chebyshev napisan tudi kot Tchebysheff.