Kaj je srhljivost v statistiki?

Nekatere distribucije podatkov, kot je krivulja zvona ali normalna porazdelitev, so simetrične. To pomeni, da sta desna in leva stran distribucije popolne zrcalne slike drug drugega. Ni vsaka distribucija podatkov simetrična. Nabori podatkov, ki niso simetrični, naj bi bili asimetrični. Ukrep, kako lahko je asimetrična porazdelitev, imenujemo nagnjenost.

Povprečna, mediana in način so vsi ukrepi centra nabora podatkov. Poševnost podatkov je mogoče določiti s tem, kako so te količine povezane med seboj.

Zamaknjeno v desno

Podatki, ki so nagnjeni na desno, imajo dolg rep, ki sega v desno. Nadomestni način pogovora o naboru podatkov, ki je nagnjen v desno, je reči, da je pozitivno nagnjen. V tej situaciji je srednja vrednost mediana sta oba večja od načina. Na splošno velja, da bo večina podatkov, ki so nagnjena v desno, povprečna vrednost večja od mediane. Če povzamemo, za nabor podatkov, ki so nagnjeni na desno:

  • Vedno: povprečje večje od načina
  • Vedno: mediana večja od načina
  • Večino časa: povprečje večje od mediane
instagram viewer

Previdno levo

Situacija se obrne, ko imamo opravka s podatki, ki so nagnjeni na levi strani. Podatki, ki so nagnjeni na levo, imajo dolg rep, ki sega na levo. Nadomestni način pogovora o naboru podatkov, ki je nagnjen na levi strani, je reči, da je negativno nagnjen. V tej situaciji sta povprečna in povprečna vrednost manj kot način. Na splošno velja, da bo večina podatkov, ki so nagnjena na levo, povprečna vrednost manjša od mediane. Če povzamemo, za nabor podatkov, ki so nagnjeni na levi:

  • Vedno: pomeni manj kot način
  • Vedno: mediana manjša od načina
  • Večino časa: manj kot povprečno

Ukrepi srčnosti

Ena stvar je pogledati dva niza podatkov in ugotoviti, da je eden simetričen, drugi pa nesimetričen. Drugi je, da pogledamo dva niza asimetričnih podatkov in rečemo, da je eden bolj nagnjen kot drugi. Lahko ugotovimo, kaj je bolj poševno, če preprosto pogledamo graf distribucije. Zato obstajajo načini za numerično izračunavanje mere naklona.

Eno merilo poševnosti, imenovano Pearsonov prvi koeficient naklonosti, je odštevanje srednje vrednosti od načina in nato to razliko razdeliti na standardni odklon podatkov. Razlog za delitev razlike je v tem, da imamo brezdimenzijsko količino. To pojasnjuje, zakaj imajo podatki, ki so nagnjeni v desno, pozitivno naklonjenost. Če je nabor podatkov nagnjen na desno, je srednja vrednost večja od načina in tako odštevanje načina od povprečja daje pozitivno število. Podoben argument pojasnjuje, zakaj ima podatek na levi strani negativno poševnost.

Pearsonov drugi koeficient naklona se uporablja tudi za merjenje asimetrije nabora podatkov. Za to količino odštejemo način od mediane, pomnožimo to število s tremi in nato delimo s standardnim odklonom.

Uporaba skritih podatkov

Podatki iz različnih podatkov se pojavljajo povsem naravno. Dohodki so nagnjeni v desno, saj tudi le nekaj posameznikov, ki zaslužijo milijone dolarjev, lahko močno vpliva na srednjo vrednost in ni negativnih dohodkov. Podobno so v desno nagnjeni podatki, ki vključujejo življenjsko dobo izdelka, kot je blagovna znamka žarnice. Tu je najmanjša življenjska doba enaka nič, dolgotrajne žarnice pa bodo podale pozitivno naklonjenost podatkom.

instagram story viewer