Opisno vs. Inferenčna statistika

Področje statistike je razdeljeno na dva glavna oddelka: opisno in inferencijsko. Vsak od teh segmentov je pomemben, saj ponuja različne tehnike za doseganje različnih ciljev. Opisna statistika opisuje, kaj se dogaja v populacija ali nabor podatkov. Inferenčna statistika omogoča znanstvenikom, da odvzamejo ugotovitve iz vzorčne skupine in jih posplošijo na večjo populacijo. Dve vrsti statistik imata nekaj pomembnih razlik.

Opisna statistika

Opisna statistika je vrsta statistike, ki verjetno prihaja do misli večine ljudi, ko slišijo besedo "statistika". V tej veji statistike je cilj opisati. Numerični ukrepi se uporabljajo za označevanje značilnosti niza podatkov. V ta del statistike spadajo številni predmeti, kot so:

  • The povprečnaali meri sredino podatkovnega niza, ki je sestavljen iz srednje, mediane, načina ali srednjega obsega
  • Širjenje nabora podatkov, ki ga je mogoče izmeriti s domet ali standardni odklon
  • Splošni opisi podatkov, kot je povzetek pet številk
  • Meritve, kot so poševnost in kurtoza
  • instagram viewer
  • Raziskovanje odnosov in korelacija med seznanjenimi podatki
  • Predstavitev statističnih rezultatov v letu 2006 grafični oblika

Ti ukrepi so pomembni in koristni, saj omogočajo znanstvenikom, da vidijo vzorce med podatki in tako te podatke smislijo. Opisno statistiko je mogoče uporabiti samo za opis populacije ali nabora podatkov, ki se preučuje: Rezultatov ni mogoče posplošiti na nobeno drugo skupino ali populacijo.

Vrste opisne statistike

Socialni znanstveniki uporabljajo dve vrsti opisnih statistik:

Ukrepi osrednje tendence zajeti splošne trende v podatkih in se izračunajo in izrazijo kot povprečje, mediana in način. Srednja vrednost znanstvenikom pove matematično povprečje vseh podatkovnih nizov, kot je povprečna starost ob prvi zakonski zvezi; mediana predstavlja sredino porazdelitve podatkov, kot starost, ki je sredi obdobja, v katerem se ljudje prvič poročijo; in način je lahko najpogostejša starost, ko se ljudje prvič poročijo.

Ukrepi za širjenje opisujejo, kako se podatki distribuirajo in se nanašajo med seboj, vključno z:

  • Obseg, celoten razpon vrednosti, ki so prisotne v podatkovnem nizu
  • Porazdelitev frekvence, ki določa, kolikokrat se določena vrednost pojavi v naboru podatkov
  • Kvartili, podskupine, oblikovane v zbirki podatkov, ko so vse vrednosti razdeljene na štiri enake dele v celotnem območju
  • Srednje absolutno odstopanje, povprečje, koliko vsaka vrednost odstopa od srednje vrednosti
  • Varianta, ki ponazarja, koliko razlike v podatkih obstaja
  • Standardni odklon, ki ponazarja širjenje podatkov glede na srednjo vrednost

Ukrepi širjenja so pogosto vizualno predstavljeni v tabelah, pitah in črtnih grafikonih ter histogramih, da bi lažje razumeli trende v podatkih.

Inferenčna statistika

Inferenčna statistika je pripravljena s pomočjo zapletenih matematičnih izračunov, ki znanstvenikom omogočajo sklepanje o trendih večje populacije na podlagi študije vzorca, ki je bil odvzet iz nje. Znanstveniki uporabljajo inferential statistiko za preučevanje razmerja med spremenljivkami v vzorcu nato naredite posplošitve ali napovedi o tem, kako se bodo te spremenljivke nanašale na večjega populacija.

Običajno je nemogoče preučiti vsakega člana populacije posebej. Tako znanstveniki izberejo reprezentativno podskupino populacije, imenovano statistični vzorec, in iz te analize lahko povedo nekaj o populaciji, iz katere je vzorec prišel. Obstajata dve glavni razdelki inferencialne statistike:

  • Interval zaupanja poda obseg vrednosti za neznani parameter populacije z merjenjem statističnega vzorca. To je izraženo z intervalom in stopnjo zaupanja, da je parameter znotraj intervala.
  • Preizkusi pomembnosti oz preizkušanje hipotez kjer znanstveniki s pomočjo statističnega vzorca trdijo o prebivalstvu. V zasnovi je v tem procesu nekaj negotovosti. To je mogoče izraziti v smislu pomembnosti.

Vključujejo tehnike, ki jih družboslovci preučujejo povezave med spremenljivkami in s tem ustvarjajo infekcijske statistike linearne regresijske analize, logistične regresijske analize, ANOVA, korelacijske analize, modeliranje strukturnih enačbin analiza preživetja. Pri izvajanju raziskav z uporabo inferencialne statistike znanstveniki opravijo test pomembnosti, da ugotovijo, ali lahko rezultate posplošijo na večjo populacijo. Skupni pomembni preizkusi vključujejo: hi-kvadrat in t-test. Ti znanstvenikom povedo verjetnost, da so rezultati njihove analize vzorca reprezentativni za celotno populacijo.

Opisno vs. Inferenčna statistika

Čeprav je opisna statistika koristna pri učenju stvari, kot sta širjenje in središče podatkov, ničesar v opisni statistiki ni mogoče uporabiti za posplošitev. V opisni statistiki so meritve, kot sta povprečni in standardni odklon, navedene kot točne številke.

Čeprav se pri inferencialni statistiki uporabljajo podobni izračuni - na primer povprečni in standardni odklon -, je poudarek pri inferencialni statistiki drugačen. Inferenčna statistika se začne z vzorcem in nato posploši na populacijo. Ti podatki o populaciji niso navedeni kot številka. Namesto tega znanstveniki te parametre izražajo kot obseg možnih števil, skupaj s stopnjo zaupanja.