Koliko kalorij je vsak od nas pojedel za zajtrk? Kako daleč od doma so danes potovali vsi? Kako velik je kraj, ki mu rečemo dom? Koliko drugih imenuje dom? Za razumevanje vseh teh informacij so potrebna določena orodja in načini razmišljanja. Matematična znanost, imenovana statistika, je tisto, kar nam pomaga pri obvladovanju te prenasičenosti informacij.
Statistika je preučevanje numeričnih informacij, ki se imenujejo podatki. Statističniki pridobivajo, organizirajo in analizirajo podatke. Vsak del tega procesa je tudi pregledan. Tehnike statistike se uporabljajo na številnih drugih področjih znanja. Spodaj je uvod v nekatere glavne teme v statistiki.
Prebivalstvo in vzorci
Ena izmed ponavljajočih se tem statistik je, da lahko na podlagi preučitve relativno majhnega dela te skupine povemo nekaj o veliki skupini. Skupina kot celota je znana kot populacija. Del skupine, ki jo preučujemo, je vzorec.
Kot primer tega, predpostavimo, da smo želeli vedeti povprečno višino ljudi, ki živijo v Združenih državah Amerike. Lahko bi poskušali izmeriti več kot 300 milijonov ljudi, vendar bi bilo to neizvedljivo. To bi bilo logistična nočna mora, ki bi meritve izvajala tako, da nihče ni zgrešen in nihče ni preštet dvakrat.
Zaradi nemogoče narave merjenja vseh v ZDA bi lahko namesto tega uporabili statistiko. Namesto da bi našli višino vseh v populaciji, vzamemo a statistični vzorec od nekaj tisoč. Če smo pravilno vzorčili populacijo, bo povprečna višina vzorca zelo blizu povprečne višine populacije.
Pridobivanje podatkov
Za dobre sklepe potrebujemo dobre podatke, s katerimi bomo sodelovali. Vedno je treba natančno pregledati način vzorčenja populacije za pridobitev teh podatkov. Kateri vzorec uporabljamo, je odvisno od vprašanja, ki ga postavljamo o prebivalstvu. Najpogosteje uporabljeni vzorci so:
- Enostavno naključno
- Stratificiran
- Grozd
Prav tako je pomembno vedeti, kako poteka meritev vzorca. Če se vrnemo na zgornji primer, kako pridobimo višino tistih v našem vzorcu?
- Ali pustimo ljudem, da v vprašalniku poročajo o svoji višini?
- Ali več raziskovalcev po vsej državi meri različne ljudi in poroča o njihovih rezultatih?
- Ali en raziskovalec meri z vsemi v vzorcu vse z enakim merilcem?
Vsak od teh načinov pridobivanja podatkov ima svoje prednosti in slabosti. Vsakdo, ki uporablja podatke te študije, bi rad vedel, kako so bili pridobljeni.
Urejanje podatkov
Včasih je množica podatkov in v vseh podrobnostih se lahko dobesedno izgubimo. Gozd je za drevesa težko videti. Zato je pomembno, da imamo svoje podatke dobro organizirane. Skrbna organizacija in grafični prikazi podatkov nam pomagajo ugotoviti vzorce in trende, preden dejansko opravimo izračune.
Način, kako grafično predstavimo svoje podatke, je odvisen od različnih dejavnikov. Pogosti grafi so:
- Pite karte ali krožni grafi
- Vrstni ali pareto graf
- Scatterplots
- Časovni zapleti
- Ploščice na steblih in listih
- Grafike škatle in viskija
Poleg teh dobro znanih grafov obstajajo še drugi, ki se uporabljajo v specializiranih situacijah.
Opisna statistika
Eden od načinov za analizo podatkov se imenuje opisna statistika. Tu je cilj izračunati količine, ki opisujejo naše podatke. Številke imenovane srednje, mediana in način se uporabljajo za označevanje povprečna ali središče podatkov. Obseg in standardni odklon se uporabljata za določitev, kako razširjeni so podatki. Zapletenejše tehnike, kot so korelacija in regresija opisujeta podatke, ki so seznanjeni.
Inferenčna statistika
Ko začnemo z vzorcem in nato poskušamo sklepati o populaciji, uporabljamo infekcijske statistike. V sodelovanju s tem področjem statistike je bila tema preizkušanje hipotez nastane. Tu vidimo znanstveno naravo predmeta statistike, ko navajamo hipotezo, nato pa uporabimo statistična orodja z našim vzorcem za določitev verjetnosti, da moramo zavrniti hipotezo oz ne. Ta razlaga res samo opraska površino tega zelo koristnega dela statistike.
Uporaba statistike
Brez pretiravanja lahko rečemo, da statistična orodja uporabljajo skoraj vsa področja znanstvenega raziskovanja. Tu je nekaj področij, ki se močno opirajo na statistiko:
- Psihologija
- Ekonomija
- Medicina
- Oglaševanje
- Demografija
Temelji statistike
Čeprav nekateri mislijo na statistiko kot na vejo matematike, je bolje razmišljati o njej kot o disciplini, ki temelji na matematiki. Natančneje, statistika je zgrajena s področja matematike, znanega kot verjetnost. Verjetnost nam daje način, kako ugotoviti, kako verjetno se bo zgodil neki dogodek. To nam daje tudi način, da govorimo o naključnosti. To je ključno za statistiko, saj je treba tipični vzorec naključno izbrati iz populacije.
Verjetnost so prvič raziskali v 1700. letih matematiki, kot so Pascal in Fermat. 1700s so tudi začele statistiko. Statistika je še naprej rasla iz svojih verjetnostnih korenin in se je v 1800-ih res začela. Danes se teoretični obseg še naprej širi v tem, kar imenujemo matematična statistika.