V statistika, obstaja veliko izrazov, ki med seboj zelo razlikujejo. En primer tega je razlika med frekvenca in relativna frekvenca. Čeprav obstaja veliko uporab za relativno frekvenco, obstaja zlasti ta, ki vključuje histogram z relativno frekvenco. To je vrsta grafa, ki ima povezave z drugimi temami iz statistike in matematične statistike.
Opredelitev
Histogrami so statistični grafi, ki izgledajo črtni grafi. Običajno pa je izraz histogram rezerviran za količinsko spremenljivk. Vodoravna os histograma je številčna vrstica, ki vsebuje razredov ali posodice enake dolžine. Te smetnice so intervali številčne vrstice, v katerih lahko padejo podatki, in so lahko sestavljeni iz ene same številke (običajno za diskretna nizov podatkov, ki so sorazmerno majhni) ali obseg vrednosti (za večje diskretne nabore podatkov in neprekinjeno podatkov).
Na primer, morda nas zanima razdelitev točk na kviz s 50 točkami za razred učencev. Eden od možnih načinov za gradnjo košev je drugačen koš za vsakih 10 točk.
Navpična os histograma predstavlja število ali frekvenco, do katere pride do podatkovne vrednosti v vsakem od smetnjakov. Višja kot je vrstica, več podatkovnih vrednosti spada v ta razpon vrednosti zabojnikov. Če se vrnemo k svojemu primeru, če imamo pet učencev, ki so na kvizu zbrali več kot 40 točk, bo stolpec, ki ustreza 40 do 50 zabojev, visok pet enot.
Primerjava frekvenčnega histograma
Histogram z relativno frekvenco je manjša sprememba tipičnega frekvenčnega histograma. Namesto da uporabimo navpično os za štetje podatkovnih vrednosti, ki sodijo v dani koš, uporabimo to os za prikaz celotnega deleža podatkovnih vrednosti, ki sodijo v ta koš. Ker je 100% = 1, morajo biti vse palice višine od 0 do 1. Poleg tega morajo biti višine vseh palic v našem relativno frekvenčnem histogramu enake 1.
V primernem primeru, ki smo ga gledali, predpostavimo, da je v našem razredu 25 učencev, pet pa jih je zbralo več kot 40 točk. Namesto da bi konstruirali palico višine pet za ta koš, bi imeli palico višine 5/25 = 0,2.
Če primerjamo histogram z histogramom z relativno frekvenco, vsak z enakimi posodami, bomo nekaj opazili. Celotna oblika histogramov bo enaka. Histogram z relativno frekvenco ne poudarja skupnega števila v vsakem košu. Namesto tega se ta vrsta grafa osredotoča na to, kako se število podatkov v košu nanaša na druge smetnjake. To razmerje prikazuje v odstotkih od celotnega števila podatkov.
Verjetnostne funkcije
Lahko se vprašamo, kaj je smisel pri določanju histograma relativne frekvence. Ena ključnih aplikacij se nanaša na diskretne naključne spremenljivke, kjer so naše smetnje širine ena in so osredotočene na vsako negativno celo število. V tem primeru lahko določimo delno funkcijo z vrednostmi, ki ustrezajo navpičnim višinam palic v našem relativnem frekvenčnem histogramu.
To vrsto funkcije imenujemo funkcija verjetnostne mase. Razlog za konstrukcijo funkcije na ta način je v tem, da ima krivulja, ki jo definira funkcija, neposredno povezavo z verjetnost. Območje pod krivuljo od vrednosti a do b je verjetnost, da ima naključna spremenljivka vrednost iz a do b.
Povezava med verjetnostjo in površino pod krivuljo je tista, ki se večkrat pokaže v matematični statistiki. Uporaba funkcije verjetnostne mase za modeliranje histograma relativne frekvence je še ena taka povezava.