Obstajajo različne opisne statistike. Številke, kot so povprečna vrednost, mediana, način, poševnost, kurtoza, standardni odklon, prvi kvartil in tretji kvartil, če jih naštejemo le nekaj, nam vsak pove nekaj o svojih podatkih. Namesto da bi jih gledali opisna statistika posamično jih včasih kombiniranje pomaga, da dobimo popolno sliko. S tem namenom je petštevilčni povzetek priročen način za združevanje petih opisnih statistik.
Katerih pet številk?
Jasno je, da mora biti v našem povzetku pet številk, a pet? Izbrane številke nam bodo pomagale poznati središče naših podatkov in tudi razporeditev podatkovnih točk. Upoštevajoč to je petštevilčni povzetek sestavljen iz naslednjega:
- Najmanjša - to je najmanjša vrednost v našem naboru podatkov.
- Prvi kvartil - ta številka je označena V1 in 25% naših podatkov pade pod prvi kvartil.
- Mediana - to je vmesna točka podatkov. 50% vseh podatkov pade pod srednjo vrednost.
- Tretji kvartil - ta številka je označena V3 in 75% naših podatkov pade pod tretji kvartil.
- Največ - to je največja vrednost v našem naboru podatkov.
Povprečni in standardni odklon se lahko uporabljata tudi skupaj za prenos središča in širjenja nabora podatkov. Vendar sta obe statistiki dovzetni za odpuščene. Na povprečja, prvi kvartil in tretji kvartil ne vplivajo tako zelo odmevni.
Primer
Glede na naslednji niz podatkov bomo poročali o povzetku petih številk:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
V zbirki podatkov je skupno dvajset točk. Mediana je torej povprečje desete in enajste podatkovne vrednosti ali:
(7 + 8)/2 = 7.5.
Mediana spodnje polovice podatkov je prvi kvartil. Spodnja polovica je:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Tako izračunamoV1= (4 + 6)/2 = 5.
Mediana zgornje polovice prvotnega nabora podatkov je tretji kvartil. Poiskati moramo mediano:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Tako izračunamoV3= (15 + 15)/2 = 15.
Vse zgornje rezultate sestavljamo skupaj in poročamo, da je petštevilčni povzetek za zgornji niz podatkov 1, 5, 7.5, 12, 20.
Grafični prikaz
Pet številčnih povzetkov je mogoče primerjati med seboj. Ugotovili bomo, da imata dva niza s podobnimi sredstvi in standardnimi odkloni lahko zelo različna petštevilčna povzetka. Za enostavno primerjavo dveh petštevilčnih povzetkov na prvi pogled lahko uporabimo a boxplotali graf škatle in mučkov.