Paleta statističnih podatkovnih nizov

V statistiki in matematiki je razpon razlika med največjo in najmanjšo vrednostjo podatkovnega niza in služi kot ena od dveh pomembnih lastnosti nabora podatkov. Formula za obseg je največja vrednost, zmanjšana za najnižjo vrednost v naboru podatkov, kar omogoča statistikom boljše razumevanje, kako raznolik je nabor podatkov.

Dve pomembni značilnosti niza podatkov vključujeta središče podatkov in širjenje podatkov, središče pa je lahkomerjeno na več načinov: med temi najbolj priljubljeni so zlobneži, mediana, način in srednji vrstni red, vendar na podoben način obstajajo različni načini za izračun, kako razporejen je nabor podatkov, in najpreprostejša in najbolj groba mera širjenja se imenuje obseg.

Izračun razpona je zelo preprost. Vse, kar moramo storiti, je najti razliko med največjo vrednostjo podatkov v našem nizu in najmanjšo vrednostjo podatkov. Kratko rečeno imamo naslednjo formulo: obseg = največja vrednost – minimalna vrednost. Na primer, podatkovni niz 4,6,10, 15, 18 ima največ 18, najmanj 4 in obseg 18-4 = 14.

instagram viewer

Obseg je zelo surovo merjenje širjenja podatkov, ker je izredno občutljiv na odpuščene osebe, zato so določeni omejitve uporabnosti resničnega obsega nabora podatkov za statistike, ker lahko ena sama vrednost podatkov močno vpliva na vrednost domet.

Na primer, upoštevajte nabor podatkov 1, 2, 3, 4, 6, 7, 7, 8. Najvišja vrednost je 8, najmanjša 1, razpon pa 7. Nato upoštevajte isti niz podatkov, le z vključeno vrednostjo 100. Zdaj razpon postane 100-1 = 99 pri čemer je dodajanje ene same dodatne podatkovne točke močno vplivalo na vrednost obsega. Standardni odklon je še eno merilo širjenja, ki je manj dovzetno za odstranjevalce, vendar je pomanjkljivost ta, da izračun standardnega odklona je veliko bolj zapleteno.

Paleta nam tudi ne pove ničesar o notranjih lastnostih našega nabora podatkov. Na primer, upoštevamo niz podatkov 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10, kjer je obseg za ta nabor podatkov 10-1 = 9. Če to primerjamo s podatkovnim nizom 1, 1, 1, 2, 9, 9, 9, 10. Tu je območje še vedno devet, vendar je za ta drugi niz za razliko od prvega niza, podatki pa so razporejeni okoli najmanjšega in največjega. Za odkrivanje nekaterih te notranje strukture bi bilo treba uporabiti druge statistike, kot sta prvi in ​​tretji kvartil.

Obseg je dober način, da dobite zelo osnovno razumevanje, kako dejansko so razporejene številke v naboru podatkov, ker je to enostavno izračunajte, ker zahteva le osnovno aritmetično operacijo, vendar je tudi nekaj drugih aplikacij obsega nabora podatkov v statistika.

Obseg lahko uporabite tudi za oceno še ene mere merjenja, standardnega odklona. Namesto da bi šli po dokaj zapleteni formuli za iskanje standardnega odklona, ​​lahko namesto tega uporabimo tisto, kar imenujemo pravilo dometa. Razpon je pri tem izračunu bistven.

Obseg se pojavlja tudi v a boxplotali načrt ali škatle in muhe. Najvišja in najnižja vrednost sta na koncu ščurkov grafa zajeta in skupna dolžina mučkov in polja je enaka razponu.

instagram story viewer