Povzetek statistike, kot je mediana, prvi kvartil in tretji kvartil so meritve položaja. To je zato, ker te številke kažejo, kje leži določen delež porazdelitve podatkov. Na primer, mediana je srednji položaj preiskovanih podatkov. Polovica podatkov ima vrednosti manjše od mediane. Podobno ima 25% podatkov vrednosti, ki so manjše od prvega kvartila, 75% podatkov pa vrednosti manjše od tretjega kvartila.
Ta koncept lahko posplošimo. Eden od načinov za to je razmisliti v odstotkih. 90. percentil označuje točko, v kateri ima 90% odstotkov podatkov vrednosti manjše od tega števila. Na splošno velja, da strth percentil je število n za katero str% podatkov je manj kot n.
Nenehne naključne spremenljivke
Čeprav so statistični podatki o vrstnem redu srednjega, prvega in tretjega kvartila običajno uvedeni v nastavitev z diskretnim nizom podatkov, lahko te statistike definiramo tudi za neprekinjeni naključni del spremenljivka. Ker delamo z neprekinjeno distribucijo, uporabljamo integral. The strth percentil je število n tako, da:
∫-₶nf ( x ) dx = str/100.
Tukaj f ( x ) je funkcija gostote verjetnosti. Tako lahko dobimo vsak odstotek, ki ga želimo za a neprekinjeno distribucija.
Kvantali
Nadaljnja posplošitev je ugotovitev, da naša statistika naročil razdeli distribucijo, s katero delamo. Mediana razdeli nabor podatkov na polovico, mediana ali 50.centtilent neprekinjene porazdelitve pa razdeli distribucijo na polovico glede na površino. Prvi kvartil oz. mediana in tretjo četrtinsko razdelitev naših podatkov na štiri dele z enakim štetjem v vsakem. Zgornji integral lahko uporabimo za pridobivanje 25., 50. in 75. odstotka in neprekinjeno porazdelitev razdelimo na štiri dele enake površine.
Ta postopek lahko posplošimo. Vprašanje, s katerim lahko začnemo, je dano naravno število n, kako lahko razdelimo distribucijo spremenljivke na n enako velikosti kosov? To govori neposredno o ideji o kvantalih.
The n kvantele za nabor podatkov najdemo približno tako, da podatke razvrstimo po vrstnem redu in nato razdelimo to uvrstitev n - 1 enako odmaknjeni točki v intervalu.
Če imamo funkcijo gostote verjetnosti za zvezno naključno spremenljivko, uporabimo zgornji integral za iskanje kvantilov. Za n kvanti, želimo:
- Prvi so imeli 1 /n območja razdelitve levo od njega.
- Drugi, ki ima 2 /n območja razdelitve levo od njega.
- The rth imeti r/n območja razdelitve levo od njega.
- Zadnji (n - 1)/n območja razdelitve levo od njega.
To vidimo za katero koli naravno število n, the n kvanti ustrezajo 100r/nthcenttili, kjer r je lahko katero koli naravno število od 1 do n - 1.
Navadni kvanti
Nekatere vrste kvantilov se uporabljajo dovolj pogosto, da imajo določena imena. Spodaj je seznam teh:
- 2 kvantil se imenuje mediana
- 3 kvantele imenujemo tercili
- Štiri kvantele imenujemo kvartili
- 5 kvantilov imenujemo kvintili
- Šest kvantelov imenujemo sextiles
- 7 kvantilov imenujemo septili
- 8 kvantilov imenujemo oktil
- 10 kvantilov imenujemo decilci
- 12 kvantilov imenujemo duodecile
- 20 kvantilov imenujemo vigintili
- 100 kvantilov imenujemo odstotki
- 1000 kvantilov imenujemo permilles
Seveda obstajajo tudi drugi kvanti mimo tistih na zgornjem seznamu. Velikokrat uporabljeni specifični količnik ustreza velikosti vzorca iz neprekinjenega distribucija.
Uporaba kvantilov
Poleg tega, da določimo položaj niza podatkov, so kvanti koristni tudi na druge načine. Recimo, da imamo preprost naključni vzorec iz populacije in porazdelitev populacije ni znana. Da bi lažje ugotovili, ali je model, kot je običajna distribucija ali Weibullova distribucija, primeren za populacijo, iz katere smo vzorčili, si lahko ogledamo kvantele naših podatkov in model.
Če kvante iz naših vzorčnih podatkov primerjamo s kvanti iz določenega porazdelitev verjetnosti, rezultat je zbiranje seznanjenih podatkov. Te podatke narišemo v razpršeni plošči, ki je znana kot kvantno-kvanttilna parcela ali q-q zaplet. Če je dobljeni raztresenec približno linearen, potem je model za naše podatke dobro primeren.