Ob pogledu na raztresenost si lahko zastavite veliko vprašanj. Eden najpogostejših se sprašuje, kako dobro enaka črta približa podatke. Za lažji odgovor je opisna statistika, imenovana korelacijski koeficient. Videli bomo, kako izračunati to statistiko.
Koeficient korelacije
The korelacijski koeficient, označeno z r, nam pove, kako natančno so podatki v graf raztrosa padejo vzdolž ravne črte. Bližje temu absolutna vrednost od r če je ena, boljše je, da so podatki opisani z linearno enačbo. Če r = 1 oz r = -1 potem je nabor podatkov popolnoma poravnan. Niz podatkov z vrednostmi r blizu ničle kažejo malo na noben neposreden odnos.
Zaradi dolgih izračunov je najbolje izračunati r z uporabo kalkulatorja ali statistične programske opreme. Vendar se je vedno vredno potruditi, da veste, kaj počne vaš kalkulator, ko računa. Sledi postopek za izračun koeficienta korelacije v glavnem ročno, s kalkulatorjem, ki se uporablja za rutinske aritmetične korake.
Koraki za izračun r
Začeli bomo z naštevanjem korakov za izračun koeficienta korelacije. Podatki, s katerimi sodelujemo, so
seznanjeni podatki, od katerih bo vsak par označen z (xjaz, yjaz).- Začnemo z nekaj predhodnimi izračuni. Količine iz teh izračunov bomo uporabili v naslednjih korakih našega izračuna r:
- Izračunaj x̄, pomeni vseh prvih koordinat podatkov xjaz.
- Izračunajte ȳ, srednjo vrednost vseh drugih koordinat podatkov
- yjaz.
- Izračunaj s x vzorec standardni odklon vseh prvih koordinat podatkov xjaz.
- Izračunaj s y vzorčni standardni odklon vseh drugih koordinat podatkov yjaz.
- Uporabite formulo (zx)jaz = (xjaz - x̄) / s x in izračunajte standardizirano vrednost za vsakega xjaz.
- Uporabite formulo (zy)jaz = (yjaz – ȳ) / s y in izračunajte standardizirano vrednost za vsakega yjaz.
- Pomnožite ustrezne standardizirane vrednosti: (zx)jaz(zy)jaz
- Dodajte izdelke iz zadnjega koraka skupaj.
- Vsoto prejšnjega koraka delite s n - 1, kje n je skupno število točk v našem naboru seznanjenih podatkov. Rezultat vsega tega je korelacijski koeficient r.
Ta postopek ni težek in vsak korak je dokaj rutinski, vendar je zbiranje vseh teh korakov precej vključeno. Izračun standardnega odklona je sam po sebi dovolj dolgočasen. Toda izračun korelacijskega koeficienta ne vključuje samo dveh standardnih odstopanj, temveč množico drugih operacij.
Primer
Da bi videli točno, kako vrednost r dobimo si oglejmo primer. Ponovno je treba opozoriti, da bi za praktične aplikacije želeli za izračun uporabiti naš kalkulator ali statistično programsko opremo r za nas.
Začnemo s seznamom seznanjenih podatkov: (1, 1), (2, 3), (4, 5), (5,7). Srednja vrednost x vrednosti, srednja vrednost 1, 2, 4 in 5 je x̄ = 3. Imamo tudi to, da je ȳ = 4. Standardni odklon
x vrednosti je sx = 1,83 in sy = 2.58. Spodnja tabela povzema ostale izračune, potrebne za r. Vsota izdelkov v skrajnem desnem stolpcu je 2.969848. Ker so skupaj štiri točke in 4 - 1 = 3, vsoto izdelkov delimo s 3. Tako dobimo korelacijski koeficient r = 2.969848/3 = 0.989949.
Tabela za primer izračuna korelacijskega koeficienta
x | y | zx | zy | zxzy |
---|---|---|---|---|
1 | 1 | -1.09544503 | -1.161894958 | 1.272792057 |
2 | 3 | -0.547722515 | -0.387298319 | 0.212132009 |
4 | 5 | 0.547722515 | 0.387298319 | 0.212132009 |
5 | 7 | 1.09544503 | 1.161894958 | 1.272792057 |