V študiji o statistika pomembno je povezati različne teme. Videli bomo primer tega, v katerem je naklon regresijske črte neposredno povezan z korelacijski koeficient. Ker oba pojma vključujeta ravne črte, je povsem naravno, da postavite vprašanje: "Kako sta koeficient korelacije in najmanj kvadratna črta sorodni? "
Najprej si bomo ogledali nekaj ozadja v zvezi z obema temama.
Podrobnosti o korelaciji
Pomembno si je zapomniti podrobnosti, ki se nanašajo na koeficient korelacije, ki ga označujemo s r. Ta statistika se uporablja, ko smo seznanili kvantitativni podatki. Iz raztresenega plina seznanjeni podatki, lahko iščemo trende v celotni distribuciji podatkov. Nekateri seznanjeni podatki so linearni ali ravni. Toda v praksi podatki nikoli ne sodijo točno po ravni črti.
Več ljudi gleda enako graf raztrosa Seznanjeni podatki se ne bi strinjali glede tega, kako blizu je prikazovanju splošnega linearnega trenda. Konec koncev so naša merila za to morda nekoliko subjektivna. Lestvica, ki jo uporabljamo, lahko vpliva tudi na naše dojemanje podatkov. Zaradi teh in več razlogov potrebujemo nekakšen objektiven ukrep, da povemo, kako blizu je, da so naši seznanjeni podatki linearni. Koeficient korelacije to dosega pri nas.
Nekaj osnovnih dejstev o r vključujejo:
- Vrednost r se giblje med katerim koli dejanskim številom od -1 do 1.
- Vrednosti r blizu 0 pomeni, da je linearni odnos med podatki malo ali nič.
- Vrednosti r blizu 1 pomeni, da obstaja pozitiven linearni odnos med podatki. To pomeni, da kot x to povečuje y tudi narašča.
- Vrednosti r blizu -1 pomeni, da obstaja negativen linearni odnos med podatki. To pomeni, da kot x to povečuje y zmanjšuje.
Naklon črte najmanj kvadratov
Zadnja dva elementa na zgornjem seznamu nas usmerita proti pobočju črte z najmanj kvadratki, ki se najbolje prilega. Spomnimo se, da je naklon črte meritev, koliko enot gre gor ali dol za vsako enoto, ki jo premaknemo v desno. Včasih je to navedeno kot dvig proge, deljen s potekom, ali sprememba v y vrednosti, deljene s spremembo v x vrednote.
Na splošno imajo ravne črte naklona, ki so pozitivna, negativna ali nič. Če bi preučili naše regresijske črte z najmanjšim kvadratom in primerjali ustrezne vrednosti r, bi opazili, da vsakič, ko imajo naši podatki negativni korelacijski koeficient, naklon regresijske črte je negativen. Podobno je naklon regresijske črte vsakič, ko imamo koeficient pozitivne korelacije.
Iz tega opažanja bi moralo biti razvidno, da vsekakor obstaja povezava med znakom koeficienta korelacije in naklonom premice najmanjših kvadratov. Ostaja še razložiti, zakaj je to res.
Formula za naklon
Razlog za povezavo med vrednostjo r naklon črte najmanjših kvadratov pa je povezan s formulo, ki nam daje naklon te premice. Za seznanjene podatke (x, y) označujemo standardni odklon od x podatki by sx in standardni odklon y podatki by sy.
Formula naklona a regresijske črte je:
- a = r (sy/ sx)
Izračun standardnega odklona vključuje vzemanje pozitivnega kvadratnega korena negativnega števila. Posledično morata biti oba standardna odstopanja v formuli za naklon negativna. Če domnevamo, da je v naših podatkih nekaj sprememb, bomo lahko spregledali možnost, da je kateri koli od teh standardnih odstopanj enak nič. Zato bo znak koeficienta korelacije enak znaku naklona regresijske črte.