Bližnjica formule vsote kvadratov

Izračun a vzorec variance oz standardni odklon je navadno naveden kot del. Števec tega ulomka vključuje vsoto odstopanj od kvadrata od srednje. V statistiki, je formula za to skupno vsoto kvadratov

Σ (xjaz - x̄)2

Tu se simbol x̄ nanaša na vzorčno srednjo vrednost, simbol Σ pa nam pove, da seštejemo razlike v kvadratu (xjaz - x̄) za vse jaz.

Čeprav ta formula deluje za izračune, obstaja enakovredna formula bližnjice, ki ne zahteva, da najprej izračunamo vzorec srednja vrednost. Ta bližnjica formula za vsoto kvadratov je

Σ (xjaz2) - (Σ xjaz)2/n

Tu je spremenljivka n se nanaša na število podatkovnih točk v našem vzorcu.

Primer standardne formule

Če si želite ogledati, kako deluje ta formula bližnjice, bomo razmislili o primeru, ki je izračunan po obeh formulah. Recimo, da je naš vzorec 2, 4, 6, 8. Povprečna vrednost vzorca je (2 + 4 + 6 + 8) / 4 = 20/4 = 5. Zdaj izračunamo razliko vsake podatkovne točke s srednjo vrednostjo 5.

  • 2 – 5 = -3
  • 4 – 5 = -1
  • 6 – 5 = 1
  • 8 – 5 = 3

Zdaj vsake od teh številk kvadratimo in jih seštejemo. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.

instagram viewer

Primer formule bližnjice

Zdaj bomo uporabili isti niz podatkov: 2, 4, 6, 8, s formulo bližnjice za določitev vsote kvadratov. Vsako podatkovno točko najprej kvadratimo in jih seštejemo: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.

Naslednji korak je sestavljanje vseh podatkov in ta znesek kvadratni: (2 + 4 + 6 + 8)2 = 400. To delimo s številom podatkovnih točk, da dobimo 400/4 = 100.

Zdaj odštejemo to številko od 120. Tako dobimo, da je vsota odstopanj kvadrata 20. Točno to je bilo število, ki smo ga že našli iz druge formule.

Kako to deluje?

Mnogi bodo samo sprejeli formulo po nominalni vrednosti in nimajo pojma, zakaj ta formula deluje. Če uporabimo malo algebre, lahko vidimo, zakaj je ta formula bližnjice enakovredna standardnemu, tradicionalnemu načinu izračuna vsote kvadratnih odstopanj.

Čeprav je v množici podatkov v resničnem svetu lahko na stotine, če ne na tisoče vrednosti, bomo domnevali, da obstajajo le tri podatkovne vrednosti: x1, x2, x3. Kar vidimo tukaj, bi se lahko razširilo na nabor podatkov, ki ima na tisoče točk.

Začnemo z opažanjem, da (x1 + x2 + x3) = 3 x̄. Izraz Σ (xjaz - x̄)2 = (x1 - x̄)2 + (x2 - x̄)2 + (x3 - x̄)2.

Zdaj uporabljamo dejstvo iz osnovne algebre, ki (a + b)2 = a2 + 2ab + b2. To pomeni, da (x1 - x̄)2 = x12 -2x1 x̄ + x̄2. To storimo za ostala dva izraza našega povzetka in imamo:

x12 -2x1 x̄ + x̄2 + x22 -2x2 x̄ + x̄2 + x32 -2x3 x̄ + x̄2.

To preuredimo in imamo:

x12+ x22 + x32+ 3x̄2 - 2x̄ (x1 + x2 + x3) .

S ponovnim pisanjem (x1 + x2 + x3) = 3x̄ zgornje postane:

x12+ x22 + x32 - 3x̄2.

Zdaj od 3x̄2 = (x1+ x2 + x3)2/ 3, naša formula postane:

x12+ x22 + x32 - (x1+ x2 + x3)2/3

In to je poseben primer splošne formule, ki je bila omenjena zgoraj:

Σ (xjaz2) - (Σ xjaz)2/n

Je res bližnjica?

Morda se ne zdi, da je ta formula res bližnjica. Konec koncev se v zgornjem primeru zdi, da obstaja ravno toliko izračunov. Del tega je povezan s tem, da smo gledali le velikost vzorca, ki je bila majhna.

Ko povečujemo velikost svojega vzorca, vidimo, da formula bližnjice zmanjša število izračunov za približno polovico. Ni treba, da od vsake podatkovne točke odštejemo povprečje in rezultat kvadratimo. To znatno zmanjša skupno število operacij.

instagram story viewer