Primeri največje ocene verjetnosti

Recimo, da imamo a naključni vzorec iz populacije, ki vas zanima. Morda bomo imeli teoretični model za način, kako populacija se distribuira. Vendar pa je lahko več prebivalstva parametrov katerih vrednosti ne poznamo. Najvišja ocena verjetnosti je eden od načinov za določitev teh neznanih parametrov.

Osnovna ideja ocene največje verjetnosti je, da določimo vrednosti teh neznanih parametrov. To naredimo tako, da maksimiramo povezano funkcijo gostote skupne verjetnosti oz verjetnostna masa funkcija. To bomo podrobneje videli v nadaljevanju. Nato bomo izračunali nekaj primerov ocene največje verjetnosti.

Koraki za največjo oceno verjetnosti

Zgornjo razpravo lahko povzamemo z naslednjimi koraki:

Začnite z vzorcem neodvisnih naključnih spremenljivk X₁, X₂,... X_n iz skupne porazdelitve, vsaka s funkcijo gostote verjetnosti f (x; θ₁,.. .θ_k). Thete so neznani parametri.
Ker je naš vzorec neodvisen, verjetnost pridobitve določenega vzorca, ki ga opazimo, ugotovimo tako, da množimo naše verjetnosti skupaj. To nam daje verjetnostno funkcijo L (θ
instagram viewer
₁,.. .θ_k) = f (x)₁ ;θ₁,.. .θ_k) f (x₂ ;θ₁,.. .θ_k)... f (x)_n ;θ₁,.. .θ_k) = Π f (x_jaz ;θ₁,.. .θ_k).
Nato uporabimo Izračun najti vrednosti theta, ki maksimizirajo našo verjetnostno funkcijo L.
Natančneje razlikujemo verjetnostno funkcijo L glede na θ, če obstaja en sam parameter. Če obstaja več parametrov, izračunamo delne derivate L glede na vsak od theta parametrov.
Če želite nadaljevati postopek maksimiranja, določite izpeljanko L (ali delne izpeljane) enako nič in rešite za theta.
Nato lahko uporabimo druge tehnike (na primer drugi preizkus derivatov), da preverimo, ali smo našli največ za našo verjetnostno funkcijo.

Primer

Recimo, da imamo paket s semeni, od katerih ima vsako stalno verjetnost str uspešnosti kalitve. Sadimo n od teh in preštejte število tistih, ki kalijo. Predpostavimo, da vsako seme požene neodvisno od ostalih. Kako določimo največjo oceno verjetnosti parametra str?

Začnemo z opažanjem, da je vsako seme modelirano z Bernoullijevo distribucijo z uspehom str. Dovolimo X bodisi 0 ali 1, funkcija verjetnostne mase za posamezno seme pa je f(x; str ) = str^x(1 - str)^{1 - x}.

Naš vzorec je sestavljen iz n drugačen X_jaz, vsak od njih ima Bernoullijevo distribucijo. Semena, ki kalijo, imajo X_jaz = 1 in semena, ki ne uspejo, imajo X_jaz= 0.

Verjetnost funkcijo poda:

L ( str ) = Π str^x_jaz(1 - str)^{1 -}^x_jaz

Vidimo, da je možno prepisati verjetnostno funkcijo z uporabo zakonov eksponentov.

L ( str ) = str^{Σ x}_jaz(1 - str)^{n -}^{Σ x}_jaz

Nato razlikujemo to funkcijo glede na str. Predvidevamo, da so vrednosti za vse X_jazso znani in so zato stalni. Za razlikovanje od verjetnosti funkcijo moramo uporabiti pravilo izdelka skupaj s pravilom moči:

L '( str ) = Σ x_jazstr^{-1 + Σ x}_jaz (1 - str)^{n -}^{Σ x}_jaz- (n - Σ x_jaz ) str^{Σ x}_jaz(1 - str)^{n-1 -}^{Σ x}_jaz

Ponovno napišemo nekatere negativne eksponente in imamo:

L '( str ) = (1/str) Σ x_jazstr^{Σ x}_jaz (1 - str)^{n -}^{Σ x}_jaz- 1/(1 - str) (n - Σ x_jaz ) str^{Σ x}_jaz(1 - str)^{n -}^{Σ x}_jaz

= [(1/str) Σ x_jaz- 1/(1 - str) (n - Σ x_jaz)]_jazstr^{Σ x}_jaz (1 - str)^{n -}^{Σ x}_jaz

Zdaj, da nadaljujemo proces maksimiranja, smo to izpeljanko postavili na nič in jo rešili p:

0 = [(1/str) Σ x_jaz- 1/(1 - str) (n - Σ x_jaz)]_jazstr^{Σ x}_jaz (1 - str)^{n -}^{Σ x}_jaz

Od str in (1- str) so nič, to imamo

0 = (1/str) Σ x_jaz- 1/(1 - str) (n - Σ x_jaz).

Pomnožitev obeh strani enačbe z str(1- str) nam daje:

0 = (1 - str) Σ x_jaz- str (n - Σ x_jaz).

Desno stran razširimo in vidimo:

0 = Σ x_jaz- str Σ x_jaz- strn + pΣ x_jaz = Σ x_jaz- strn.

Tako je Σ x_jaz= strn in (1 / n) Σ x_jaz= p. To pomeni, da je največja ocena verjetnosti za str je povprečna vrednost vzorca. Natančneje gre za vzorčni delež semen, ki so kalile. To je popolnoma v skladu s tem, kar bi nam povedala intuicija. Da bi določili delež semen, ki bodo vzklila, najprej razmislite o vzorcu iz populacije, ki vas zanima.

Spremembe korakov

Na zgornjem seznamu korakov je nekaj sprememb. Na primer, kot smo videli zgoraj, je po navadi vredno porabiti nekaj časa z uporabo neke algebre, da bi poenostavili izražanje verjetnostne funkcije. Razlog za to je, da je diferenciacija lažja za izvedbo.

Druga sprememba zgornjega seznama korakov je upoštevanje naravnih logaritmov. Maksimalna funkcija L se bo pojavila v isti točki kot za naravni logaritem L. Tako je maksimiranje ln L enakovredno maksimiranju funkcije L.

Velikokrat bo zaradi prisotnosti eksponentnih funkcij v L naravni logaritem L močno poenostavil del našega dela.

Primer

Vidimo, kako uporabiti naravni logaritem z revidiranjem primera od zgoraj. Začnemo s funkcijo verjetnosti:

L ( str ) = str^{Σ x}_jaz(1 - str)^{n -}^{Σ x}_jaz .

Nato uporabimo naše zakonitosti logaritma in vidimo, da:

R ( str ) = ln L ( str ) = Σ x_jazln p + (n - Σ x_jaz) ln (1 - str).

Že vidimo, da je derivat veliko lažje izračunati:

R '( str ) = (1/str) Σ x_jaz- 1/(1 - str)(n - Σ x_jaz) .

Zdaj, kot prej, smo to izpeljanko postavili na nič in obe strani pomnožili s str (1 - str):

0 = (1- str ) Σ x_jaz- str(n - Σ x_jaz) .

Rešimo za str in najti enak rezultat kot prej.

Uporaba naravnega logaritma L (p) je koristna na drug način. Veliko lažje je izračunati drugo izpeljanko R (p), da preverimo, ali resnično imamo največ v točki (1 / n) Σ x_jaz= p.

Primer

Za drug primer, predpostavimo, da imamo naključni vzorec X₁, X₂,... X_n iz populacije, ki jo modeliramo z eksponentno porazdelitvijo. Funkcija gostote verjetnosti za eno naključno spremenljivko je oblika f( x ) = θ^-1e ^-x/θ

Verjetnostna funkcija je podana s funkcijo skupne gostote verjetnosti. To je izdelek več teh funkcij gostote:

L (θ) = Π θ^-1e ^-x_jaz^/θ= θ^-ne ^-Σ^x_jaz^/θ

Še enkrat je koristno razmisliti o naravnem logaritmu verjetnostne funkcije. Če bi to razlikovali, bo potrebno manj dela kot razlikovanje verjetnostne funkcije:

R (θ) = ln L (θ) = ln [θ^-ne ^-Σ^x_jaz^/θ]

Uporabljamo svoje zakone logaritmov in pridobimo:

R (θ) = ln L (θ) = - n ln θ + -Σx_jaz/θ

Razlikujemo glede na θ in imamo:

R '(θ) = - n / θ + Σx_jaz/θ²

Ta derivat nastavimo na nič in vidimo, da:

0 = - n / θ + Σx_jaz/θ².

Pomnožite obe strani s θ²rezultat pa je:

0 = - n θ + Σx_jaz.

Zdaj uporabite algebra za rešitev θ:

θ = (1 / n) Σx_jaz.

Iz tega vidimo, da je vzorec pomeni tisto, kar maksimizira funkcijo verjetnosti. Parameter θ, ki ustreza našemu modelu, bi moral biti preprosto povprečje vseh naših opazovanj.

Povezave

Obstajajo druge vrste ocenjevalcev. Ena nadomestna vrsta ocene se imenuje an nepristranski ocenjevalec. Za to vrsto moramo izračunati pričakovano vrednost naše statistike in ugotoviti, ali ustreza ustreznemu parametru.