Glavne komponente in faktorska analiza

Analiza glavnih komponent (PCA) in faktorska analiza (FA) sta statistični tehniki, ki se uporabljata za zmanjšanje podatkov ali zaznavanje strukture. Ti dve metodi se uporabita za en sklop spremenljivk, ko raziskovalca zanima odkrivanje, katere spremenljivke v naboru tvorijo skladne podskupine, ki so relativno neodvisne od ene drugo. Spremenljivke, ki so med seboj povezane, a so večinoma neodvisne od drugih nizov spremenljivk, so združene v dejavnike. Ti dejavniki omogočajo zgoščanje števila spremenljivk v vaši analizi s kombiniranjem več spremenljivk v en dejavnik.

Specifični cilji PCA ali FA so povzeti vzorce korelacije med opaženimi spremenljivkami zmanjšati veliko število opazovanih spremenljivk na manjše število dejavnikov in zagotoviti regresijska enačba za osnovni postopek z uporabo opazovanih spremenljivk ali za preizkušanje teorije o naravi osnovnih procesov.

Primer

Recimo, na primer, raziskovalca zanima preučevanje značilnosti podiplomskih študentov. Raziskovalec raziskuje velik vzorec podiplomskih študentov o osebnostnih lastnostih, kot so motivacija, intelektualne sposobnosti, šolska zgodovina, družinska zgodovina, zdravje, fizične lastnosti, itd. Vsako od teh področij se meri z več spremenljivkami. Spremenljivke se nato vnesejo v analizo posamično in preučijo se medsebojne povezave. Analiza razkriva vzorce korelacije med spremenljivkami, za katere se misli, da odražajo osnovne procese, ki vplivajo na vedenje študentov. Na primer, več spremenljivk iz ukrepov intelektualne sposobnosti se kombinira z nekaterimi spremenljivkami iz ukrepov šolske zgodovine, da tvori dejavnik, ki meri inteligenco. Podobno se lahko spremenljivke iz osebnostnih ukrepov kombinirajo z nekaterimi spremenljivkami iz motivacijske in šolske zgodovina meri, da tvori faktor, ki meri stopnjo, do katere študent raje samostojno delo - neodvisnost faktor.

instagram viewer

Koraki analize glavnih komponent in faktorske analize

Koraki za analizo glavnih komponent in faktorske analize vključujejo:

  • Izberite in izmerite nabor spremenljivk.
  • Pripravite korelacijsko matrico za izvajanje PCA ali FA.
  • Izvlecite niz dejavnikov iz korelacijske matrice.
  • Določite število dejavnikov.
  • Če je potrebno, zavrtite dejavnike, da povečate interpretabilnost.
  • Razložite rezultate.
  • Preverite strukturo faktorjev z ugotovitvijo veljavnosti faktorjev.

Razlika med analizo glavnih komponent in faktorsko analizo

Analiza glavnih komponent in faktorska analiza sta podobna, ker se oba postopka uporabljata za poenostavitev strukture nabora spremenljivk. Vendar se analize razlikujejo na več pomembnih načinov:

  • V PCA so komponente izračunane kot linearne kombinacije izvirnih spremenljivk. V FA so izvirne spremenljivke opredeljene kot linearne kombinacije faktorjev.
  • Pri PCA je cilj, da se ustvari kar največ skupnega deleža variance v spremenljivkah, kot je mogoče. Cilj FA je razložiti kovarijance ali korelacije med spremenljivkami.
  • PCA se uporablja za zmanjšanje podatkov na manjše število komponent. FA se uporablja za razumevanje, katere konstrukcije temeljijo na podatkih.

Težave z analizo glavnih komponent in faktorsko analizo

Ena od težav pri PCA in FA je, da ni merila za merila, na podlagi katerega bi lahko preizkusili rešitev. V drugih statističnih tehnikah, kot so analiza diskriminatornih funkcij, logistična regresija, analiza profilov in multivariatna analiza variance, rešitev presojamo po tem, kako dobro napoveduje članstvo v skupini. V PCA in FA ni nobenega zunanjega merila, kot je članstvo v skupini, na podlagi katerega bi lahko preizkusili rešitev.

Drugi problem PCA in FA je, da je po ekstrakciji na voljo neskončno število rotacij oz. vsi predstavljajo enako količino variance v izvirnih podatkih, vendar z nekoliko opredeljenim faktorjem drugačen. Končna izbira je prepuščena raziskovalcu, ki temelji na njihovi oceni njegove interpretabilnosti in znanstvene uporabnosti. Raziskovalci se pogosto razlikujejo v mnenju o tem, katera izbira je najboljša.

Tretja težava je, da se FA pogosto uporablja za reševanje slabo zamišljenih raziskav. Če noben drug statistični postopek ni primeren ali uporaben, se podatki lahko vsaj analizirajo s faktorji. To mnoge pušča, da verjamejo, da so različne oblike FA povezane z naključnimi raziskavami.