Sekundarna analiza podatkov je analiza podatkov, ki jih je zbral nekdo drug. Spodaj bomo preučili definicijo sekundarnih podatkov, kako jih lahko uporabljajo raziskovalci ter prednosti in slabosti te vrste raziskav.
Ključni odvzemi: analiza sekundarnih podatkov
- Primarni podatki se nanašajo na podatke, ki so jih raziskovalci zbrali sami, sekundarni pa na podatke, ki jih je zbral nekdo drug.
- Sekundarni podatki so na voljo iz različnih virov, kot so vlade in raziskovalne ustanove.
- Čeprav je uporaba sekundarnih podatkov lahko bolj ekonomična, obstoječi nabori podatkov ne bodo odgovorili na vsa vprašanja raziskovalca.
Primerjava primarnih in sekundarnih podatkov
V družboslovnem raziskovanju sta izraza primarni podatki in sekundarni podatki običajni jezik. Primarne podatke zbira raziskovalec ali skupina raziskovalcev za določen namen ali analizo, ki se obravnava. Tu se raziskovalna skupina zamisli in razvije raziskovalni projekt, odloči se o tehnika vzorčenja, zbira podatke, namenjene reševanju določenih vprašanj, in izvaja lastne analize zbranih podatkov. V tem primeru so ljudje, ki sodelujejo v analizi podatkov, seznanjeni z načrtovanjem raziskav in postopkom zbiranja podatkov.
Sekundarna analiza podatkovna drugi strani je uporaba podatkov, ki ga je nekdo drug zbral za kakšen drug namen. V tem primeru raziskovalec zastavlja vprašanja, ki se jih loti z analizo nabora podatkov, ki niso bili vključeni v zbiranje. Podatki niso bili zbrani, da bi odgovorili na posamezna raziskovalna vprašanja, temveč so bili zbrani za drug namen. To pomeni, da je isti niz podatkov lahko dejansko primarni niz podatkov za enega raziskovalca, sekundarni pa za drugega.
Uporaba sekundarnih podatkov
Pred uporabo sekundarnih podatkov v analizi morate storiti nekaj pomembnih stvari. Ker raziskovalec podatkov ni zbral, je pomembno, da se seznanijo z naborom podatkov: kako so bili zbrani podatki, kakšne so kategorije odzivov za vsakega vprašanje, ali je treba med analizo uporabiti uteži ali ne, ali je treba upoštevati grozde ali stratifikacijo, kdo je bila populacija v študiji, in več.
Obstaja veliko sekundarnih podatkovnih virov in naborov podatkov na voljo za sociološke raziskaveod katerih so mnoge javne in lahko dostopne. The Popis ZDA, the Splošna socialna anketa, in Raziskava ameriške skupnosti so nekatere najpogosteje uporabljene sekundarne vrste podatkov.
Prednosti sekundarne analize podatkov
Največja prednost uporabe sekundarnih podatkov je, da so lahko bolj varčni. Podatke je že zbral nekdo drug, zato raziskovalcu ni treba v to fazo raziskovanja namenjati denarja, časa, energije in virov. Včasih je treba kupiti sekundarni niz podatkov, vendar so stroški skoraj vedno nižji od stroškov zbiranja podobnega nabor podatkov iz nič, kar običajno vključuje plače, potovanja in prevoz, pisarniške prostore, opremo in druge režijske stroške stroški. Poleg tega, ker so podatki že zbrani in jih običajno očistimo in shranimo v elektronski obliki, lahko raziskovalec porabi večino svojega časa analizo podatkov namesto da bi podatke pripravili na analizo.
Druga velika prednost uporabe sekundarnih podatkov je širina razpoložljivih podatkov. Zvezna vlada izvaja številne študije v velikem, nacionalnem merilu, ki bi jih posamezni raziskovalci težko zbirali. Veliko teh zbirk podatkov je tudi vzdolžni, kar pomeni, da so bili isti podatki zbrani iz iste populacije v več različnih časovnih obdobjih. To omogoča raziskovalcem, da si ogledajo trende in spremembe pojavov skozi čas.
Tretja pomembna prednost uporabe sekundarnih podatkov je, da postopek zbiranja podatkov pogosto ohranja raven strokovnosti in strokovnosti, ki morda niso prisotni pri posameznih raziskovalcih ali majhnih raziskovalnih projektih. Na primer, zbiranje podatkov za številne zvezne zbirke podatkov pogosto izvajajo uslužbenci, ki so specializirani pri določenih nalogah in ima dolgoletne izkušnje na tem področju in s to posebno raziskavo. Številni manjši raziskovalni projekti nimajo takšne stopnje strokovnega znanja, saj veliko podatkov zbirajo študenti, ki delajo s krajšim delovnim časom.
Slabosti sekundarne analize podatkov
Glavna pomanjkljivost uporabe sekundarnih podatkov je ta, da morda ne odgovarja na posamezna raziskovalna vprašanja ali vsebuje določene podatke, ki bi jih raziskovalci želeli imeti. Morda ni bila zbrana v geografski regiji ali v želenih letih ali pri določeni populaciji, ki jo raziskovalec zanima za študij. Na primer, raziskovalec, ki ga zanima preučevanje mladostnikov, lahko ugotovi, da sekundarni nabor podatkov vključuje samo mlade odrasle.
Poleg tega, ker raziskovalci niso zbirali podatkov, nimajo nadzora nad tem, kaj vsebujejo nabor podatkov. Pogosto lahko to omeji analizo ali spremeni izvirna vprašanja, na katera je raziskovalec želel odgovoriti. Na primer, raziskovalec, ki preučuje srečo in optimizem, lahko ugotovi, da sekundarni niz podatkov vključuje le enega od teh spremenljivk, vendar ne obojega.
Povezana težava je, da so bile lahko spremenljivke opredeljeno ali razvrščeno drugače kot bi izbrala raziskovalka. Na primer, starost je lahko zbrana v kategorijah in ne kot neprekinjena spremenljivka ali pa je dirka lahko opredeljena kot „bela“ in „druga“, namesto da bi vsebovala kategorije za vsako večjo dirko.
Druga pomembna pomanjkljivost uporabe sekundarnih podatkov je, da raziskovalec ne ve natančno, kako je potekal postopek zbiranja podatkov ali kako dobro je potekal. Raziskovalca ponavadi ne poznajo informacije o tem, kako resno na podatke vplivajo težave, kot sta nizka stopnja odziva ali nerazumevanje določenih vprašanj v anketi. Včasih so te informacije zlahka dostopne, kot je to primer pri številnih zveznih zbirkah podatkov. Vendar veliko drugih sekundarnih nizov podatkov ne spremlja tovrstnih informacij in analitik se mora naučiti brati med vrsticami, da bi odkril morebitne omejitve podatkov.