Eden od ciljev statistike je urediti podatke na smiseln način. Dvosmerne tabele so pomemben način organizacije določene vrste seznanjeni podatki. Tako kot pri gradnji poljubnih grafov ali tabel v statistiki je zelo pomembno poznati vrste spremenljivk, s katerimi delamo. Če imamo kvantitativne podatke, potem graf, kot je a histogram ali steblo in listna ploskev je treba uporabiti. Če imamo kategorične podatke, potem črtni graf oz krožni diagram je primerno.
Pri delu s seznanjenimi podatki moramo biti previdni. Za parne kvantitativne podatke obstaja raztresenost, kakšen graf pa je za seznanjene kategorična podatki? Kadarkoli imamo dve kategorični spremenljivki, bi morali uporabiti dvosmerno tabelo.
Opis dvosmerne tabele
Najprej se spomnimo, da se kategorični podatki nanašajo na lastnosti ali kategorije. Ni količinska in nima številskih vrednosti.
Dvosmerna tabela vključuje seznam vseh vrednosti ali ravni za dve kategorični spremenljivki. Vse vrednosti za eno od spremenljivk so navedene v navpičnem stolpcu. Vrednosti za drugo spremenljivko so navedene vzdolž vodoravne vrstice. Če ima prva spremenljivka
m vrednosti in ima druga spremenljivka n vrednosti, potem bo skupaj mn vnosi v tabeli. Vsak od teh vnosov ustreza določeni vrednosti za vsako od obeh spremenljivk.V vsaki vrstici in vzdolž vsakega stolpca so vnosi sešteti. Ti seštevki so pomembni pri določanju mejnih in pogojnih porazdelitev. Ti seštevki so pomembni tudi, ko izvajamo test hi-kvadrat za neodvisnost.
Primer dvosmerne tabele
Na primer, upoštevali bomo situacijo, v kateri si bomo ogledali več odsekov tečaja statistike na univerzi. Želimo sestaviti dvosmerno tabelo, s katero bomo ugotovili, kakšne razlike obstajajo med samci in samicami v poteku. Da bi to dosegli, štejemo število posameznih črk, ki so jih prislužili pripadniki vsakega spola.
Opažamo, da je prva kategorična spremenljivka spol in v študiji moškega in ženskega spola obstajata dve možni vrednosti. Druga kategorična spremenljivka je ocena črke in obstaja pet vrednosti, ki jih dajejo A, B, C, D in F. To pomeni, da bomo imeli dvosmerno tabelo z 2 x 5 = 10 vnosov, dodatno dodatno vrstico in dodatnim stolpcem, ki bo potreben za tabeliranje vsote vrstic in stolpcev.
Naša preiskava kaže, da:
- 50 moških si je prislužilo A, 60 žensk pa A.
- 60 samcev si je prislužilo B, 80 žensk pa B.
- 100 moških si je prislužilo C, 50 žensk pa si je prislužilo C.
- 40 moških si je prislužilo D, 50 žensk pa si je prislužilo D.
- 30 samcev si je prislužilo F, 20 žensk pa si je prislužilo F.
Te informacije so vpisane v dvosmerno spodnjo tabelo. Skupni znesek vsake vrstice nam pove, koliko zasluženih ocen vsake vrste. Vsote stolpcev nam povejo število samcev in število samic.
Pomen dvotirnih tabel
Dvosmerne tabele pomagajo organizirati naše podatke, kadar imamo dve kategorični spremenljivki. To tabelo lahko uporabimo za primerjavo med različnimi skupinami v naših podatkih. Lahko bi na primer razmislili o relativni uspešnosti samcev na tečaju statistike v primerjavi z uspešnostjo samic v tečaju.
Naslednji koraki
Po oblikovanju dvosmerne tabele je naslednji korak analiza statističnih podatkov. Lahko se vprašamo, ali so spremenljivke, ki so v študiji, med seboj neodvisne ali ne. Za odgovor na to vprašanje lahko uporabimo test chi-kvadrat na dvosmerni tabeli.
Dvosmerna tabela za stopnje in spole
Moški | Ženska | Skupaj | |
A | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Skupaj | 280 | 260 | 540 |