Seznanjeni podatki v statistiki, ki jih pogosto imenujemo urejeni pari, se nanašajo na dve spremenljivki pri posameznikih populacije, ki sta povezani skupaj, da bi ugotovili povezanost med njima. Da se nabor podatkov šteje za seznanjene podatke, je treba obe vrednosti podatkov pritrditi ali povezati med seboj in ne obravnavati ločeno.
Zamisel o seznanjenih podatkih je v nasprotju z običajno povezavo ene številke v vsako podatkovno točko kot v drugi kvantitativni podatki določa, da je vsaka posamezna podatkovna točka povezana z dvema številkama, kar zagotavlja graf, ki omogoča statistikom, da opazujejo odnos med temi spremenljivkami v populaciji.
Ta metoda seznanjenih podatkov se uporablja, kadar želi študija primerjati dve spremenljivki pri posameznikih iz populacije in narediti nekakšen zaključek o opaženi korelaciji. Pri opazovanju teh podatkovnih točk je pomemben vrstni red združevanja, ker je prvo število merilo ene stvari, drugo pa merilo nečesa povsem drugega.
Primer seznanjenih podatkov
Če si želite ogledati primer seznanjenih podatkov, predpostavimo, da učitelj šteje število domačih nalog posameznega učenca vdelani za določeno enoto in nato to številko seznanite z odstotkom vsakega študenta na enotnem testu. Parovi so naslednji:
- Posameznik, ki je opravil 10 nalog, je na svojem testu zaslužil 95%. (10, 95%)
- Posameznik, ki je opravil 5 nalog, je na svojem testu zaslužil 80%. (5, 80%)
- Posameznik, ki je opravil 9 nalog, je na svojem testu zaslužil 85%. (9, 85%)
- Posameznik, ki je opravil 2 naloga, je na svojem testu zaslužil 50%. (2, 50%)
- Posameznik, ki je opravil 5 nalog, je na svojem testu zaslužil 60%. (5, 60%)
- Posameznik, ki je opravil 3 naloge, je na svojem testu zaslužil 70%. (3, 70%)
V vsakem od teh sklopov seznanjenih podatkov lahko vidimo, da je število nalog vedno na prvem mestu naročeni par, medtem ko odstotek, pridobljen na testu, postane drugi, kot je razvidno iz prve stopnje (10, 95%).
Statistična analiza teh podatkov bi se lahko uporabila tudi za izračun povprečnega števila opravljene domače naloge ali povprečna ocena testa, o katerih se lahko vprašate podatki. V tem primeru učitelj želi vedeti, ali obstaja kakšna povezava med številom domačih nalog se vključil in opravil test, učitelj pa bi moral podatke shraniti, da bi lahko odgovoril na to vprašanje.
Analiza seznanjenih podatkov
The statistične tehnike od korelacija in regresija se uporabljata za analizo seznanjenih podatkov, kjer je korelacijski koeficient količinsko opredeli, kako tesno ležijo podatki vzdolž ravne črte, in meri moč linearnega razmerja.
Po drugi strani pa se za več aplikacij uporablja regresija, vključno z določitvijo, katera vrstica je najprimernejša za naš nabor podatkov. To vrstico lahko nato uporabite za oceno ali napovedovanje y vrednosti za vrednosti x ki niso bili del našega prvotnega nabora podatkov.
Obstaja posebna vrsta grafa, ki je še posebej primeren za seznanjene podatke, ki se imenujejo razpršilec. V tem vrsta grafa, ena koordinatna os predstavlja eno količino seznanjenih podatkov, druga koordinatna os pa drugo količino seznanjenih podatkov.
Z razpršilnikom za zgornje podatke bi os x označevala število dodeljenih dodelitev, medtem ko bi os y označevala ocene na enotnem testu.