Kazalo:
Da bi ocenili populacijo, statistiki uporabljajo naključni vzorec, ki predstavlja populacijo. Na primer, če tehtate 50 ameriških naključnih žensk, lahko ocenite težo vseh ameriških žensk glede na njihovo povprečno težo. Vzorčna napaka se pojavi, ko rezultati vašega vzorca odstopajo od prave vrednosti populacije. To pomeni, da če je vaših 50 žensk doseglo povprečno težo 135 funtov, ko je dejansko povprečje znašalo 150 funtov, je vaša napaka pri vzorčenju -15 (ugotovljeno minus dejansko), kar pomeni, da ste resnično vrednost podcenili za 15 točk. Ker je prava vrednost redko znana, statistiki uporabljajo druge ocene, kot so standardni napaki in intervali zaupanja, da ocenijo napako vzorčenja.
Korak
Izračunajte odstotek, ki ga merite. Na primer, če želite vedeti, kakšen odstotek učencev v določeni šoli kadi cigarete, vzemite naključni vzorec (recimo n, naša velikost vzorca je enaka 30), naj izpolnijo anonimno anketo in izračunajo odstotek učenci, ki pravijo, da kadijo. Za primer ilustracije, recimo, da šest študentov pravi, da kadijo. Nato je odstotek, ki kadi = (# ki kadi) / (skupno število izmerjenih študentov) x 100% = 6/30 x 100% = 20%.
Korak
Izračunajte standardno napako. Ker ne poznamo dejanskega odstotka učencev, ki kadijo, lahko napako vzorčenja približamo le z izračunom standardne napake. V statistiki uporabljamo delež, p, namesto odstotkov za izračune, zato pretvorimo 20% v delež. Če razdelimo 20% za 100%, dobimo p = 0,20. Standardna napaka (SE) za velike velikosti vzorcev = sqrt p x (1 - p) / n, kjer sqrt x pomeni prevzem kvadratnega korena x. V tem primeru dobimo SE = sqrt 0.2 x (0.8) / 30 = sqrt 0.00533…? 0,073.
Korak
Ustvarite interval zaupanja. Spodnja meja: ocenjeni delež - 1.96 x SE = 0.2 - 1.96 (0.073) = 0.0569 Zgornja meja: ocenjeni delež + 1.96 x SE = 0.2 + 1.96 (0.073) = 0.343 Zato bi rekli, da smo 95% prepričani v pravi delež kadilcev med 0,0569 in 0,343, ali v odstotkih, 5,69% ali 34,3% študentov kadi. Ta široka razširjenost kaže na možnost precej velike napake vzorčenja.
Korak
Izmerite vse, da izračunate natančno vzorčno napako. Naj vsi učenci v šoli opravijo anonimno anketo in izračunajo odstotek učencev, ki so rekli, da kadijo. Recimo, da je bilo 120 od 800 študentov, ki so rekli, da so kadili, potem je naš odstotek 120/800 x 100% = 15%. Zato je naša "napaka vzorčenja" = (ocenjena) - (dejanska) = 20 - 15 = 5. Bližje ničli, boljša je naša ocena in manjša je naša napaka vzorčenja. V resničnem svetu pa verjetno ne boste vedeli dejanske vrednosti in se boste morali pri interpretaciji zanašati na SE in interval zaupanja.