Lima1c 5. Statistik *: 5.3 Analys och hantering av statistiska data
Felkällor vid undersökningar
Bortfall
Det finns alltid många felkällor när man gör en statistisk undersökning. Ett av de större problemen är bortfall. Ett bortfall innebär att en del av datamängden som samlats in är ofullständig eller uppenbart felaktig. När man gör statistiska undersökningar räknar man nästan alltid med ett visst bortfall.
Systematiskt fel
Om ett mätinstrument hela tiden visar för mycket eller för lite kallas det systematiskt fel. Ett systematiskt fel kan man oftast, om det upptäcks, kompensera för i sina data. En våg som visar #2,0 # kg när inget står på vågen kommer att visa #2,0 # kg för mycket för alla föremål eller personer som ställs på vågen.
Felmarginal
Konfidensintervall
När man har gjort en statistisk undersökning som anger andelar i procent, till exempel väljarundersökningar, brukar man beskriva felkällornas påverkan på resultatet med en felmarginal.
Felmarginalen beräknas med formeln #f = k \cdot \sqrt {\frac{{p(100 - p)}}{n}} #, där # n # är antalet observationer, det vill säga stickprovets storlek och # p # är den procentuella andelen av populationen som exempelvis svarat på ett visst sätt. # k # är en konstant som beror på hur stort konfidensintervall (säkerhetsintervall) man önskar i sin felmarginal. Oftast är # k = 1,96. #
Observera att inget värde för hela populationens storlek finns med i formeln, det är endast stickprovets storlek som har betydelse. Felmarginalen blir inte alltid korrekt, eftersom slumpen inverkar på det urval som har gjorts. Om # k = 1,96 # stämmer felmarginalen i #95 # fall av #100, # och vi säger att vi har ett #95#-procentigt konfidensintervall. Om # k = 2,58 # stämmer felmarginalen i #99 # fall av #100, # och vi säger att vi har ett #99#-procentigt konfidensintervall.
Konstanten # k # är kopplad till begreppet standardavvikelse. Inom stickprovet antas alla data vara normalfördelade, och inom ± #1,96 # standardavvikelser från medelvärdet återfinns #95 # % av allt data. Undersök gärna detta med din räknare. #95# %-nivån på felmarginalen är den som är vanligast förekommande.
Det finns alltid många felkällor när man gör en statistisk undersökning. Ett av de större problemen är bortfall. Ett bortfall innebär att en del av datamängden som samlats in är ofullständig eller uppenbart felaktig. När man gör statistiska undersökningar räknar man nästan alltid med ett visst bortfall.
Systematiskt fel
Om ett mätinstrument hela tiden visar för mycket eller för lite kallas det systematiskt fel. Ett systematiskt fel kan man oftast, om det upptäcks, kompensera för i sina data. En våg som visar #2,0 # kg när inget står på vågen kommer att visa #2,0 # kg för mycket för alla föremål eller personer som ställs på vågen.
Felmarginal
Konfidensintervall
När man har gjort en statistisk undersökning som anger andelar i procent, till exempel väljarundersökningar, brukar man beskriva felkällornas påverkan på resultatet med en felmarginal.
Felmarginalen beräknas med formeln #f = k \cdot \sqrt {\frac{{p(100 - p)}}{n}} #, där # n # är antalet observationer, det vill säga stickprovets storlek och # p # är den procentuella andelen av populationen som exempelvis svarat på ett visst sätt. # k # är en konstant som beror på hur stort konfidensintervall (säkerhetsintervall) man önskar i sin felmarginal. Oftast är # k = 1,96. #
Observera att inget värde för hela populationens storlek finns med i formeln, det är endast stickprovets storlek som har betydelse. Felmarginalen blir inte alltid korrekt, eftersom slumpen inverkar på det urval som har gjorts. Om # k = 1,96 # stämmer felmarginalen i #95 # fall av #100, # och vi säger att vi har ett #95#-procentigt konfidensintervall. Om # k = 2,58 # stämmer felmarginalen i #99 # fall av #100, # och vi säger att vi har ett #99#-procentigt konfidensintervall.
Konstanten # k # är kopplad till begreppet standardavvikelse. Inom stickprovet antas alla data vara normalfördelade, och inom ± #1,96 # standardavvikelser från medelvärdet återfinns #95 # % av allt data. Undersök gärna detta med din räknare. #95# %-nivån på felmarginalen är den som är vanligast förekommande.
Felmarginal #f = 1,96 \cdot \sqrt {\frac{{p(100 - p)}}{n}} # ger felmarginalen i procent med #95#-procentigt konfidensintervall. |