Många gånger politiska omröstningar och andra tillämpning av statistik ange sina resultat med en felmarginal. Det är inte ovanligt att se i en opinionsundersökning att det finns stöd för en fråga eller en kandidat vid en viss procent av respondenterna, plus och minus en viss procentandel. Det är denna plus- och minus-term som är felmarginen. Men hur beräknas felmarginalen? För en enkelt slumpmässigt prov av en tillräckligt stor befolkning, är marginalen eller felet egentligen bara en omfördelning av provets storlek och nivån på det förtroende som används.
Formeln för felets marginal
I det följande kommer vi att använda formeln för felmarginal. Vi planerar för det värsta fallet, där vi inte har någon aning om vad den verkliga stödnivån är frågorna i vår undersökning. Om vi hade någon aning om detta nummer, eventuellt genom tidigare pollingdata, skulle vi hamna med en mindre felmarginal.
Formeln vi kommer att använda är: E = zα/2/ (2√ n)
Nivån på förtroende
Den första informationen vi behöver för att beräkna felmarginal är att bestämma vilken nivå av förtroende vi önskar. Detta antal kan vara vilken procent som helst mindre än 100%, men de vanligaste nivåerna av förtroende är 90%, 95% och 99%. Av dessa tre används 95% -nivån oftast.
Om vi subtraherar säkerhetsnivån från en, kommer vi att få värdet på alfa, skrivet som α, som behövs för formeln.
Det kritiska värdet
Nästa steg vid beräkning av marginal eller fel är att hitta lämpligt kritiskt värde. Detta indikeras av termen zα/2 i ovanstående formel. Eftersom vi har antagit ett enkelt slumpmässigt urval av en stor population, kan vi använda standard normalfördelning av z-scores.
Anta att vi arbetar med en 95% nivå av förtroende. Vi vill leta upp z-Göra z *för vilket området mellan -z * och z * är 0,95. Från tabellen ser vi att detta kritiska värde är 1,96.
Vi kunde också ha hittat det kritiska värdet på följande sätt. Om vi tänker i termer av α / 2, eftersom α = 1 - 0,95 = 0,05, ser vi att α / 2 = 0,025. Vi söker nu i tabellen för att hitta z-score med ett område på 0,025 till höger. Vi skulle hamna med samma kritiska värde på 1,96.
Andra nivåer av förtroende ger oss olika kritiska värden. Ju större förtroende, desto högre blir det kritiska värdet. Det kritiska värdet för en 90% konfidensnivå, med ett motsvarande a-värde på 0,10, är 1,64. Det kritiska värdet för en konfidensnivå på 99%, med ett motsvarande a-värde på 0,01, är 2,54.
Provstorlek
Det enda andra numret som vi behöver för att använda formeln för att beräkna felmarginal är provstorlek, betecknad med n i formeln. Vi tar sedan kvadratroten av detta nummer.
På grund av platsen för detta nummer i formeln ovan, desto större är provstorlek som vi använder, desto mindre blir felmarginalen. Stora prover är därför att föredra framför mindre. Eftersom statistisk provtagning kräver resurser av tid och pengar finns det dock begränsningar för hur mycket vi kan öka provstorleken. Närvaron av kvadratroten i formeln innebär att fyrdubbling av provstorleken bara kommer att halva felmarginalen.
Några exempel
För att förstå formeln, låt oss titta på några exempel.
- Vad är felmarginen för ett enkelt slumpmässigt urval av 900 personer med 95%nivå av förtroende?
- Genom att använda tabellen har vi ett kritiskt värde på 1,96, och så är felmarginalen 1,96 / (2 900 = 0,03267, eller cirka 3,3%.
- Vilken är felmarginen för ett enkelt slumpmässigt urval av 1600 personer med en 95% förtroende?
- På samma nivå av förtroende Som det första exemplet ger en ökning av provstorleken till 1600 oss en felmarginal på 0,0245 eller cirka 2,5%.