Förtroendeintervaller: 4 vanliga misstag

Förtroendeintervaller är en viktig del av inferentialstatistiken. Vi kan använda viss sannolikhet och information från a sannolikhetsfördelning för att uppskatta en populationsparameter med användning av ett prov. Uttalandet om a konfidensintervall görs på ett sådant sätt att det lätt missförstås. Vi kommer att titta på rätt tolkning av konfidensintervall och undersöka fyra misstag som görs angående detta statistikområde.

Vad är ett förtroendeintervall?

Ett konfidensintervall kan uttryckas antingen som ett intervall av värden eller i följande form:

Uppskatta ± Felmarginal

Ett konfidensintervall anges vanligtvis med en nivå av förtroende.Vanliga förtroendegrader är 90%, 95% och 99%.

Vi kommer att titta på ett exempel där vi vill använda ett urval för att dra slutsatsen för en befolkning. Anta att detta resulterar i ett konfidensintervall från 25 till 30. Om vi säger att vi är 95% säkra på att den okända befolkningen betyda finns i detta intervall, då säger vi verkligen att vi hittade intervallet med en metod som lyckas med att ge korrekta resultat 95% av tiden. På lång sikt kommer vår metod att lyckas 5% av tiden. Med andra ord kommer vi att misslyckas med att fånga den verkliga befolkningen bara en av var 20 gånger.

instagram viewer

Fel nr 1

Vi kommer nu att titta på en serie olika misstag som kan göras när vi hanterar förtroendevillkor. Ett felaktigt uttalande som ofta görs om ett konfidensintervall vid 95% nivå av förtroende är att det är 95% chans att konfidensintervallet innehåller det verkliga medelvärdet för befolkningen.

Anledningen till att detta är ett misstag är faktiskt ganska subtilt. Den nyckelidé som hänför sig till ett konfidensintervall är att den använda sannolikheten kommer in i bilden med metoden som används vid bestämning av konfidensintervall är att den hänvisar till den metod som är Begagnade.

Fel nr 2

Ett andra misstag är att tolka ett 95% konfidensintervall som att säga att 95% av alla datavärden i befolkningen faller inom intervallet. Återigen talar 95% för testmetoden.

För att se varför ovanstående uttalande är felaktigt kan vi överväga en normal befolkning med en standardavvikelse av 1 och ett medelvärde på 5. Ett prov som hade två datapunkter, var och en med värden på 6 har ett provmedelvärde på 6. Ett 95% konfidensintervall för befolkningsmedlet skulle vara 4,6 till 7,4. Detta överlappar helt klart inte 95% av normal distribution, så den kommer inte att innehålla 95% av befolkningen.

Fel nr 3

Ett tredje misstag är att säga att ett konfidensintervall på 95% innebär att 95% av alla möjliga sampelmedel faller inom intervallet. Översyn exemplet från det sista avsnittet. Varje prov med storlek två som bestod av endast värden mindre än 4,6 skulle ha ett medelvärde som var mindre än 4,6. Således skulle dessa provmedel falla utanför detta specifika konfidensintervall. Prover som matchar denna beskrivning står för mer än 5% av det totala beloppet. Så det är ett misstag att säga att detta konfidensintervall fångar 95% av alla provmedel.

Fel nr 4

Ett fjärde misstag när det gäller att hantera konfidensintervall är att tro att de är den enda felkällan. Även om det finns en felmarginal förknippad med ett konfidensintervall, finns det andra platser som fel kan krypa till en statistisk analys. Ett par exempel på sådana fel kan vara från en felaktig utformning av experimentet, förspänning i provtagningen eller en oförmåga att få data från en viss delmängd av befolkningen.