Binomialfördelningen innefattar a diskret slumpvariabel. Sannolikheter i binomial miljö kan beräknas på ett enkelt sätt genom att använda formeln för en binomial koefficient. Även om det i teorin är en enkel beräkning, i praktiken kan det bli ganska tråkigt eller till och med beräkningsmässigt omöjligt att göra beräkna binomiala sannolikheter. Dessa problem kan undvikas genom att istället använda en normal distributionför att ungefärlig binomialfördelning. Vi kommer att se hur vi gör detta genom att gå igenom stegen i en beräkning.
Steg för att använda den normala tillnärmningen
Först måste vi avgöra om det är lämpligt att använda den normala tillnärmningen. Inte varje binomial distribution är samma. Vissa ställer ut tillräckligt skevhet att vi inte kan använda en normal tillnärmning. För att kontrollera om den normala tillnärmningen ska användas måste vi titta på värdet på p, vilket är sannolikheten för framgång, och n, vilket är antalet observationer av våra binomialvariabel.
För att använda den normala tillnärmningen överväger vi båda
np och n( 1 - p ). Om båda dessa nummer är större än eller lika med 10, är vi berättigade att använda den normala tillnärmningen. Detta är en allmän tumregel och vanligtvis desto större värden på np och n( 1 - p ), desto bättre är approximationen.Jämförelse mellan binomial och normal
Vi kommer att jämföra en exakt binomial sannolikhet med den som erhålls genom en normal approximation. Vi överväger att slänga 20 mynt och vill veta sannolikheten för att fem mynt eller mindre var huvuden. Om X är antalet huvuden, då vill vi hitta värdet:
P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5).
De användning av binomialformeln för var och en av dessa sex sannolikheter visar oss att sannolikheten är 2.0695%. Vi kommer nu att se hur nära vår normala tillnärmning kommer att vara detta värde.
När vi kontrollerar villkoren ser vi att båda np och np(1 - p) är lika med 10. Detta visar att vi kan använda den normala tillnärmningen i detta fall. Vi kommer att använda en normalfördelning med medelvärde av np = 20 (0,5) = 10 och en standardavvikelse av (20 (0,5) (0,5))0.5 = 2.236.
För att bestämma sannolikheten för att X är mindre än eller lika med 5 vi behöver för att hitta z-score för 5 i normalfördelningen som vi använder. Således z = (5 – 10)/2.236 = -2.236. Genom att konsultera en tabell över z-resultat ser vi att sannolikheten för att z är mindre än eller lika med -2.236 är 1.267%. Detta skiljer sig från den faktiska sannolikheten men ligger inom 0,8%.
Kontinuitetskorrigeringsfaktor
För att förbättra vår uppskattning är det lämpligt att införa en kontinuitetskorrigeringsfaktor. Detta används eftersom a normal distribution är kontinuerlig medan binomial distribution är diskret. För en binomiell slumpvariabel, ett sannolikhetshistogram för X = 5 kommer att innehålla en bar som går från 4,5 till 5,5 och är centrerad vid 5.
Detta betyder att för ovanstående exempel är sannolikheten för att X är mindre än eller lika med 5 för en binomvariabel bör uppskattas med sannolikheten för att X är mindre än eller lika med 5,5 för en kontinuerlig normalvariabel. Således z = (5.5 – 10)/2.236 = -2.013. Sannolikheten för att z