I slutsatsstatistik, förtroendeintervaller för befolkningsproportioner förlita sig på den normala normalfördelningen för att bestämma okända parametrar för en given population givet ett statistiskt urval av populationen. En anledning till detta är att för lämpliga provstorlekar standard normalfördelning gör ett utmärkt jobb med att uppskatta a binomial distribution. Detta är anmärkningsvärt eftersom även om den första distributionen är kontinuerlig, den andra är diskret.
Det finns ett antal frågor som måste tas upp när du bygger konfidensintervall för proportioner. En av dessa gäller vad som kallas ett "plus fyra" konfidensintervall, vilket resulterar i en partisk uppskattare. Men denna uppskattare av en okänd befolkningsandel presterar bättre i vissa situationer än opartiska uppskattare, särskilt de situationer där det inte finns några framgångar eller misslyckanden i data.
I de flesta fall är det bästa försöket att uppskatta en befolkningsandel att använda en motsvarande urvalsproportion. Vi antar att det finns en befolkning med en okänd andel
p av dess individer som innehåller ett visst drag, då bildar vi ett enkelt slumpmässigt urval av storlek n från denna befolkning. Av dessa n individer, vi räknar antalet dem Y som har den egenskap vi är nyfiken på. Nu uppskattar vi p genom att använda vårt prov. Provets andel Y / n är en opartisk uppskattning av s.När ska man använda Plus Four Confidence Interval
När vi använder ett intervall på plus fyra, ändrar vi uppskattaren av p. Vi gör detta genom att lägga till fyra till det totala antalet observationer och därmed förklara frasen ”plus fyra.” Vi delar sedan dessa fyra observationer mellan två hypotetiska framgångar och två misslyckanden, vilket innebär att vi lägger till två till det totala antalet framgångar. Slutresultatet är att vi ersätter varje instans av Y / n med (Y + 2)/(n + 4), och ibland betecknas denna bråk med p med en sida ovanför.
Proportandelen fungerar vanligtvis mycket bra för att uppskatta en befolkningsandel. Men det finns vissa situationer där vi måste ändra vår uppskattare något. Statistisk praxis och matematisk teori visar att modifieringen av intervallet plus fyra är lämpligt för att uppnå detta mål.
En situation som borde få oss att överväga ett plus-fyra intervall är ett löpande prov. På grund av att befolkningsandelen är så liten eller så stor är provandelen också mycket nära 0 eller mycket nära 1. I denna typ av situation bör vi överväga ett fyra-intervall.
Ett annat skäl för att använda ett intervall på plus fyra är om vi har en liten provstorlek. Ett plus fyra intervall i denna situation ger en bättre uppskattning för en befolkningsandel än att använda det typiska konfidensintervallet för en andel.
Regler för användning av Plus Four Confidence Interval
Konfidensintervallet plus fyra är ett nästan magiskt sätt att beräkna inferensstatistik mer exakt genom att helt enkelt lägga till fyra imaginära iakttagelser till varje given datauppsättning, två framgångar och två misslyckanden, det är i stånd att mer exakt förutsäga andelen av en datamängd som passar parametrar.
Men konfidensintervallet plus-fyra är inte alltid tillämpligt för alla problem. Det kan endast användas när konfidensintervallet för en datamängd är över 90% och provstorleken för populationen är minst 10. Datauppsättningen kan dock innehålla valfritt antal framgångar och misslyckanden, även om det fungerar bättre när det antingen inte finns några framgångar eller inga misslyckanden i en given befolknings data.
Tänk på att till skillnad från beräkningarna av vanlig statistik, beror statistiken på beräkningar på ett urval av data för att bestämma de mest troliga resultaten inom en population. Även om plus fyra konfidensintervall korrigerar för en större felmarginal, måste denna marginal fortfarande tas in för att ge den mest exakta statistiska observationen.