Ibland i statistik är det bra att se utarbetade exempel på problem. Dessa exempel kan hjälpa oss att ta reda på liknande problem. I den här artikeln kommer vi att gå igenom processen för att genomföra inferensiell statistik för ett resultat som rör två befolkningsmedel. Inte bara kommer vi att se hur man utför ett hypotestest om skillnaden mellan två befolkningsmedel betyder vi också att konstruera en konfidensintervall för denna skillnad. Metoderna som vi använder kallas ibland ett tvåprov t-test och ett konfidensintervall för två prov t.
Uttalandet om problemet
Anta att vi vill testa skolbarns matematiska lämplighet. En fråga som vi kan ha är om högre betyg har högre genomsnittliga testresultat.
Ett enkelt slumpmässigt prov på 27 tredje klassare får ett mattest, deras svar får poäng och resultaten visar sig ha en genomsnittlig poäng på 75 poäng med en prov standardavvikelse av 3 poäng.
Ett enkelt slumpmässigt prov på 20 femte klassare får samma matteprov och deras svar får poäng. Medelpoängen för femte klassarna är 84 poäng med en standardavvikelse på 5 poäng.
Med tanke på detta scenario ställer vi följande frågor:
- Tillhandahåller provuppgifterna bevis på att den genomsnittliga testresultatet för befolkningen i alla femte klassare överstiger den genomsnittliga testresultatet för befolkningen i alla tredje klassare?
- Vad är ett 95% konfidensintervall för skillnaden i genomsnittliga testresultat mellan populationerna av tredje klassare och femte klassare?
Villkor och förfarande
Vi måste välja vilken procedur vi ska använda. När vi gör detta måste vi se till att kontrollera att villkoren för denna procedur är uppfyllda. Vi uppmanas att jämföra två befolkningsmedel. En samling metoder som kan användas för att göra detta är de som används för tvåprov-t-procedurer.
För att använda dessa t-procedurer för två prover måste vi se till att följande villkor gäller:
- Vi har två enkla slumpmässiga prover från de två intressanta populationerna.
- Våra enkla slumpmässiga prover utgör inte mer än 5% av befolkningen.
- De två proverna är oberoende av varandra och det finns ingen matchning mellan försökspersonerna.
- Variabeln distribueras normalt.
- Både befolkningens medelvärde och standardavvikelse är okända för båda befolkningarna.
Vi ser att de flesta av dessa villkor är uppfyllda. Vi fick höra att vi har enkla slumpmässiga prover. Befolkningarna som vi studerar är stora eftersom det finns miljoner elever på dessa lönegrader.
Villkoret för att vi inte automatiskt kan anta är om testresultaten normalt distribueras. Eftersom vi har en tillräckligt stor provstorlek behöver vi inte med nödvändigheten av att variablen ska distribueras normalt genom våra t-procedurer.
Eftersom villkoren är uppfyllda utför vi ett par preliminära beräkningar.
Standard fel
Standardfelet är en uppskattning av en standardavvikelse. För denna statistik lägger vi till provvariansen för proverna och tar sedan kvadratroten. Detta ger formeln:
(s1 2 / n1 + s22 / n2)1/2
Genom att använda värdena ovan ser vi att värdet på standardfelet är
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
Grader av frihet
Vi kan använda den konservativa tillnärmningen för vår grader av frihet. Detta kan underskatta antalet frihetsgrader, men det är mycket lättare att beräkna än att använda Welchs formel. Vi använder den minsta av de två provstorlekarna och drar sedan bort en från detta nummer.
För vårt exempel är det minsta av de två proverna 20. Detta innebär att antalet frihetsgrader är 20 - 1 = 19.
Hypotestest
Vi vill testa hypotesen att elever i femte klass har en genomsnittlig poängsumma som är högre än medelvärdet för elever i tredje klass. Låt μ1 vara medelvärdet för befolkningen i alla femte klassare. På liknande sätt låter vi μ2 vara medelvärdet för befolkningen i alla tredje klassare.
Hypoteserna är följande:
- H0: μ1 - μ2 = 0
- Hen: μ1 - μ2 > 0
Teststatistiken är skillnaden mellan provmedlen, som sedan divideras med standardfelet. Eftersom vi använder standardavvikelser för prov för att uppskatta populationsstandardavvikelsen, teststatistiken från t-fördelningen.
Värdet på teststatistiken är (84 - 75) /1.2583. Detta är ungefär 7.15.
Vi bestämmer nu vad p-värdet är för detta hypotestest. Vi tittar på värdet på teststatistiken, och var den ligger på en t-distribution med 19 frihetsgrader. För denna distribution har vi 4,2 x 10-7 som vårt p-värde. (Ett sätt att bestämma detta är att använda T.DIST.RT-funktionen i Excel.)
Eftersom vi har ett så litet p-värde avvisar vi nollhypotesen. Slutsatsen är att medelvärdet för femte klassare är högre än det genomsnittliga testresultatet för tredje klassare.
Konfidensintervall
Eftersom vi har konstaterat att det finns en skillnad mellan medelvärdena, bestämmer vi nu ett konfidensintervall för skillnaden mellan dessa två medel. Vi har redan mycket av det vi behöver. Konfidensintervallet för skillnaden måste ha både en uppskattning och en felmarginal.
Uppskattningen för skillnaden mellan två medel är enkel att beräkna. Vi finner helt enkelt skillnaden mellan provmedlen. Denna skillnad i urvalet betyder uppskattningar av skillnaden mellan befolkningsmedlen.
För våra data är skillnaden i provmedlen 84 - 75 = 9.
Felmarginalen är något svårare att beräkna. För detta måste vi multiplicera lämplig statistik med standardfelet. Statistiken som vi behöver hittas genom att konsultera en tabell eller statistisk programvara.
Återigen med den konservativa tillnärmningen har vi 19 frihetsgrader. För ett 95% konfidensintervall ser vi att t* = 2.09. Vi kan använda T.INV-funktion i Excel för att beräkna detta värde.
Vi sätter nu allt ihop och ser att vår felmarginal är 2,09 x 1,2583, vilket är ungefär 2,63. Konfidensintervallet är 9 ± 2,63. Intervallet är 6,37 till 11,63 poäng i det test som femte och tredje klassare valde.