I den här artikeln kommer vi att gå igenom stegen som krävs för att utföra en hypotestesteller test av betydelse för skillnaden mellan två befolkningsförhållanden. Detta gör att vi kan jämföra två okända proportioner och dra slutsatsen om de inte är lika med varandra eller om en är större än en annan.
Översikt över hypoteser och bakgrund
Innan vi går in på detaljerna i vårt hypotest ska vi titta på ramen för hypotest. I ett test av betydelse försöker vi visa att ett uttalande om värdet av en befolkning parameter (eller ibland befolkningens natur) är sannolikt sanningen.
Vi samlar bevis för detta uttalande genom att utföra en statistiskt prov. Vi beräknar en statistik från detta prov. Värdet på denna statistik är vad vi använder för att bestämma sanningen i det ursprungliga uttalandet. Denna process innehåller osäkerhet, men vi kan kvantifiera denna osäkerhet
Den övergripande processen för ett hypotestest ges av listan nedan:
- Se till att villkoren som är nödvändiga för vårt test är uppfyllda.
- Ange tydligt null och alternativa hypoteser. Den alternativa hypotesen kan involvera ett ensidigt eller ett dubbelsidigt test. Vi bör också bestämma graden av betydelse, som kommer att betecknas med den grekiska bokstaven alfa.
- Beräkna teststatistiken. Vilken typ av statistik vi använder beror på det test vi utför. Beräkningen bygger på vårt statistiska urval.
- Beräkna p-värde. Teststatistiken kan översättas till ett p-värde. Ett p-värde är sannolikheten för att chansen ensam producerar värdet på vår teststatistik under antagandet att nollhypotesen är sann. Den övergripande regeln är att ju mindre p-värdet är, desto större bevis mot nollhypotesen.
- Rita en sammanfattning. Slutligen använder vi värdet på alfa som redan valts som ett tröskelvärde. Beslutsregeln är att om p-värdet är mindre än eller lika med alfa, avvisar vi nollhypotesen. Annars vi misslyckas med att avvisa nollhypotesen.
Nu när vi har sett ramen för ett hypotestest, kommer vi att se specifikationerna för ett hypotestest för skillnaden mellan två populationer.
Villkoren
Ett hypotestest för skillnaden mellan två populationsproportioner kräver att följande villkor är uppfyllda:
- Vi har två enkla slumpmässiga prover från stora populationer. Här betyder "stor" att populationen är minst 20 gånger större än provets storlek. Provstorlekarna kommer att betecknas med n1 och n2.
- Personerna i våra prover har valts oberoende av varandra. Befolkningarna själva måste också vara oberoende.
- Det finns minst 10 framgångar och 10 misslyckanden i båda våra prover.
Så länge dessa villkor är uppfyllda kan vi fortsätta med vårt hypotest.
Noll och alternativa hypoteser
Nu måste vi ta hänsyn till hypoteserna för vårt test av betydelse. Nollhypotesen är vårt uttalande om ingen effekt. I denna specifika typ av hypotestest är vår nollhypotes att det inte finns någon skillnad mellan de två populationsproportionerna. Vi kan skriva detta som H0: p1 = p2.
Den alternativa hypotesen är en av tre möjligheter, beroende på vad vi testar för:
- Hen: p1 är större än p2. Detta är ett ensidigt eller ensidigt test.
- Hen: p1 är mindre än p2. Detta är också ensidig test.
- Hen: p1 är inte lika med p2. Detta är en två-tailed eller dubbelsidig test.
Som alltid, för att vara försiktiga, bör vi använda den tvåsidiga alternativa hypotesen om vi inte har en riktning i åtanke innan vi får vårt prov. Anledningen till detta är att det är svårare att avvisa nollhypotesen med ett dubbelsidigt test.
De tre hypoteserna kan skrivas om genom att ange hur p1 - p2 är relaterad till värdet noll. För att vara mer specifik skulle nollhypotesen bli H0:p1 - p2 = 0. De potentiella alternativa hypoteserna skulle skrivas som:
- Hen: p1 - p2 > 0 motsvarar uttalandet "p1 är större än p2."
- Hen: p1 - p2 <0 motsvarar uttalandet "p1 är mindre än p2."
- Hen: p1 - p2 ≠ 0 motsvarar uttalandet "p1 är inte lika med p2."
Denna motsvarande formulering visar oss faktiskt lite mer av vad som händer bakom kulisserna. Vad vi gör i detta hypotestest är att vända de två parametrarna p1 och p2 in i den enskilda parametern p1 - p2. Vi testar sedan denna nya parameter mot värdet noll.
Teststatistiken
Formeln för teststatistiken anges i bilden ovan. En förklaring av vart och ett av termerna följer:
- Urvalet från den första populationen har storlek n1. Antalet framgångar från detta prov (som inte direkt syns i formeln ovan) är k1.
- Urvalet från den andra populationen har storlek n2. Antalet framgångar från detta prov är k2.
- Provproportionerna är p1-hatt = k1 / n1 och p2-hat = k2 / n2 .
- Vi kombinerar eller samlar sedan framgångarna från båda dessa prover och erhåller: p-hatt = (k1 + k2) / (n1 + n2).
Som alltid, var försiktig med ordning på operationer när du beräknar. Allt under radikalen måste beräknas innan man tar kvadratroten.
P-värdet
Nästa steg är att beräkna p-värdet som motsvarar vår teststatistik. Vi använder en vanlig normalfördelning för vår statistik och konsulterar en värdetabell eller använder statistisk programvara.
Detaljerna för vår beräkning av p-värden beror på den alternativa hypotesen vi använder:
- För Hen: p1 - p2 > 0, beräknar vi andelen normalfördelning som är större än Z.
- För Hen: p1 - p2 <0, vi beräknar andelen normalfördelning som är mindre än Z.
- För Hen: p1 - p2 ≠ 0, vi beräknar andelen normalfördelning som är större än |Z|, det absoluta värdet på Z. Efter detta, för att redogöra för det faktum att vi har ett två-tailed test, fördubblar vi andelen.
Beslutsregel
Nu fattar vi ett beslut om att avvisa nollhypotesen (och därmed acceptera alternativet) eller att inte missa nollhypotesen. Vi fattar detta beslut genom att jämföra vårt p-värde med nivån på betydelse alfa.
- Om p-värdet är mindre än eller lika med alfa, avvisar vi nollhypotesen. Detta innebär att vi har ett statistiskt signifikant resultat och att vi kommer att acceptera den alternativa hypotesen.
- Om p-värdet är större än alfa, misslyckas vi att avvisa nollhypotesen. Detta bevisar inte att nollhypotesen är sann. Istället betyder det att vi inte erhöll övertygande tillräckligt med bevis för att avvisa nollhypotesen.
Speciell anteckning
De konfidensintervall för skillnaden mellan två befolkningsförhållanden sammanför inte framgångarna, medan hypotestet gör det. Anledningen till detta är att vår nollhypotese antar det p1 - p2 = 0. Konfidensintervallet antar inte detta. Vissa statistiker sammanför inte framgångarna för detta hypotestest och använder istället en något modifierad version av ovanstående teststatistik.