Hypotestester eller test av betydelse innebär beräkning av ett tal känt som ett p-värde. Det här numret är mycket viktigt för slutet av vårt test. P-värden är relaterade till teststatistiken och ger oss en mätning av bevis mot nollhypotesen.
Noll och alternativa hypoteser
Test av statistisk betydelse börjar alla med a noll och en alternativ hypotes. Nollhypotesen är uttalandet om ingen effekt eller ett uttalande om allmänt accepterat tillstånd. Den alternativa hypotesen är vad vi försöker bevisa. Arbetsantagandet i ett hypotest är att nollhypotesen är sann.
Teststatistik
Vi antar att villkoren är uppfyllda för det specifika test som vi arbetar med. EN enkelt slumpmässigt prov ger oss provdata. Från dessa data kan vi beräkna en teststatistik. Teststatistik varierar mycket beroende på vilka parametrar vårt hypotestest gäller. Några vanliga teststatistik inkluderar:
- z - statistik för hypotesundersökningar avseende populationens medelvärde, när vi känner till populationsstandardavvikelsen.
- t - statistik för hypotesundersökningar beträffande populationsmedlet, när vi inte känner till populationsstandardavvikelsen.
- t - statistik för hypotesundersökningar beträffande skillnaden mellan två oberoende populationsmedelvärden, när vi inte känner till standardavvikelsen för någon av de två populationerna.
- z - statistik för hypotesundersökningar avseende en befolkningsandel.
- Chi-square - statistik för hypotesundersökningar om skillnaden mellan ett förväntat och faktiskt antal för kategoriska data.
Beräkning av P-värden
Teststatistik är användbar, men det kan vara mer användbart att tilldela ett p-värde till denna statistik. Ett p-värde är sannolikheten att om nollhypotesen var sant, skulle vi observera en statistik som var minst lika extrem som den som observerades. För att beräkna ett p-värde använder vi lämplig programvara eller statistisk tabell som motsvarar vår teststatistik.
Till exempel skulle vi använda a standard normalfördelning vid beräkning av a z teststatistik. Värden för z med stora absoluta värden (som de över 2,5) är inte särskilt vanliga och skulle ge ett litet p-värde. Värden för z som är närmare noll är vanligare och skulle ge mycket större p-värden.
Tolkning av P-värdet
Som vi har noterat är ett p-värde en sannolikhet. Detta innebär att det är ett verkligt tal från 0 och 1. Medan en teststatistik är ett sätt att mäta hur extrem en statistik är för ett visst prov, är p-värden ett annat sätt att mäta detta.
När vi får ett statistiskt givet prov är frågan som vi alltid borde vara: ”Är detta prov så som det är av en slump ensam med en sann nollhypotes, eller är nollhypotesen falsk? ” Om vårt p-värde är litet, kan detta betyda en av två saker:
- Nollhypotesen är sant, men vi var bara väldigt lyckliga med att få vårt observerade prov.
- Vårt exempel är det som det beror på att nollhypotesen är falsk.
I allmänhet, desto mindre p-värde, desto mer bevis har vi mot vår nollhypotes.
Hur liten är liten nog?
Hur litet av ett p-värde behöver vi för att avvisa nollhypotesen? Svaret på detta är: "Det beror." En vanlig tumregel är att p-värdet måste vara mindre än eller lika med 0,05, men det finns inget universellt med detta värde.
Typiskt, innan vi genomför ett hypotest, väljer vi ett tröskelvärde. Om vi har något p-värde som är mindre än eller lika med denna tröskel, avvisar vi nollhypotesen. Annars misslyckas vi med att avvisa nollhypotesen. Denna tröskel kallas nivån på betydelsen av vårt hypotestest och betecknas med den grekiska bokstaven alfa. Det finns inget värdet för alfa som alltid definierar statistisk betydelse.