Användning av statistiska tabeller är ett vanligt ämne i många statistikkurser. Även om programvara gör beräkningar, är färdigheten att läsa tabeller fortfarande en viktig att ha. Vi ser hur man använder en tabell med värden för en chi-kvadratfördelning för att bestämma ett kritiskt värde. Tabellen som vi kommer att använda är ligger häremellertid läggs andra chi-square-bord ut på sätt som är mycket lika de här.
Kritiskt värde
Användningen av en chi-kvadratisk tabell som vi kommer att undersöka är att bestämma ett kritiskt värde. Kritiska värden är viktiga i båda hypotestester och förtroendeintervaller. För hypotesundersökningar berättar ett kritiskt värde gränsen för hur extremt en teststatistik vi behöver för att avvisa nollhypotesen. För konfidensintervall är ett kritiskt värde en av ingredienserna som går till beräkningen av en felmarginal.
För att bestämma ett kritiskt värde måste vi veta tre saker:
- Antalet frihetsgrader
- Antalet och typen av svansar
- Nivån av betydelse.
Grader av frihet
Den första punkten av betydelse är antalet grader av frihet. Detta nummer berättar vilken av oändligt oändligt många chi-square distributioner vi ska använda i vårt problem. Hur vi bestämmer detta nummer beror på det exakta problemet som vi använder vårt chi-square distribution med. Tre vanliga exempel följer.
- Om vi gör en bra passformtest, då är antalet frihetsgrader en mindre än antalet resultat för vår modell.
- Om vi konstruerar en konfidensintervall för en befolkningsvarians, då är antalet frihetsgrader en mindre än antalet värden i vårt prov.
- För en chi-square testet av oberoende av två kategoriska variabler, har vi en tvåvägs beredskapstabell med r rader och c kolumner. Antalet frihetsgrader är (r - 1)(c - 1).
I denna tabell motsvarar antalet frihetsgrader den rad som vi kommer att använda.
Om tabellen som vi arbetar med inte visar det exakta antalet frihetsgrader som vårt problem kräver, finns det en tumregel som vi använder. Vi rundar antalet frihetsgrader ner till det högsta tabellvärdet. Anta till exempel att vi har 59 frihetsgrader. Om vårt bord endast har linjer för 50 och 60 frihetsgrader, använder vi linjen med 50 frihetsgrader.
Tails
Nästa sak som vi måste tänka på är antalet och typen av svansar som används. En chi-kvadratisk fördelning är sned åt höger, och så används ofta ensidiga tester som involverar den högra svansen. Men om vi beräknar ett dubbelsidigt konfidensintervall, skulle vi behöva överväga a två-tailed test med både höger och vänster svans i vår chi-square distribution.
Nivå av förtroende
Den sista informationen som vi behöver veta är nivån på förtroende eller betydelse. Detta är en sannolikhet som vanligtvis betecknas av alfa. Vi måste då översätta denna sannolikhet (tillsammans med informationen om våra svansar) till rätt kolumn för att använda i vårt bord. Många gånger beror detta steg på hur vårt bord är konstruerat.
Exempel
Till exempel kommer vi att överväga hur god passformtest är för en tolvsidig munstycke. Vår nollhypotes är att alla sidor är lika troliga att rullas, och därför har varje sida en sannolikhet på att 1/12 rullas. Eftersom det finns 12 utfall finns det 12 -1 = 11 grader av frihet. Detta innebär att vi kommer att använda raden 11 för våra beräkningar.
Ett godhet med passningstest är ett enstansat test. Svansen som vi använder för detta är rätt svans. Anta att signifikansnivån är 0,05 = 5%. Detta är sannolikheten i rätt svans för distributionen. Vårt bord är uppsatt för sannolikhet i vänster svans. Så vänster om vårt kritiska värde bör vara 1 - 0,05 = 0,95. Detta betyder att vi använder kolumnen som motsvarar 0,95 och rad 11 för att ge ett kritiskt värde på 19,675.
Om den chi-kvadratstatistik som vi beräknar från våra data är större än eller lika med19.675, avvisar vi nollhypotesen med 5% betydelse. Om vår chi-square-statistik är mindre än 19.675, så är vi det misslyckas med att avvisa nollhypotesen.