Grader av frihet i statistik och matematik

I statistik används frihetsgraderna för att definiera antalet oberoende kvantiteter som kan tilldelas en statistisk fördelning. Detta tal avser vanligtvis ett positivt heltal som indikerar bristen på begränsningar för en persons förmåga att beräkna saknade faktorer från statistiska problem.

Frihetsgrader fungerar som variabler i den slutliga beräkningen av en statistik och används för att bestämma resultatet av olika scenarier i ett system och i matematiska frihetsgrader definiera antalet dimensioner i en domän som behövs för att bestämma full vektor.

För att illustrera begreppet frihetsgrad kommer vi att titta på en grundläggande beräkning av provet medelvärde, och för att hitta medelvärdet för en lista med data lägger vi till alla data och delar med det totala antalet värden.

En illustration med ett provmedelvärde

Anta ett ögonblick att vi känner till betyda av en datamängd är 25 och att värdena i denna uppsättning är 20, 10, 50 och ett okänt nummer. Formeln för ett provmedelvärde ger oss ekvationen

instagram viewer
(20 + 10 + 50 + x) / 4 = 25, var x anger det okända med hjälp av några grundläggande algebra, kan man sedan bestämma att det saknade numret, x, är lika med 20.

Låt oss ändra detta scenario något. Återigen antar vi att vi vet att medelvärdet för en datamängd är 25. Men denna gång är värdena i datauppsättningen 20, 10 och två okända värden. Dessa okända kan vara olika, så vi använder två olika variabler, x, och y, att beteckna detta. Den resulterande ekvationen är (20 + 10 + x + y) / 4 = 25. Med en del algebra får vi y = 70- x. Formeln är skriven i denna form för att visa att när vi väljer ett värde för x, värdet för y är helt bestämd. Vi har ett val att göra, och det visar att det finns ett grad av frihet.

Nu ska vi titta på ett provstorlek på hundra. Om vi ​​vet att medelvärdet för denna exempeldata är 20, men inte känner till värdena på någon av uppgifterna, finns det 99 grader av frihet. Alla värden måste lägga till totalt 20 x 100 = 2000. När vi har värdena på 99 element i datauppsättningen, har den sista bestämts.

Student t-poäng och Chi-Square Distribution

Grader av frihet spelar en viktig roll när man använder Studerande t-score tabell. Det finns faktiskt flera t-poäng fördelningar. Vi skiljer mellan dessa fördelningar med användning av frihetsgrader.

Här sannolikhetsfördelning som vi använder beror på storleken på vårt prov. Om vår provstorlek är n, då är antalet frihetsgrader n-1. Till exempel skulle en provstorlek på 22 kräva att vi använder raden för t-score bord med 21 frihetsgrader.

Användningen av en chi-square distribution kräver också användning av grader av frihet. Här på samma sätt som med t-poäng distribution, provstorleken bestämmer vilken distribution som ska användas. Om provstorleken är n, så finns det n-1 grader av frihet.

Standardavvikelse och avancerade tekniker

En annan plats där frihetsgrader dyker upp är formeln för standardavvikelsen. Denna händelse är inte så öppen, men vi kan se den om vi vet vart vi ska titta. Till hitta en standardavvikelse vi letar efter den "genomsnittliga" avvikelsen från medelvärdet. Men efter att ha subtraherat medelvärdet från varje datavärde och kvadrat skillnaderna, slutar vi dock med n-1 hellre än n som vi kan förvänta oss.

Närvaron av n-1 kommer från antalet frihetsgrader. Sedan n datavärden och provmedlet används i formeln finns det n-1 grader av frihet.

Mer avancerade statistiska tekniker använder mer komplicerade sätt att räkna frihetsgraderna. Vid beräkning av teststatistik för två medel med oberoende prover av n1 och n2 element, antalet frihetsgrader har en ganska komplicerad formel. Det kan uppskattas genom att använda den mindre av n1-1 och n2-1

Ett annat exempel på ett annat sätt att räkna frihetsgraderna kommer med en F testa. Vid genomförande av en F test vi har k prover i storlek n—Graden av frihet i telleren är k-1 och i nämnaren är k(n-1).

instagram story viewer