Variation och standardavvikelse är två nära besläktade mått på variationer som du kommer att höra mycket om i studier, tidskrifter eller statistikklass. Det är två grundläggande och grundläggande begrepp i statistik som måste förstås för att förstå de flesta andra statistiska begrepp eller förfaranden. Nedan granskar vi vad de är och hur man hittar variansen och standardavvikelsen.
Key Takeaways: Variance and Standard Deviation
- Variationen och standardavvikelsen visar hur mycket poängen i en fördelning varierar från genomsnittet.
- Standardavvikelsen är kvadratroten av variationen.
- För små datamängder kan variansen beräknas för hand, men statistiska program kan användas för större datamängder.
Definition
Per definition är varians och standardavvikelse båda variationerna för intervall-förhållande variabler. De beskriver hur mycket variation eller mångfald det finns i en distribution. Både varians och standardavvikelse öka eller minska baserat på hur nära poängen klustera runt medelvärdet.
Varians definieras som medelvärdet av de kvadratiska avvikelserna från medelvärdet. För att beräkna variansen subtraherar du medelvärdet från varje nummer och kvadrerar sedan resultaten för att hitta de kvadratiska skillnaderna. Du hittar sedan medelvärdet av dessa kvadratiska skillnader. Resultatet är variationen.
Standardavvikelsen är ett mått på hur spridda siffrorna i en distribution är. Det indikerar hur mycket, i genomsnitt, var och en av värdena i fördelningen avviker från medelvärdet eller mitten av fördelningen. Det beräknas genom att ta kvadratroten av variationen.
Ett konceptuellt exempel
Variationen och standardavvikelsen är viktiga eftersom de berättar för oss saker om datauppsättningen som vi inte kan lära oss bara genom att titta på medelvärde eller genomsnitt. Föreställ dig att du har tre yngre syskon: ett syskon som är 13 och tvillingar som är tio. I det här fallet skulle medelåldern för dina syskon vara 11. Föreställ dig nu att du har tre syskon, åldrarna 17, 12 och 4. I det här fallet skulle dina syskons medelålder fortfarande vara 11, men variansen och standardavvikelsen skulle vara större.
Ett kvantitativt exempel
Låt oss säga att vi vill hitta variansen och standardavvikelsen för åldern bland din grupp av fem nära vänner. Åldrarna för dig och dina vänner är 25, 26, 27, 30 och 32.
Först måste vi hitta medelåldern: (25 + 26 + 27 + 30 + 32) / 5 = 28.
Sedan måste vi beräkna skillnaderna från medelvärdet för var och en av de fem vännerna.
25 – 28 = -3
26 – 28 = -2
27 – 28 = -1
30 – 28 = 2
32 – 28 = 4
Därefter, för att beräkna variansen, tar vi varje skillnad från medelvärdet, kvadraterar det och sedan genomsnittet av resultatet.
Varians = ((-3)2 + (-2)2 + (-1)2 + 22 + 42)/ 5
= (9 + 4 + 1 + 4 + 16 ) / 5 = 6.8
Så variansen är 6,8. Och standardavvikelsen är kvadratroten av variansen, som är 2,61. Vad detta betyder är att du och dina vänner i genomsnitt är 2,61 år från varandra i ålder.
Även om det är möjligt att beräkna variansen för hand för mindre datamängder som den här, statistiska program kan också användas för att beräkna variansen och standardavvikelsen.
Prov mot befolkning
När du utför statistiska test är det viktigt att vara medveten om skillnaden mellan a befolkning och a prov. För att beräkna standardavvikelsen (eller variansen) för en population, måste du samla in mätningar för alla i gruppen du studerar; för ett prov skulle du bara samla in mätningar från en delmängd av befolkningen.
I exemplet ovan antog vi att gruppen med fem vänner var en befolkning; om vi i stället hade behandlat det som ett prov, beräkna provstandardavvikelsen och provvariansen skulle vara något annorlunda (istället för att dela med provstorleken för att hitta varians, skulle vi först ha dragit en från provstorleken och sedan dividerat med denna mindre siffra).
Betydelsen av variationen och standardavvikelsen
Variationen och standardavvikelsen är viktig i statistiken, eftersom de utgör grunden för andra typer av statistiska beräkningar. Till exempel är standardavvikelsen nödvändig för att konvertera testresultat till Z-värdena. Variansen och standardavvikelsen spelar också en viktig roll vid genomförande av statistiska test som t.ex. t-tester.
referenser
Frankfort-Nachmias, C. & Leon-Guerrero, A. (2006). Social statistik för ett mångfaldigt samhälle. Thousand Oaks, CA: Pine Forge Press.