Det finns många mätningar av spridning eller spridning i statistik. Även om räckvidd och standardavvikelse används oftast, det finns andra sätt att kvantifiera spridning. Vi ska titta på hur man beräknar den genomsnittliga absoluta avvikelsen för en datamängd.
Definition
Vi börjar med definitionen av den genomsnittliga absoluta avvikelsen, som också kallas den genomsnittliga absoluta avvikelsen. Formeln som visas med denna artikel är den formella definitionen av den genomsnittliga absoluta avvikelsen. Det kan vara mer meningsfullt att betrakta denna formel som en process eller en serie steg som vi kan använda för att få vår statistik.
- Vi börjar med en medelvärde eller mätning av centrum, av en datauppsättning, som vi kommer att beteckna med m.
- Därefter finner vi hur mycket var och en av datavärdena avviker från m. Detta innebär att vi tar skillnaden mellan var och en av datavärdena och m.
- Efter detta tar vi absolutvärde av var och en av skillnaderna från föregående steg. Med andra ord tappar vi negativa tecken för någon av skillnaderna. Anledningen till detta är att det finns positiva och negativa avvikelser från m. Om vi inte räknar ut ett sätt att eliminera de negativa tecknen, kommer alla avvikelser att avbryta varandra om vi lägger till dem tillsammans.
- Nu lägger vi till alla dessa absoluta värden.
- Slutligen delar vi upp denna summa med n, vilket är det totala antalet datavärden. Resultatet är den genomsnittliga absoluta avvikelsen.
variationer
Det finns flera varianter för ovanstående process. Observera att vi inte specificerade exakt vad m är. Anledningen till detta är att vi kan använda en mängd olika statistik för m. Vanligtvis är detta centrum för vår datauppsättning, och så kan alla mätningar av central tendens användas.
De vanligaste statistiska mätningarna av mitten av en datamängd är medelvärdet, median och läget. Således kan något av dessa användas som m vid beräkningen av den genomsnittliga absoluta avvikelsen. Det är därför det är vanligt att hänvisa till den genomsnittliga absoluta avvikelsen om medelvärdet eller den genomsnittliga absoluta avvikelsen om medianen. Vi kommer att se flera exempel på detta.
Exempel: Genomsnittlig absolut avvikelse om medelvärdet
Anta att vi börjar med följande datauppsättning:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Medeltalet för denna datauppsättning är 5. Följande tabell kommer att ordna vårt arbete med att beräkna den genomsnittliga absoluta avvikelsen för medelvärdet.
Datavärde | Avvikelse från medelvärdet | Absolut värde för avvikelse |
1 | 1 - 5 = -4 | |-4| = 4 |
2 | 2 - 5 = -3 | |-3| = 3 |
2 | 2 - 5 = -3 | |-3| = 3 |
3 | 3 - 5 = -2 | |-2| = 2 |
5 | 5 - 5 = 0 | |0| = 0 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
9 | 9 - 5 = 4 | |4| = 4 |
Totala absoluta avvikelser: | 24 |
Vi delar nu denna summa med 10, eftersom det finns totalt tio datavärden. Den genomsnittliga absoluta avvikelsen för medelvärdet är 24/10 = 2,4.
Exempel: Genomsnittlig absolut avvikelse om medelvärdet
Nu börjar vi med en annan datauppsättning:
1, 1, 4, 5, 5, 5, 5, 7, 7, 10.
Precis som den tidigare datauppsättningen är medelvärdet för denna datauppsättning 5.
Datavärde | Avvikelse från medelvärdet | Absolut värde för avvikelse |
1 | 1 - 5 = -4 | |-4| = 4 |
1 | 1 - 5 = -4 | |-4| = 4 |
4 | 4 - 5 = -1 | |-1| = 1 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
10 | 10 - 5 = 5 | |5| = 5 |
Totala absoluta avvikelser: | 18 |
Således är den genomsnittliga absoluta avvikelsen om medelvärdet 18/10 = 1,8. Vi jämför detta resultat med det första exemplet. Även om medelvärdet var identiskt för vart och ett av dessa exempel var data i det första exemplet mer spridda. Vi ser från dessa två exempel att den genomsnittliga absoluta avvikelsen från det första exemplet är större än den genomsnittliga absoluta avvikelsen från det andra exemplet. Ju större genomsnittlig absolut avvikelse, desto större spridning av våra uppgifter.
Exempel: Genomsnittlig absolut avvikelse om medianen
Börja med samma datauppsättning som det första exemplet:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Median för datauppsättningen är 6. I följande tabell visar vi detaljerna för beräkningen av den genomsnittliga absoluta avvikelsen för medianen.
Datavärde | Avvikelse från median | Absolut värde för avvikelse |
1 | 1 - 6 = -5 | |-5| = 5 |
2 | 2 - 6 = -4 | |-4| = 4 |
2 | 2 - 6 = -4 | |-4| = 4 |
3 | 3 - 6 = -3 | |-3| = 3 |
5 | 5 - 6 = -1 | |-1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
9 | 9 - 6 = 3 | |3| = 3 |
Totala absoluta avvikelser: | 24 |
Återigen delar vi totalen med 10 och får en genomsnittlig genomsnittlig avvikelse om medianen som 24/10 = 2,4.
Exempel: Genomsnittlig absolut avvikelse om medianen
Börja med samma datauppsättning som tidigare:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Den här gången hittar vi läget för denna datauppsättning till 7. I följande tabell visar vi detaljerna för beräkningen av den genomsnittliga absoluta avvikelsen för läget.
Data | Avvikelse från läget | Absolut värde för avvikelse |
1 | 1 - 7 = -6 | |-5| = 6 |
2 | 2 - 7 = -5 | |-5| = 5 |
2 | 2 - 7 = -5 | |-5| = 5 |
3 | 3 - 7 = -4 | |-4| = 4 |
5 | 5 - 7 = -2 | |-2| = 2 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
9 | 9 - 7 = 2 | |2| = 2 |
Totala absoluta avvikelser: | 22 |
Vi delar summan av de absoluta avvikelserna och ser att vi har en genomsnittlig absolut avvikelse för läget 22/10 = 2.2.
Snabba fakta
Det finns några grundläggande egenskaper för genomsnittliga absoluta avvikelser
- Den genomsnittliga absoluta avvikelsen om medianen är alltid mindre än eller lika med den genomsnittliga absoluta avvikelsen om median.
- Standardavvikelsen är större än eller lika med den genomsnittliga absoluta avvikelsen för medelvärdet.
- Den genomsnittliga absoluta avvikelsen förkortas ibland av MAD. Tyvärr kan detta vara tvetydigt eftersom MAD alternativt kan hänvisa till den absoluta medianavvikelsen.
- Den genomsnittliga absoluta avvikelsen för en normalfördelning är ungefär 0,8 gånger standardavvikelsen.
Vanliga användningar
Den genomsnittliga absoluta avvikelsen har några tillämpningar. Den första tillämpningen är att denna statistik kan användas för att lära ut några av idéerna bakom standardavvikelse. Den genomsnittliga absoluta avvikelsen om medelvärdet är mycket lättare att beräkna än standardavvikelsen. Det kräver inte att vi kvadraterar avvikelserna, och vi behöver inte hitta en kvadratrot i slutet av vår beräkning. Vidare är den genomsnittliga absoluta avvikelsen mer intuitivt kopplad till spridningen av datasättningen än vad standardavvikelsen är. Det är därför som den genomsnittliga absoluta avvikelsen undervisas ibland först innan standardavvikelsen införs.
Vissa har gått så långt som att hävda att standardavvikelsen bör ersättas med den genomsnittliga absoluta avvikelsen. Även om standardavvikelsen är viktig för vetenskapliga och matematiska tillämpningar är den inte lika intuitiv som den genomsnittliga absoluta avvikelsen. För dagliga applikationer är den genomsnittliga absoluta avvikelsen ett mer konkret sätt att mäta hur spridda data är.