Chebysjevs ojämlikhet säger att minst 1-1 /K2 av data från ett prov måste falla inom K standardavvikelser från medelvärdet (här K är något positivt riktigt nummer större än en).
Varje datauppsättning som normalt distribueras eller i form av en klockkurva, har flera funktioner. En av dem handlar om spridningen av uppgifterna relativt antalet standardavvikelser från medelvärdet. I en normalfördelning vet vi att 68% av uppgifterna är en standardavvikelse från medelvärdet, 95% är två standardavvikelser från medelvärdet och cirka 99% ligger inom tre standardavvikelser från medelvärdet.
Men om datauppsättningen inte distribueras i form av en klockkurva, kan en annan mängd ligga inom en standardavvikelse. Chebyshevs ojämlikhet ger ett sätt att veta vilken bråkdel av data som faller inom K standardavvikelser från medelvärdet för några datauppsättning.
Fakta om ojämlikheten
Vi kan också ange ojämlikheten ovan genom att ersätta frasen "data från ett prov" med sannolikhetsfördelning. Det beror på att Chebyshevs ojämlikhet är ett resultat av sannolikhet, som sedan kan tillämpas på statistik.
Det är viktigt att notera att denna ojämlikhet är ett resultat som har bevisats matematiskt. Det är inte som empirisk relation mellan medelvärdet och läget, eller tumregel som förbinder intervallet och standardavvikelsen.
Illustration av ojämlikheten
För att illustrera ojämlikheten kommer vi att titta på den för några värden K:
- För K = 2 vi har 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Så Chebyshevs ojämlikhet säger att minst 75% av datavärdena för någon distribution måste ligga inom två standardavvikelser från medelvärdet.
- För K = 3 vi har 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Så Chebyshevs ojämlikhet säger att minst 89% av datavärdena för någon distribution måste ligga inom tre standardavvikelser från medelvärdet.
- För K = 4 vi har 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Så Chebyshevs ojämlikhet säger att minst 93,75% av datavärdena för någon distribution måste ligga inom två standardavvikelser från medelvärdet.
Exempel
Anta att vi har tagit prov på hundarnas vikter i det lokala djurskyddet och funnit att vårt prov har ett medelvärde på 20 kilo med en standardavvikelse på 3 pund. Med användning av Chebyshevs ojämlikhet vet vi att minst 75% av de hundar som vi provade har vikter som är två standardavvikelser från medelvärdet. Två gånger standardavvikelsen ger oss 2 x 3 = 6. Subtrahera och lägg till detta från medelvärdet 20. Detta säger att 75% av hundarna har vikt från 14 till 26 pund.
Användning av ojämlikheten
Om vi vet mer om distributionen som vi arbetar med, kan vi vanligtvis garantera att mer data är ett visst antal standardavvikelser från medelvärdet. Om vi till exempel vet att vi har en normalfördelning är 95% av uppgifterna två standardavvikelser från medelvärdet. Chebysjevs ojämlikhet säger att i denna situation vet vi det minst 75% av uppgifterna är två standardavvikelser från medelvärdet. Som vi ser i det här fallet kan det vara mycket mer än 75%.
Värdet på ojämlikheten är att det ger oss ett "värre fall" -scenario där det enda vi vet om våra provdata (eller sannolikhetsfördelning) är medelvärdet och standardavvikelse. När vi inte vet något annat om våra uppgifter ger Chebyshevs ojämlikhet en viss ytterligare inblick i hur spridningen av datamängden är.
Ojämlikhetens historia
Ojämlikheten är uppkallad efter den ryska matematikern Pafnuty Chebyshev, som först uttalade ojämlikheten utan bevis 1874. Tio år senare bevisades ojämlikheten av Markov i hans doktorand. avhandling. På grund av variationer i hur man representerar det ryska alfabetet på engelska, är det Chebyshev också stavat som Tchebysheff.