Vad är standardfördelningen i statistik?

click fraud protection

Klockkurvor dyker upp i hela statistiken. Olika mätningar som diametern på frön, längder av fiskfenor, poäng på SAT och vikter på enskilda pappersark med en pappersram bildar alla klockkurvor när de är graferade. Den allmänna formen på alla dessa kurvor är densamma. Men alla dessa kurvor är olika eftersom det är mycket osannolikt att någon av dem har samma medelvärde eller standardavvikelse. Klockkurvor med stora standardavvikelser är breda, och klockkurvor med små standardavvikelser är magra. Klockkurvor med större medel förskjuts mer åt höger än de med mindre medel.

Ett exempel

För att göra detta lite mer konkret, låt oss låtsas att vi mäter diametrarna för 500 kornkorn. Sedan registrerar vi, analyserar och graferar vi dessa data. Det har visat sig att datamängden är formad som en klockkurva och har ett medelvärde av 1,2 cm med en standardavvikelse på 0,4 cm. Anta nu att vi gör samma sak med 500 bönor, och vi upptäcker att de har en medeldiameter på 0,8 cm med en standardavvikelse på 0,04 cm.

instagram viewer

Klockkurvorna från båda dessa datamängder är ritade ovan. Den röda kurvan motsvarar majsdata och den gröna kurvan motsvarar bönedata. Som vi ser är centra och spridningar för dessa två kurvor olika.

Det här är helt klart två olika klockkurvor. De är olika eftersom deras medel och standardavvikelser matchar inte. Eftersom alla intressanta datamängder vi stöter på kan ha valfritt positivt tal som standardavvikelse, och valfritt tal för ett medelvärde, skrapar vi verkligen bara ytan på en oändlig antal klockkurvor. Det är många kurvor och alldeles för många att ta itu med. Vad är lösningen?

En mycket speciell klockkurva

Ett mål med matematik är att generalisera saker när det är möjligt. Ibland är flera enskilda problem speciella fall av ett enda problem. Denna situation med klockkurvor är en fantastisk illustration av det. I stället för att ta itu med ett oändligt antal klockkurvor, kan vi relatera dem alla till en enda kurva. Denna speciella klockkurva kallas standard klockkurva eller standard normalfördelning.

Standardklockkurvan har ett medelvärde på noll och en standardavvikelse på en. Alla andra klockkurvor kan jämföras med denna standard med hjälp av en enkel beräkning.

Funktioner i Standard Normal Distribution

Alla egenskaper för en klockkurva håller för normal normalfördelning.

  • Den normala normalfördelningen har inte bara ett medelvärde på noll utan också en median och ett nollläge. Detta är mitt på kurvan.
  • Normal normalfördelning visar spegel symmetri vid noll. Hälften av kurvan är till vänster om noll och hälften av kurvan är till höger. Om kurvan viks längs en vertikal linje vid noll, skulle båda halvorna matcha perfekt.
  • Standardfördelningen följer regeln 68-95-99.7, vilket ger oss ett enkelt sätt att uppskatta följande:
    • Cirka 68% av all data ligger mellan -1 och 1.
    • Cirka 95% av all data ligger mellan -2 och 2.
    • Cirka 99,7% av alla uppgifter ligger mellan -3 och 3.

Varför vi bryr oss

Just nu frågar vi kanske "Varför bry sig om en vanlig klockkurva?" Det kan verka som en onödig komplikation, men standardklockkurvan kommer att vara fördelaktig när vi fortsätter i statistiken.

Vi kommer att upptäcka att en typ av problem i statistiken kräver att vi hittar områden under delar av vilken klockkurva vi stöter på. Klockkurvan är inte en fin form för områden. Det är inte som en rektangel eller höger triangel som har lätt areaformler. Att hitta områden i delar av en klockkurva kan vara svårt, så svårt att vi faktiskt skulle behöva använda en del kalkyl. Om vi ​​inte standardiserar våra klockkurvor, skulle vi behöva göra en kalkyl varje gång vi vill hitta ett område. Om vi ​​standardiserar våra kurvor har allt arbete med att beräkna områden gjort för oss.

instagram story viewer