Klockkurva och definition av normal distribution

Termen klockkurva används för att beskriva det matematiska begreppet som kallas normalfördelning, ibland kallad Gaussisk distribution. "Klockkurva" avser klockformen som skapas när en linje plottas med hjälp av datapunkterna för ett objekt som uppfyller kriterierna för normalfördelning.

I en klockkurva innehåller mitten det största antalet värden och därför är det den högsta punkten på linjens båge. Denna punkt hänvisas till betyda, men i enkla termer är det det högsta antalet förekomster av ett element (i statistiska termer, läget).

Normal distribution

Det viktiga att notera om a normal distribution är att kurvan är koncentrerad i mitten och minskar på båda sidor. Detta är betydelsefullt i och med att uppgifterna har mindre benägenhet att producera ovanligt extrema värden, så kallade outliers, jämfört med andra distributioner. Klockkurvan betyder också att data är symmetriska. Detta innebär att du kan skapa rimliga förväntningar på möjligheten att ett resultat kommer att ligga inom ett område till vänster eller höger om mitten, när du har uppmätt mängden avvikelse i data. Detta mäts i termer av

instagram viewer
standardavvikelser.

En klockkurvdiagram beror på två faktorer: medelvärdet och standardavvikelsen. Medlet identifierar centrumets position och standardavvikelsen bestämmer klockans höjd och bredd. Till exempel skapar en stor standardavvikelse en klocka som är kort och bred medan en liten standardavvikelse skapar en hög och smal kurva.

Klockkurvsannolikhet och standardavvikelse

För att förstå sannolikhetsfaktorerna för en normalfördelning måste du förstå följande regler:

  1. Det totala området under kurvan är lika med 1 (100%)
  2. Cirka 68% av området under kurvan faller inom en standardavvikelse.
  3. Cirka 95% av området under kurvan faller inom två standardavvikelser.
  4. Cirka 99,7% av området under kurvan faller inom tre standardavvikelser.

Artiklarna 2, 3 och 4 ovan kallas ibland den empiriska regeln eller 68–95–99,7-regeln. När du har bestämt att uppgifterna normalt distribueras (klocka böjd) och beräkna medelvärdet och standardavvikelse, kan du bestämma sannolikhet att en enda datapunkt kommer att falla inom ett givet antal möjligheter.

Bell Curve Exempel

Ett bra exempel på en klockkurva eller normalfördelning är rulle med två tärningar. Distributionen är centrerad kring siffran sju och sannolikheten minskar när du rör dig bort från mitten.

Här är den procentuella chansen för olika resultat när du rullar två tärningar.

  • Två: (1/36) 2.78%
  • Tre: (2/36) 5.56%
  • fyra: (3/36) 8.33%
  • Fem: (4/36) 11.11%
  • Sex: (5/36) 13.89%
  • sju: (6/36) 16,67% = mest troligt utfall
  • Åtta: (5/36) 13.89%
  • Nio: (4/36) 11.11%
  • Tio: (3/36) 8.33%
  • Elva: (2/36) 5.56%
  • Tolv: (1/36) 2.78%

Normala fördelningar har många praktiska egenskaper, så i många fall, särskilt i fysik och astronomislumpmässiga variationer med okända fördelningar antas ofta vara normala för att möjliggöra sannolikhetsberäkningar. Även om detta kan vara ett farligt antagande är det ofta en bra tillnärmning på grund av ett överraskande resultat känt som Centrala gränsvärdessatsen.

Denna sats säger att medelvärdet för varje uppsättning varianter med någon distribution med ett begränsat medelvärde och varians tenderar att uppstå i en normalfördelning. Många vanliga attribut som testresultat eller höjd följer ungefär normala fördelningar, med få medlemmar i de höga och låga ändarna och många i mitten.

När du inte ska använda klockkurvan

Det finns vissa typer av data som inte följer ett normalt distributionsmönster. Dessa datauppsättningar bör inte tvingas försöka passa en klockkurva. Ett klassiskt exempel skulle vara studentbetyg, som ofta har två lägen. Andra typer av data som inte följer kurvan inkluderar inkomster, befolkningsökning och mekaniska fel.

instagram story viewer