Det finns verkligen ingen regel för hur många klasser det ska finnas. Det finns ett par saker att tänka på när det gäller antalet klasser. Om det bara fanns en klass skulle alla data falla in i denna klass. Vårt histogram skulle helt enkelt vara en enda rektangel med höjden angiven av antalet element i vår uppsättning data. Detta skulle inte vara till någon hjälp eller användbart histogram.
I det andra extrema kan vi ha en mängd klasser. Detta skulle resultera i en mängd barer, varav ingen förmodligen skulle vara väldigt hög. Det skulle vara mycket svårt att bestämma några särskiljningsegenskaper från data genom att använda denna typ av histogram.
För att skydda mot dessa två ytterligheter har vi en tumregel att använda för att bestämma antalet klasser för ett histogram. När vi har en relativt liten uppsättning data använder vi vanligtvis bara cirka fem klasser. Om datauppsättningen är relativt stor använder vi cirka 20 klasser.
Låt återigen betonas att detta är en tumregel, inte en absolut statistisk princip. Det kan finnas goda skäl att ha ett annat antal klasser för data. Vi kommer att se ett exempel på detta nedan.
Innan vi överväger några exempel, kommer vi att se hur vi bestämmer vilka klasser som faktiskt är. Vi börjar denna process med att hitta räckvidd av våra uppgifter. Med andra ord subtraherar vi det lägsta datavärdet från det högsta datavärdet.
När datamängden är relativt liten delar vi intervallet med fem. Kvoten är bredden på klasserna för vårt histogram. Vi kommer förmodligen att behöva göra några avrundningar i den här processen, vilket innebär att det totala antalet klasser kanske inte hamnar på fem.
När datamängden är relativt stor delar vi intervallet med 20. Precis som tidigare ger detta delningsproblem oss bredden på klasserna för vårt histogram. Som vi såg tidigare kan vår avrundning resultera i något mer eller något mindre än 20 klasser.
I någon av de stora eller små datamängdsfallen får vi den första klassen att börja vid en punkt som är något mindre än det minsta datavärdet. Vi måste göra detta på ett sådant sätt att det första datavärdet faller i den första klassen. Andra efterföljande klasser bestäms av bredden som ställdes in när vi delade intervallet. Vi vet att vi är i den sista klassen när vårt högsta datavärde innehåller denna klass.
För ett exempel kommer vi att bestämma en lämplig klassbredd och klasser för datauppsättningen: 1.1, 1.9, 2.3, 3.0, 3.2, 4.1, 4.2, 4.4, 5.5, 5.5, 5.6, 5.7, 5.9, 6.2, 7.1, 7.9, 8.3, 9.0, 9.2, 11.1, 11.2, 14.4, 15.5, 15.5, 16.7, 18.9, 19.2.
Vi ser att det finns 27 datapunkter i vår uppsättning. Detta är en relativt liten uppsättning och så kommer vi att dela intervallet med fem. Området är 19.2 - 1.1 = 18.1. Vi delar upp 18,1 / 5 = 3,62. Detta innebär att en klassbredd på 4 skulle vara lämplig. Vårt minsta datavärde är 1,1, så vi startar den första klassen på en punkt mindre än denna. Eftersom våra uppgifter består av positiva siffror, skulle det vara meningsfullt att låta den första klassen gå från 0 till 4.
För ett exempel på detta, anta att det finns ett flervalstest med 35 frågor om det, och 1000 elever på en gymnasium tar testet. Vi vill bilda ett histogram som visar antalet elever som uppnådde vissa poäng på testet. Vi ser att 35/5 = 7 och att 35/20 = 1,75. Trots att vår tumregel ger oss valet om klasser med bredd 2 eller 7 att använda för vårt histogram kan det vara bättre att ha klasser med bredd 1. Dessa klasser skulle motsvara varje fråga som en elev svarade korrekt i testet. Den första av dessa skulle vara centrerad vid 0 och den sista skulle vara centrerad på 35.