Ett histogram är en typ av graf som har stora tillämpningar i statistik. Histogram ger en visuell tolkning av numerisk data genom att ange antalet datapunkter som ligger inom ett värdeintervall. Dessa värden intervall kallas klasser eller fack. Frekvensen för data som faller i varje klass visas av en bar. Ju högre fältet är, desto större är frekvensen av datavärden i facket.
Histogram vs. Stapeldiagram
Vid första anblicken ser histogram mycket lik stapeldiagram. Båda graferna använder vertikala staplar för att representera data. En barns höjd motsvarar relativ frekvens av mängden data i klassen. Ju högre stapel, desto högre frekvens för data. Ju lägre stapel, desto lägre datafrekvens. Men utseende kan lura. Det är här som likheterna slutar mellan de två sorters grafer.
Anledningen till att dessa typer av grafer är olika har att göra med mätnivå för data. Å ena sidan används stapeldiagram för data på den nominella mätningsnivån. Stapeldiagram mäta frekvensen för kategoriska data, och klasserna för ett stapeldiagram är dessa kategorier. Å andra sidan används histogram för data som är åtminstone vid
ordinär nivå av mätning. Klasserna för ett histogram är värden.En annan viktig skillnad mellan stapeldiagram och histogram har att göra med beställningen av staplarna. I ett stapeldiagram är det vanligt att ordna stängerna i följd av minskande höjd. Emellertid kan staplarna i ett histogram inte ordnas om. De måste visas i den ordning klasserna inträffar.
Exempel på ett histogram
Diagrammet ovan visar oss ett histogram. Anta att fyra mynt vänds och resultaten registreras. Användningen av lämpliga binomial distributionstabell eller enkla beräkningar med binomialformeln visar sannolikheten för att inga huvuden visar är 1/16, sannolikheten för att ett huvud visar är 4/16. Sannolikheten för två huvuden är 6/16. Sannolikheten för tre huvuden är 4/16. Sannolikheten för fyra huvuden är 1/16.
Vi konstruerar totalt fem klasser, vardera med bredd en. Dessa klasser motsvarar antalet möjliga huvuden: noll, en, två, tre eller fyra. Ovanför varje klass ritar vi en vertikal stapel eller rektangel. Höjden på dessa staplar motsvarar de sannolikheter som nämns för vårt sannolikhetsexperiment att vända fyra mynt och räkna huvuden.
Histogram och sannolikheter
Ovanstående exempel visar inte bara konstruktionen av ett histogram, utan visar också det diskreta sannolikhetsfördelningar kan representeras med ett histogram. Faktum är att och diskret sannolikhetsfördelning kan representeras av ett histogram.
För att konstruera ett histogram som representerar en sannolikhetsfördelning, börjar vi med att välja klasserna. Dessa bör vara resultatet av ett sannolikhetsexperiment. Bredden på var och en av dessa klasser bör vara en enhet. Höjderna på staplarna i histogrammet är sannolikheten för vart och ett av resultaten. Med ett histogram konstruerat på ett sådant sätt är områdena i staplarna också troliga.
Eftersom den här typen av histogram ger oss sannolikheter är det föremål för ett par villkor. En bestämmelse är att endast icke-negativa siffror kan användas för den skala som ger oss höjden på en given stapel i histogrammet. Ett andra villkor är att eftersom sannolikheten är lika med området, måste alla områden på stängerna lägga till totalt en, motsvarande 100%.
Histogram och andra applikationer
Stängerna i ett histogram behöver inte vara troliga. Histogram är användbara på andra områden än sannolikhet. När vi vill jämföra frekvensen av förekomst av kvantitativa data som ett histogram kan använda för att skildra vår datauppsättning.