7 diagram som vanligtvis används i statistik

Ett mål av statistik är att presentera data på ett meningsfullt sätt. Ofta innebär datamängder miljoner (om inte miljarder) värden. Detta är alldeles för många för att skriva ut i en tidningsartikel eller sidofält för en magasinhistoria. Det är där grafer kan vara ovärderliga, vilket gör att statistiker kan ge en visuell tolkning av komplexa numeriska berättelser. Sju typer av diagram används ofta i statistik.

Bra diagram överför information snabbt och enkelt till användaren. Graferna markerar dataens framträdande funktioner. De kan visa förhållanden som inte är uppenbara från att studera en lista med siffror. De kan också ge ett bekvämt sätt att jämföra olika uppsättningar av data.

Olika situationer kräver olika typer av grafer, och det hjälper till att ha god kunskap om vilka typer som finns tillgängliga. Datatypen avgör ofta vilken graf som är lämplig att använda. Kvalitativa data, kvantitativa data, och parade data var och en använder olika typer av grafer.

EN Pareto-diagram eller stapeldiagram är ett sätt att visuellt representera kvalitativa data. Data visas antingen horisontellt eller vertikalt och gör det möjligt för tittarna att jämföra objekt, såsom mängder, egenskaper, tider och frekvens. Stängerna är ordnade i frekvensordning, så viktiga kategorier betonas. Genom att titta på alla staplar är det enkelt att snabbt se vilka kategorier i en uppsättning data som dominerar de andra.

instagram viewer
Stapeldiagram kan vara antingen singel, staplad eller grupperad.

Vilfredo Pareto (1848–1923) utvecklade stapeldiagrammet när han försökte ge ekonomiskt beslutsfattande ett mer "mänskligt" ansikte att plotta data på grafpapper, med inkomst på en axel och antalet personer på olika inkomstnivåer på Övrig. Resultaten var slående: De visade dramatiskt skillnaden mellan rika och fattiga i varje era under århundraden.

Ett annat vanligt sätt att representera data grafiskt är ett tårtdiagram. Det får sitt namn från hur det ser ut, precis som en cirkulär paj som har skurits i flera skivor. Den här typen av diagram är användbar vid gradering av kvalitativa data, där informationen beskriver ett drag eller attribut och inte är numeriskt. Varje skiva paj representerar en annan kategori, och varje egenskap motsvarar en annan skiva i pajen; vissa skivor brukar märkas större än andra. Genom att titta på alla pajstyckena kan du jämföra hur mycket av data som passar i varje kategori eller skiva.

EN histogram i en annan typ av graf som använder staplar i displayen. Denna typ av diagram används med kvantitativa data. Värdena, kallad klasser, listas längst ner och klasserna med större frekvenser har högre staplar.

Ett histogram ser ofta ut som ett stapeldiagram, men de är olika på grund av mätnivå av uppgifterna. Stapeldiagram mäter frekvensen för kategoriska data. En kategorisk variabel är en som har två eller flera kategorier, till exempel kön eller hårfärg. Histogram används däremot för data som involverar ordinära variabler eller saker som inte lätt kan kvantifieras, som känslor eller åsikter.

EN stjälk- och bladplott bryter varje värde på en kvantitativ datamängd i två delar: en stam, vanligtvis för det högsta platsvärdet, och ett blad för de andra platsvärdena. Det ger ett sätt att lista alla datavärden i en kompakt form. Om du till exempel använder den här grafen för att granska studenttestresultaten 84, 65, 78, 75, 89, 90, 88, 83, 72, 91 och 90, skulle stjälkarna vara 6, 7, 8 och 9, motsvarande tiotalsplatsen för data. Bladen - siffrorna till höger om en solid linje - skulle vara 0, 0, 1 bredvid 9; 3, 4, 8, 9 bredvid de 8; 2, 5, 8 bredvid 7; och 2 bredvid 6.

Detta skulle visa dig att fyra elever gjorde poäng på 90-talet percentilen, tre studenter i 80-talet, två på 70-talet och endast en på 60-talet. Du skulle till och med kunna se hur bra elever i varje percentil presterade, vilket gör detta till ett bra diagram för att förstå hur väl eleverna förstår materialet.

EN prickplot är en hybrid mellan ett histogram och en stjälk- och bladplott. Varje kvantitativt datavärde blir en punkt eller punkt som är placerad över lämpliga klassvärden. Där histogram använder rektanglar - eller staplar - använder dessa diagram prickar, som sedan sammanfogas med en enkel linje, säger statisticshowto.com. Punktkarta är ett bra sätt att jämföra hur lång tid det tar en grupp på sex eller sju individer att laga frukost, till exempel eller för att visa procentandelen människor i olika länder som har tillgång till el enligt MathIsFun.

EN spridningsdiagram visar data som är parade med en horisontell axel (x-axeln) och en vertikal axel (y-axeln). De statistiska verktygen för korrelation och regression används sedan för att visa trender på scatterplot. En spridplot ser vanligtvis ut som en linje eller kurva som rör sig upp eller ner från vänster till höger längs diagrammet med punkter "spridda" längs linjen. Spridplottet hjälper dig att upptäcka mer information om alla datauppsättningar, inklusive:

EN tidsserie graf visar data vid olika tidpunkter, så det är en annan typ av graf som ska användas för vissa typer av parade data. Som namnet antyder mäter denna typ av diagram trender över tiden, men tidsramen kan vara minuter, timmar, dagar, månader, år, årtionden eller århundraden. Till exempel kan du använda den här typen av diagram för att plotta befolkningen i USA under ett sekel. Y-axeln skulle lista den växande befolkningen, medan x-axeln listade åren, som 1900, 1950, 2000.