Alla data skapas inte lika. Det är bra att klassificera datasätt enligt olika kriterier. Några är det kvantitativ, och några är kvalitativ. Vissa datamängder är kontinuerliga och andra är diskreta.
Ett annat sätt att separera data är att klassificera dem i fyra nivåer av mätning: nominell, ordinal, intervall och förhållande. Olika mätnivåer kräver olika statistiska tekniker. Vi kommer att titta på var och en av dessa mätningsnivåer.
Nominell mätnivå
Den nominella mätningsnivån är den lägsta av de fyra sätten att karakterisera data. Nominal betyder "endast i namn" och det bör hjälpa till att komma ihåg vad denna nivå handlar om. Nominella uppgifter behandlar namn, kategorier eller etiketter.
Data på nominell nivå är kvalitativa. Färger på ögon, ja eller nej svar på en undersökning och favoritfrukost spannmål alla handlar om den nominella mätnivån. Även vissa saker med nummer som är associerade med dem, till exempel ett nummer på baksidan av en fotbollströja, är nominella eftersom det används för att "namnge" en enskild spelare på planen.
Data på denna nivå kan inte beställas på ett meningsfullt sätt, och det är meningslöst att beräkna saker som medel och standardavvikelser.
Ordinär mätnivå
Nästa nivå kallas den ordinära mätnivån. Data på denna nivå kan beställas, men inga skillnader mellan uppgifterna kan tas som är meningsfulla.
Här bör du tänka på saker som en lista över de tio bästa städerna att bo. Uppgifterna, här tio städer, rankas från en till tio, men skillnaderna mellan städerna har inte mycket mening. Det finns inget sätt att titta på rankningarna bara för att veta hur bättre livet är i stad nummer 1 än stad nummer 2.
Ett annat exempel på detta är bokstavsklass. Du kan beställa saker så att A är högre än en B, men utan någon annan information finns det inget sätt att veta hur mycket bättre en A är från en B.
Som med nominell nivå, data på ordinär nivå bör inte användas i beräkningar.
Mätningsnivå
Mätningsnivån handlar om data som kan beställas och i vilka skillnader mellan uppgifterna är vettiga. Data på denna nivå har ingen utgångspunkt.
De Fahrenheit och Celsius vågar temperaturer är båda exempel på data vid intervallnivå för mätning. Du kan prata om att 30 grader är 60 grader mindre än 90 grader, så skillnader är vettiga. Emellertid representerar 0 grader (i båda vågarna) kallt som det inte är den totala frånvaron av temperatur.
Data på intervallnivån kan användas i beräkningar. Men data på denna nivå saknar en typ av jämförelse. Trots att 3 x 30 = 90 är det inte korrekt att säga att 90 grader är tre gånger så varmt som 30 grader.
Mätningsnivå
Den fjärde och högsta mätnivån är kvoten. Data på förhållandenivån har alla funktioner i intervallnivån, utöver ett nollvärde. På grund av närvaron av noll är det nu vettigt att jämföra mätförhållandena. Fraser som "fyra gånger" och "två gånger" är meningsfulla på kvoten.
Avstånd, i vilket mätsystem som helst, ger oss data på förhållandenivån. En mätning som 0 fot är vettig eftersom den inte representerar någon längd. Dessutom är 2 fot dubbelt så lång som 1 fot. Så förhållanden kan bildas mellan data.
Vid förhållanden i mätningsnivån kan inte bara summor och skillnader beräknas utan också förhållanden. En mätning kan delas med valfri mätning utan noll, och ett meningsfullt antal kommer att resultera.
Tänk innan du beräknar
Med en lista över personnummer är det möjligt att göra alla möjliga beräkningar med dem, men ingen av dessa beräkningar ger något meningsfullt. Vad är ett personnummer dividerat med ett annat? Ett fullständigt slöseri med din tid, eftersom personnummer är på den nominella mätnivån.
När du får några data, tänk innan du beräknar. Mätningsnivån du arbetar med kommer att avgöra vad det är vettigt att göra.