Ordet "data" visas i hela statistiken. Det finns många olika klassificeringar av data. Data kan vara kvantitativ eller kvalitativ, diskret eller kontinuerligt. Trots den vanliga användningen av orddata missbrukas de ofta. Det primära problemet med användningen av detta begrepp härrör från brist på kunskap om huruvida orddata är singular eller plural.
Om data är ett enskilt ord, vad är då flertalet av data? Denna fråga är faktiskt fel att ställa. Detta beror på att orddata redan är flertal. Den verkliga frågan vi bör ställa är: "Vad är den enskilda formen av orddata?" Svaret på denna fråga är "datum".
Det visar sig att detta inträffar av en mycket intressant anledning. För att förklara varför vi måste gå lite djupare in i döda språkens värld.
Lite latin
Vi börjar med historien om ordet datum. Ordet datum är från Latinska språket. Datum är en substantivoch på latin betyder termen datum "något som ges." Detta substantiv kommer från den andra försämringen på latin. Detta betyder att alla substantiv i denna form som har en singulär form som slutar med -um har en plural form som slutar i -a. Även om detta kan verka konstigt, liknar det en vanlig regel på engelska. De flesta singulariska substantiv görs plural genom att lägga till en "s" eller kanske "es" i slutet av ordet.
Vad all denna latinska grammatik betyder är att flertalet av datum är data. Så det är korrekt att tala om ett datum och flera data.
Data och Datum
Även om vissa behandlar orddata som ett kollektivt substantiv som hänvisar till en insamling av information, känner de flesta som skriver i statistik ursprunget till ordet. En enda information är ett datum, mer än en är data. Som en konsekvens av att data är ett flertalsord är det korrekt att tala och skriva om "dessa data" snarare än "dessa data." På samma linje skulle vi säga att "uppgifterna är... "snarare än" uppgifterna är... "
Ett sätt att undvika denna fråga är att betrakta all data som en uppsättning. Då kan vi prata om en enkel uppsättning data.
Leta efter exemplen på missbruk
En kort frågesport kan ytterligare hjälpa till att reda ut rätt sätt att använda termen data. Nedan finns fem uttalanden. Bestäm vilka två som är felaktiga.
- Datauppsättningen användes av alla i statistikklassen.
- Uppgifterna användes av alla i statistikklassen.
- Uppgifterna användes av alla i statistikklassen.
- Datauppsättningen användes av alla i statistikklassen.
- Uppgifterna från uppsättningen användes av alla i statistikklassen.
Uttalande nr 2 behandlar inte data som ett flertal, och det är därför felaktigt. Uttalande 4 behandlar felaktigt orduppsättningen som ett plural, medan det är singular. Resten av uttalandena är korrekta. Uttalande nr 5 är något knepigt eftersom orduppsättningen är en del av prepositionsfras "från uppsättningen."
Grammatik och statistik
Det finns inte många platser där ämnena grammatik och statistik korsar varandra, men detta är ett viktigt. Med lite övning blir det lätt att använda orddata och datum korrekt.