Het woord 'data' komt overal in de statistieken voor. Er zijn veel verschillende gegevensclassificaties. Gegevens kunnen kwantitatief of kwalitatief, discreet of continu zijn. Ondanks het veel voorkomende gebruik van het woord data, wordt het vaak misbruikt. Het primaire probleem met het gebruik van deze term komt voort uit een gebrek aan kennis over of het woord data enkelvoud of meervoud is.
Als data een enkelvoudig woord is, wat is dan het meervoud van data? Deze vraag is eigenlijk de verkeerde om te stellen. Dit komt omdat het woord data al meervoud is. De echte vraag die we ons moeten stellen is: "Wat is de enkelvoudige vorm van het woord data?" Het antwoord op deze vraag is "datum".
Het blijkt dat dit om een zeer interessante reden gebeurt. Om uit te leggen waarom we wat dieper in de wereld van dode talen moeten gaan.
We beginnen met de geschiedenis van het woord datum. Het woord datum komt uit de Latijnse taal. Datum is een zelfstandig naamwoord en in het Latijn betekent de term datum 'iets gegeven'. Dit zelfstandig naamwoord komt uit de tweede verbuiging in het Latijn. Dit betekent dat alle zelfstandige naamwoorden van deze vorm die een enkelvoudige vorm hebben die eindigt op -um, een meervoud hebben die eindigt op -a. Hoewel dit misschien vreemd lijkt, is het vergelijkbaar met een algemene regel in het Engels. De meeste enkelvoudige zelfstandige naamwoorden worden meervoudig gemaakt door een "s", of misschien "es" toe te voegen aan het einde van het woord.
Wat al deze Latijnse grammatica betekent, is dat het meervoud van datum gegevens is. Het is dus correct om van één datum en meerdere gegevens te spreken.
Hoewel sommigen de woordgegevens behandelen als een verzamelnaam die verwijst naar een verzameling informatie, herkent het meeste schrijven in statistieken de oorsprong van het woord. Een enkel stukje informatie is een datum, meer dan één zijn data. Omdat gegevens een meervoud zijn, is het correct om te spreken en te schrijven over "deze gegevens" in plaats van "deze gegevens". In dezelfde zin zouden we zeggen dat "de gegevens ..." zijn in plaats van "de gegevens zijn ... "
Een manier om dit probleem te omzeilen is om alle gegevens als een set te beschouwen. Dan kunnen we het hebben over een enkele set gegevens.
Een korte quiz kan verder helpen bij het uitzoeken van de juiste manier om de termgegevens te gebruiken. Hieronder staan vijf verklaringen. Bepaal welke twee onjuist zijn.
Verklaring # 2 behandelt gegevens niet als meervoud en is dus onjuist. Stelling # 4 behandelt het ingestelde woord als meervoud, terwijl het enkelvoud is. De rest van de verklaringen zijn correct. Stelling # 5 is enigszins lastig omdat de woordset onderdeel is van de voorzetselzin "uit de set".
Er zijn niet veel plaatsen waar de onderwerpen grammatica en statistieken elkaar kruisen, maar dit is een belangrijke. Met een beetje oefening wordt het gemakkelijk om de woorden data en datum correct te gebruiken.