In verschillende disciplines is het doel om een grote groep individuen te bestuderen. Deze groepen kunnen zo gevarieerd zijn als een soort vogel, eerstejaarsstudenten in de VS of auto's die over de hele wereld worden gereden. Statistieken worden in al deze onderzoeken gebruikt wanneer het niet haalbaar of zelfs onmogelijk is om elk lid van de betreffende groep te bestuderen. In plaats van de spanwijdte van elke vogel van een soort te meten, enquêtevragen te stellen aan elke eerstejaarsstudent of het brandstofverbruik van elke auto ter wereld te meten, bestuderen en meten we in plaats daarvan een deel van de groep.
De verzameling van alles of iedereen die in een onderzoek moet worden geanalyseerd, wordt een populatie genoemd. Zoals we in de bovenstaande voorbeelden hebben gezien, kan de populatie enorm groot zijn. Er kunnen miljoenen of zelfs miljarden mensen in de bevolking zijn. Maar we moeten niet denken dat de bevolking groot moet zijn. Als onze groep die wordt bestudeerd vierde klas is in een bepaalde school, bestaat de bevolking alleen uit deze studenten. Afhankelijk van de schoolgrootte kunnen dit minder dan honderd studenten in onze populatie zijn.
Om ons onderzoek qua tijd en middelen goedkoper te maken, bestuderen we slechts een deel van de bevolking. Deze subset wordt een voorbeeld genoemd. Monsters kunnen behoorlijk groot of vrij klein zijn. In theorie vormt een individu uit een populatie een steekproef. Veel statistische toepassingen vereisen dat een steekproef ten minste 30 personen bevat.
Waar we doorgaans naar op zoek zijn in een onderzoek is de parameter. Een parameter is een numerieke waarde die iets zegt over de gehele populatie die wordt bestudeerd. We willen bijvoorbeeld de gemiddelde spanwijdte van de Amerikaanse Amerikaanse zeearend kennen. Dit is een parameter omdat deze de gehele populatie beschrijft.
Parameters zijn moeilijk, zo niet onmogelijk om precies te verkrijgen. Anderzijds heeft elke parameter een overeenkomstige statistiek die exact kan worden gemeten. Een statistiek is een numerieke waarde die iets zegt over een monster. Om het bovenstaande voorbeeld uit te breiden, kunnen we 100 zeearenden vangen en vervolgens de spanwijdte van elk van deze meten. De gemiddelde spanwijdte van de 100 adelaars die we hebben gevangen is een statistiek.
De waarde van een parameter is een vast nummer. In tegenstelling tot dit, omdat een statistiek afhankelijk is van een steekproef, kan de waarde van een statistiek van steekproef tot steekproef variëren. Stel dat onze populatieparameter een voor ons onbekende waarde heeft van 10. Eén steekproef van maat 50 heeft de bijbehorende statistiek met waarde 9,5. Een andere steekproef van maat 50 uit dezelfde populatie heeft de overeenkomstige statistiek met waarde 11.1.
Het uiteindelijke doel van het veld statistieken is om een populatieparameter te schatten met behulp van steekproefstatistieken.
Er is een eenvoudige en duidelijke manier om te onthouden wat een parameter en statistiek meten. Het enige dat we moeten doen, is kijken naar de eerste letter van elk woord. Een parameter meet iets in een populatie en een statistiek meet iets in een steekproef.
Hieronder volgen nog enkele voorbeelden van parameters en statistieken: