Wat is een populatie in de statistiek?

In statistieken wordt de term populatie gebruikt om de onderwerpen van een bepaalde studie te beschrijven - alles of iedereen die het onderwerp is van een statistische waarneming. Populaties kunnen groot of klein zijn en worden gedefinieerd door een aantal kenmerken, hoewel deze groepen meestal specifiek worden gedefinieerd in plaats van vaag, bijvoorbeeld een populatie van vrouwen ouder dan 18 die koffie kopen bij Starbucks in plaats van een populatie van vrouwen ouder dan 18.

Statistische populaties worden gebruikt om gedrag, trends en patronen te observeren in de manier waarop individuen in een gedefinieerde groep omgaan met de wereld om hen heen, waardoor statistici conclusies kunnen trekken over de kenmerken van de onderwerpen van onderzoek, hoewel deze onderwerpen meestal mensen, dieren zijn en planten, en zelfs objecten zoals sterren.

Belang van populaties

Het Australian Government Bureau of Statistics merkt op:

Het is belangrijk om de doelpopulatie die wordt bestudeerd te begrijpen, zodat u kunt begrijpen naar wie of wat de gegevens verwijzen. Als u niet duidelijk hebt bepaald wie of wat u in uw populatie wilt, kunt u gegevens krijgen die niet nuttig voor u zijn.  

Er zijn natuurlijk bepaalde beperkingen aan het bestuderen van populaties, meestal omdat het zeldzaam is om alle individuen in een bepaalde groep te kunnen observeren. Om deze reden bestuderen wetenschappers die statistieken gebruiken ook subpopulaties en nemen ze statistische steekproeven van kleine porties van grotere populaties om het volledige spectrum van gedragingen en kenmerken van de populatie in het algemeen nauwkeuriger te analyseren..

Wat vormt een bevolking?

Een statistische populatie is elke groep individuen die het onderwerp van een studie is, wat betekent dat bijna alles een populatie kan vormen, zolang de individuen kunnen worden gegroepeerd op basis van een gemeenschappelijk kenmerk, of soms twee gemeenschappelijke kenmerken. Bijvoorbeeld, in een onderzoek dat probeert het gemiddelde gewicht van alle 20-jarige mannen in de Verenigde Staten te bepalen, zou de populatie alle 20-jarige mannen in de Verenigde Staten zijn.

Een ander voorbeeld zou een studie zijn die onderzoekt hoeveel mensen in Argentinië wonen, waarbij de bevolking bestaat uit elke persoon die in Argentinië woont, ongeacht het staatsburgerschap, de leeftijd of het geslacht. De populatie in een afzonderlijk onderzoek dat vroeg hoeveel mannen onder de 25 in Argentinië woonden, zou daarentegen allemaal mannen kunnen zijn die 24 zijn of jonger die in Argentinië wonen, ongeacht hun nationaliteit.

Statistische populaties kunnen zo vaag of specifiek zijn als de wensen van de statisticus; het hangt uiteindelijk af van het doel van het onderzoek dat wordt uitgevoerd. Een koeienboer zou niet willen weten hoeveel rode vrouwelijke koeien hij bezit; in plaats daarvan zou hij de gegevens willen weten over het aantal vrouwelijke koeien dat nog in staat is om kalveren te produceren. Die boer zou de laatste willen selecteren als zijn studiepopulatie.

Populatiegegevens in actie

Er zijn veel manieren waarop u bevolkingsgegevens in statistieken kunt gebruiken. StatisticsShowHowto.com legt een leuk scenario uit waarin u de verleiding weerstaat en een snoepwinkel binnenloopt, waar de eigenaar misschien een paar voorbeelden van haar producten aanbiedt. Je zou van elk monster één snoepje eten; je zou niet willen eten van elk snoepje in de winkel. Dat zou het nemen van monsters van honderden potten vereisen, en je zou waarschijnlijk behoorlijk ziek worden. In plaats daarvan legt de statistische website uit:

"Je kunt je mening over de snoeplijn van de hele winkel baseren op (alleen) de monsters die ze te bieden hebben. Dezelfde logica geldt voor de meeste enquêtes in statistieken. Je wilt alleen een steekproef nemen van de hele populatie ( "Populatie" in dit voorbeeld zou de hele snoeplijn zijn). Het resultaat is een statistiek over die populatie. "

Het statistiekbureau van de Australische regering geeft een aantal andere voorbeelden, die hier enigszins zijn aangepast. Stel je voor dat je alleen mensen wilt bestuderen die in de Verenigde Staten wonen die in het buitenland zijn geboren - een hot politiek onderwerp vandaag in het licht van het verhitte nationale debat over immigratie. In plaats daarvan keek u echter per ongeluk naar alle mensen die in dit land zijn geboren. De gegevens bevatten veel mensen die je niet wilt bestuderen. "Je zou kunnen eindigen met gegevens die je niet nodig hebt omdat je doelpopulatie niet duidelijk was gedefinieerd, merkt het statistiekbureau op. 

Een ander relevant onderzoek zou een blik kunnen zijn op alle basisschoolkinderen die frisdrank drinken. Je zou de doelpopulatie duidelijk moeten definiëren als "basisschoolkinderen" en "degenen die frisdrank drinken", anders zou je kunnen eindigen met gegevens die alle schoolkinderen omvatten (niet alleen leerlingen in het basisonderwijs) en / of alle degenen die frisdrank drinken. De opname van oudere kinderen en / of degenen die geen frisdrank drinken, zou je resultaten scheeftrekken en zou de studie waarschijnlijk onbruikbaar maken.

Beperkte middelen

Hoewel de totale populatie is wat wetenschappers willen bestuderen, is het zeer zeldzaam om een ​​telling van elk individueel lid van de populatie te kunnen uitvoeren. Vanwege beperkingen van middelen, tijd en toegankelijkheid is het bijna onmogelijk om een ​​meting op elk onderwerp uit te voeren. Als gevolg hiervan gebruiken veel statistici, sociale wetenschappers en anderen inferentiële statistieken, waar wetenschappers slechts een klein deel van de bevolking kunnen bestuderen en toch tastbare resultaten kunnen waarnemen.

In plaats van metingen uit te voeren op elk lid van de bevolking, beschouwen wetenschappers een deelverzameling van deze populatie als een statistische steekproef. Deze steekproeven bieden metingen van de individuen die wetenschappers vertellen over overeenkomstige metingen in de populatie, die vervolgens kunnen worden herhaald en vergeleken met verschillende statistische steekproeven om de gehele populatie nauwkeuriger te beschrijven.

Bevolking subsets

De vraag welke bevolkingssubets moeten worden geselecteerd, is dus van groot belang bij de studie van statistieken, en er zijn verschillende manieren om een ​​steekproef te selecteren, waarvan vele geen betekenisvolle resultaten opleveren. Om deze reden zijn wetenschappers voortdurend op zoek naar potentiële subpopulaties omdat ze doorgaans betere resultaten behalen bij het herkennen van de mix van soorten individuen in de populaties die worden bestudeerd.

Verschillende steekproeftechnieken, zoals het vormen van gelaagde steekproeven, kunnen helpen bij het omgaan met subpopulaties, en veel van deze technieken gaan ervan uit dat een specifiek type steekproef, een eenvoudige willekeurige steekproef genoemd, uit de populatie is geselecteerd.