Verschillen tussen populatie en standaardafwijkingen van steekproeven

Bij het overwegen van standaardafwijkingen kan het een verrassing zijn dat er eigenlijk twee zijn die kunnen worden overwogen. Er is een populatiestandaarddeviatie en er is een steekproefstandaardafwijking. We zullen een onderscheid maken tussen deze twee en hun verschillen benadrukken.

Kwalitatieve verschillen

Hoewel beide standaarddeviaties variabiliteit meten, zijn er verschillen tussen een populatie en een standaarddeviatie van een steekproef. De eerste heeft te maken met het onderscheid tussen statistieken en parameters. De populatiestandaarddeviatie is een parameter, die een vaste waarde is die wordt berekend op basis van elk individu in de populatie.

Een standaarddeviatie van een steekproef is een statistiek. Dit betekent dat het wordt berekend op basis van slechts enkele individuen in een populatie. Omdat de standaarddeviatie van de steekproef van de steekproef afhangt, heeft deze een grotere variabiliteit. De standaardafwijking van de steekproef is dus groter dan die van de populatie.

Kwantitatief verschil

We zullen zien hoe deze twee soorten standaardafwijkingen numeriek van elkaar verschillen. Om dit te doen beschouwen we de formules voor zowel de standaarddeviatie van de steekproef als de standaarddeviatie van de populatie.

De formules om beide standaardafwijkingen te berekenen zijn vrijwel identiek:

Bereken het gemiddelde.
Trek het gemiddelde van elke waarde af om afwijkingen van het gemiddelde te verkrijgen.
Vierkant van alle afwijkingen.
Tel al deze kwadratische afwijkingen bij elkaar op.

Nu verschilt de berekening van deze standaardafwijkingen:

Als we de standaarddeviatie van de populatie berekenen, delen we door n, het aantal gegevenswaarden.
Als we de standaarddeviatie van de steekproef berekenen, delen we door n -1, één minder dan het aantal gegevenswaarden.

De laatste stap, in een van de twee gevallen die we overwegen, is om de vierkantswortel van het quotiënt uit de vorige stap te nemen.

Hoe groter de waarde van n is, hoe dichter de populatie en standaardafwijkingen van de steekproef zullen zijn.

Voorbeeld berekening

Om deze twee berekeningen te vergelijken, beginnen we met dezelfde gegevensset:

1, 2, 4, 5, 8

Vervolgens voeren we alle stappen uit die beide berekeningen gemeen hebben. Hierop volgend zullen berekeningen van elkaar verschillen en zullen we een onderscheid maken tussen de populatie en steekproefstandaardafwijkingen.

Het gemiddelde is (1 + 2 + 4 + 5 + 8) / 5 = 20/5 = 4.

De afwijkingen worden gevonden door het gemiddelde van elke waarde af te trekken:

Wetenschap