De standaarddeviatie van de steekproef is een beschrijvende statistiek die de spreiding van een kwantitatieve gegevensset meet. Dit getal kan elk niet-negatief reëel getal zijn. Aangezien nul een niet-negatief reëel getal is, lijkt het de moeite waard om te vragen: "Wanneer is de standaarddeviatie van de steekproef gelijk aan nul?" Dit gebeurt in het zeer speciale en zeer ongebruikelijke geval waarin al onze gegevenswaarden exact hetzelfde zijn. We zullen de redenen onderzoeken waarom.
Twee belangrijke vragen die we meestal willen beantwoorden over een gegevensset zijn:
Er zijn verschillende metingen, beschrijvende statistieken genoemd, die deze vragen beantwoorden. Het middelpunt van de gegevens, ook bekend als het gemiddelde, kan bijvoorbeeld worden beschreven in termen van het gemiddelde, de mediaan of de modus. Andere statistieken, die minder bekend zijn, kunnen worden gebruikt, zoals de midhinge of de trimean.
Voor de verspreiding van onze gegevens kunnen we het bereik, het interkwartielbereik of de standaardafwijking gebruiken. De standaarddeviatie is gekoppeld aan het gemiddelde om de verspreiding van onze gegevens te kwantificeren. We kunnen dit nummer vervolgens gebruiken om meerdere gegevenssets te vergelijken. Hoe groter onze standaarddeviatie, hoe groter de spreiding.
Laten we dus uit deze beschrijving overwegen wat het zou betekenen om een standaarddeviatie van nul te hebben. Dit zou erop duiden dat er helemaal geen verspreiding in onze gegevensset is. Alle individuele gegevenswaarden zouden worden samengevoegd tot een enkele waarde. Aangezien onze gegevens slechts één waarde zouden kunnen hebben, zou deze waarde het gemiddelde van onze steekproef vormen.
In deze situatie, wanneer al onze gegevenswaarden hetzelfde zijn, zou er geen enkele variatie zijn. Intuïtief is het logisch dat de standaardafwijking van een dergelijke gegevensset nul zou zijn.
De standaarddeviatie van het monster wordt gedefinieerd door een formule. Dus elke bewering zoals die hierboven moet worden bewezen met behulp van deze formule. We beginnen met een gegevensset die voldoet aan de bovenstaande beschrijving: alle waarden zijn identiek en die zijn er ook n waarden gelijk aan X.
We berekenen het gemiddelde van deze gegevensset en zien dat het zo is
X = (X + X +... + X) /n = nx/n = X.
Wanneer we nu de individuele afwijkingen van het gemiddelde berekenen, zien we dat al deze afwijkingen nul zijn. Bijgevolg zijn de variantie en ook de standaardafwijking beide gelijk aan nul.
We zien dat als de gegevensset geen variatie vertoont, de standaardafwijking nul is. We kunnen vragen of het omgekeerde van deze verklaring ook waar is. Om te zien of dit het geval is, zullen we de formule voor standaarddeviatie opnieuw gebruiken. Deze keer zullen we de standaardafwijking echter op nul instellen. We zullen geen aannames doen over onze dataset, maar zullen zien welke instelling s = 0 betekent
Stel dat de standaarddeviatie van een gegevensset gelijk is aan nul. Dit zou impliceren dat de steekproefvariantie s2 is ook gelijk aan nul. Het resultaat is de vergelijking:
0 = (1 / (n - 1)) ∑ (Xik - X )2
We vermenigvuldigen beide zijden van de vergelijking met n - 1 en zie dat de som van de gekwadrateerde afwijkingen gelijk is aan nul. Omdat we met reële getallen werken, is de enige manier om dit te laten gebeuren, door elk van de gekwadrateerde afwijkingen gelijk te stellen aan nul. Dit betekent dat voor iedereen ik, de voorwaarde (Xik - X )2 = 0.
We nemen nu de vierkantswortel van de bovenstaande vergelijking en zien dat elke afwijking van het gemiddelde gelijk moet zijn aan nul. Sinds voor iedereen ik,
Xik - X = 0
Dit betekent dat elke gegevenswaarde gelijk is aan het gemiddelde. Dit resultaat samen met het bovenstaande laat ons toe om te zeggen dat de standaardafwijking van de steekproef van een gegevensset nul is als en alleen als alle waarden identiek zijn.