Onafhankelijke en vertekende schatters

Een van de doelen van inferentiële statistieken is het schatten van onbekende populatieparameters. Deze schatting wordt uitgevoerd door betrouwbaarheidsintervallen te construeren uit statistische steekproeven. Eén vraag wordt: "Hoe goed van een schatter hebben we?" Met andere woorden: "Hoe nauwkeurig is ons statistische proces, op de lange termijn, van het schatten van onze populatieparameter. Een manier om de waarde van een schatter te bepalen, is te overwegen of deze onbevooroordeeld is. Voor deze analyse moeten we de verwachte waarde van onze statistiek vinden.

Parameters en statistieken

We beginnen met het overwegen van parameters en statistieken. We beschouwen willekeurige variabelen van een bekend type distributie, maar met een onbekende parameter in deze distributie. Deze parameter maakte deel uit van een populatie, of het kon deel uitmaken van een waarschijnlijkheidsdichtheidsfunctie. We hebben ook een functie van onze willekeurige variabelen, en dit wordt een statistiek genoemd. De statistiek (X1, X2,..., Xn) schat de parameter T, en daarom noemen we het een schatter van T.

Onafhankelijke en vertekende schatters

We definiëren nu onpartijdige en bevooroordeelde schatters. We willen dat onze schatter op de lange termijn overeenkomt met onze parameter. In meer precieze taal willen we dat de verwachte waarde van onze statistiek gelijk is aan de parameter. Als dit het geval is, zeggen we dat onze statistiek een onbevooroordeelde schatter van de parameter is.

Als een schatter geen onbevooroordeelde schatter is, dan is het een bevooroordeelde schatter. Hoewel een bevooroordeelde schatter geen goede afstemming van zijn verwachte waarde op zijn parameter heeft, zijn er veel praktische gevallen waarin een bevooroordeelde schatter nuttig kan zijn. Een dergelijk geval is wanneer een plus-vier betrouwbaarheidsinterval wordt gebruikt om een ​​betrouwbaarheidsinterval voor een populatie-aandeel te construeren.

Voorbeeld voor middelen

Om te zien hoe dit idee werkt, zullen we een voorbeeld onderzoeken dat betrekking heeft op het gemiddelde. De statistiek

(X1 + X2 +... + Xn) / N

staat bekend als het steekproefgemiddelde. We veronderstellen dat de willekeurige variabelen een willekeurige steekproef zijn uit dezelfde verdeling met gemiddelde μ. Dit betekent dat de verwachte waarde van elke willekeurige variabele μ is.

Wanneer we de verwachte waarde van onze statistiek berekenen, zien we het volgende:

EX1 + X2 +... + Xn) / n] = (E [X1] + E [X2] + ... + E [Xn]) / n = (nE [X1]) / n = E [X1] = μ.

Omdat de verwachte waarde van de statistiek overeenkomt met de parameter die deze heeft geschat, betekent dit dat het steekproefgemiddelde een onpartijdige schatting is voor het populatiegemiddelde.