Vertrouwensintervallen zijn een belangrijk onderdeel van inferentiële statistieken. We kunnen wat waarschijnlijkheid en informatie uit een kansverdeling gebruiken om een populatieparameter te schatten met behulp van een steekproef. De verklaring van een betrouwbaarheidsinterval wordt op een zodanige manier gedaan dat het gemakkelijk verkeerd wordt begrepen. We zullen de juiste interpretatie van betrouwbaarheidsintervallen bekijken en vier fouten onderzoeken die worden gemaakt met betrekking tot dit statistische gebied.
Een betrouwbaarheidsinterval kan worden uitgedrukt als een bereik van waarden of in de volgende vorm:
Schatting ± foutmarge
Een betrouwbaarheidsinterval wordt meestal aangegeven met een betrouwbaarheidsniveau. Gemeenschappelijke betrouwbaarheidsniveaus zijn 90%, 95% en 99%.
We zullen een voorbeeld bekijken waarbij we een steekproefgemiddelde willen gebruiken om het gemiddelde van een populatie te bepalen. Stel dat dit resulteert in een betrouwbaarheidsinterval van 25 tot 30. Als we zeggen dat we 95% zeker zijn dat het onbekende populatiegemiddelde in dit interval is opgenomen, dan zeggen we echt dat we het interval hebben gevonden met een methode die succesvol is in 95% van de tijd de juiste resultaten geven. Op de lange termijn is onze methode 5% van de tijd niet succesvol. Met andere woorden, we zullen falen in het vangen van de echte populatie, slechts één op de 20 keer.
We zullen nu kijken naar een reeks verschillende fouten die kunnen worden gemaakt bij het omgaan met betrouwbaarheidsintervallen. Een onjuiste uitspraak die vaak wordt gedaan over een betrouwbaarheidsinterval bij een betrouwbaarheidsniveau van 95% is dat er een kans van 95% is dat het betrouwbaarheidsinterval het werkelijke gemiddelde van de populatie bevat.
De reden dat dit een vergissing is, is eigenlijk heel subtiel. Het kernidee met betrekking tot een betrouwbaarheidsinterval is dat de gebruikte waarschijnlijkheid in beeld komt met de methode die wordt gebruikt, bij het bepalen van het betrouwbaarheidsinterval is dat het verwijst naar de methode die wordt gebruikt.
Een tweede fout is om een betrouwbaarheidsinterval van 95% te interpreteren als te zeggen dat 95% van alle gegevenswaarden in de populatie binnen het interval vallen. Nogmaals, 95% spreekt de methode van de test aan.
Om te zien waarom de bovenstaande verklaring onjuist is, kunnen we een normale populatie overwegen met een standaarddeviatie van 1 en een gemiddelde van 5. Een steekproef met twee gegevenspunten, elk met waarden van 6, heeft een steekproefgemiddelde van 6. A 95% betrouwbaarheidsinterval voor het populatiegemiddelde zou 4,6 tot 7,4 zijn. Dit overlapt duidelijk niet met 95% van de normale verdeling, dus het zal geen 95% van de bevolking bevatten.
Een derde fout is te zeggen dat een betrouwbaarheidsinterval van 95% betekent dat 95% van alle mogelijke steekproefgemiddelden binnen het bereik van het interval valt. Overweeg het voorbeeld uit de laatste sectie. Elk monster van maat twee dat alleen uit waarden lager dan 4,6 zou bestaan, zou een gemiddelde hebben dat lager was dan 4,6. Aldus zouden deze steekproefmiddelen buiten dit specifieke betrouwbaarheidsinterval vallen. Monsters die overeenkomen met deze beschrijving zijn goed voor meer dan 5% van het totale bedrag. Het is dus een vergissing om te zeggen dat dit betrouwbaarheidsinterval 95% van alle steekproefgemiddelden vastlegt.
Een vierde fout bij het omgaan met betrouwbaarheidsintervallen is te denken dat zij de enige bron van fouten zijn. Hoewel er een foutenmarge is geassocieerd met een betrouwbaarheidsinterval, zijn er andere plaatsen waar fouten kunnen binnensluipen in een statistische analyse. Een paar voorbeelden van dit soort fouten kunnen zijn van een onjuist ontwerp van het experiment, vooringenomenheid in de steekproef of een onvermogen om gegevens te verkrijgen van een bepaalde subset van de populatie.