In inferentiële statistieken, vertrouwen betrouwbaarheidsintervallen voor populatie verhoudingen op de standaard normale verdeling om onbekende parameters van een gegeven populatie te bepalen gegeven een statistische steekproef van de populatie. Een reden hiervoor is dat de standaard normale verdeling voor geschikte steekproefgroottes uitstekend werk doet bij het schatten van een binomiale verdeling. Dit is opmerkelijk omdat, hoewel de eerste verdeling continu is, de tweede discreet is.
Er zijn een aantal problemen die moeten worden aangepakt bij het opstellen van betrouwbaarheidsintervallen voor verhoudingen. Een van deze betreft een zogenaamd 'plus vier' betrouwbaarheidsinterval, wat resulteert in een bevooroordeelde schatter. Deze schatter van een onbekend populatiepercentage presteert in sommige situaties echter beter dan onbevooroordeelde schatters, met name in situaties waarin er geen successen of mislukkingen in de gegevens zijn.
In de meeste gevallen is de beste poging om een populatiepercentage te schatten het gebruik van een overeenkomstig steekproefpercentage. We veronderstellen dat er een populatie is met een onbekend aandeel p van zijn individuen die een bepaalde eigenschap bevatten, dan vormen we een eenvoudige willekeurige steekproef van grootte n van deze populatie.Van deze n individuen, we tellen het aantal van hen Y die de eigenschap bezitten waar we nieuwsgierig naar zijn. Nu schatten we p met behulp van onze steekproef. De steekproefverhouding Y / n is een onpartijdige schatter van p.
Wanneer we een interval van plus vier gebruiken, wijzigen we de schatter van p. We doen dit door vier toe te voegen aan het totale aantal observaties, en aldus de uitdrukking "plus vier" uit te leggen. We splitsen deze vier observaties vervolgens tussen twee hypothetische successen en twee mislukkingen, wat betekent dat we twee optellen bij het totale aantal successen. eindresultaat is dat we elk exemplaar van vervangen Y / n met (Y + 2) / (n + 4), en soms wordt deze fractie aangeduid met p met een tilde erboven.
Het steekproefaandeel werkt meestal erg goed bij het schatten van een populatieaandeel. Er zijn echter enkele situaties waarin we onze schatter enigszins moeten aanpassen. Statistische praktijk en wiskundige theorie tonen aan dat de aanpassing van het plus-vier interval geschikt is om dit doel te bereiken.
Een situatie waarbij we een interval van plus vier moeten overwegen, is een scheve steekproef. Omdat het populatiepercentage zo klein of zo groot is, is het steekproefaandeel vaak ook heel dicht bij 0 of heel dicht bij 1. In dit soort situaties moeten we een interval van plus vier overwegen.
Een andere reden om een interval van plus vier te gebruiken is als we een kleine steekproefomvang hebben. Een interval van plus vier in deze situatie biedt een betere schatting voor een populatiepercentage dan het gebruik van het typische betrouwbaarheidsinterval voor een aandeel.
Het plus-vier betrouwbaarheidsinterval is een bijna magische manier om inferentiële statistieken nauwkeuriger te berekenen, doordat het eenvoudigweg vier denkbeeldige waarnemingen toevoegt aan een gegeven gegevensset, twee successen en twee mislukkingen, het in staat is om nauwkeuriger het aandeel van een gegevensset te voorspellen die past bij de parameters.
Het plus-vier betrouwbaarheidsinterval is echter niet altijd van toepassing op elk probleem. Het kan alleen worden gebruikt als het betrouwbaarheidsinterval van een gegevensset hoger is dan 90% en de steekproefgrootte van de populatie ten minste 10 is. De gegevensset kan echter een willekeurig aantal successen en mislukkingen bevatten, hoewel het beter werkt wanneer er zijn geen successen of geen fouten in de gegevens van een bepaalde populatie.
Houd er rekening mee dat in tegenstelling tot de berekeningen van reguliere statistieken, de berekeningen van inferentiële statistieken gebaseerd zijn op een steekproef van gegevens om de meest waarschijnlijke resultaten binnen een populatie te bepalen. Hoewel het plus vier betrouwbaarheidsinterval corrigeert voor een grotere foutmarge, moet deze marge toch worden meegenomen om de meest nauwkeurige statistische waarneming te bieden.