Inferentiële statistieken ontleent zijn naam aan wat er in deze tak van statistieken gebeurt. In plaats van eenvoudigweg een set gegevens te beschrijven, trachten inferentiële statistieken op basis van een statistische steekproef iets over een populatie af te leiden. Een specifiek doel in inferentiële statistieken betreft de bepaling van de waarde van een onbekende populatieparameter. Het bereik van waarden dat we gebruiken om deze parameter te schatten, wordt een betrouwbaarheidsinterval genoemd.
Een betrouwbaarheidsinterval bestaat uit twee delen. Het eerste deel is de schatting van de populatieparameter. We verkrijgen deze schatting met behulp van een eenvoudige willekeurige steekproef. Uit dit voorbeeld berekenen we de statistiek die overeenkomt met de parameter die we willen schatten. Als we bijvoorbeeld geïnteresseerd waren in de gemiddelde lengte van alle eerstejaars studenten in de Verenigde Staten, zouden we een eenvoudige willekeurige steekproef van Amerikaanse eerste klassers gebruiken, ze allemaal meten en vervolgens de gemiddelde hoogte van onze steekproef berekenen.
Het tweede deel van een betrouwbaarheidsinterval is de foutmarge. Dit is noodzakelijk omdat alleen onze schatting kan verschillen van de werkelijke waarde van de populatieparameter. Om andere potentiële waarden van de parameter mogelijk te maken, moeten we een reeks getallen produceren. De foutmarge doet dit en elk betrouwbaarheidsinterval heeft de volgende vorm:
Schatting ± foutmarge
De schatting bevindt zich in het midden van het interval en vervolgens trekken we de foutenmarge van deze schatting af en voegen we deze toe om een bereik van waarden voor de parameter te verkrijgen.
Aan elk betrouwbaarheidsinterval is een betrouwbaarheidsniveau verbonden. Dit is een waarschijnlijkheid of percentage dat aangeeft hoeveel zekerheid we moeten worden toegeschreven aan ons betrouwbaarheidsinterval. Als alle andere aspecten van een situatie identiek zijn, hoe hoger het betrouwbaarheidsniveau, hoe groter het betrouwbaarheidsinterval.
Dit niveau van vertrouwen kan tot enige verwarring leiden. Het is geen uitspraak over de steekproefprocedure of populatie. In plaats daarvan geeft het een indicatie van het succes van het constructieproces van een betrouwbaarheidsinterval. Bijvoorbeeld, betrouwbaarheidsintervallen met een vertrouwen van 80 procent zullen op de lange termijn de echte populatieparameter één op elke vijf keer missen.
Elk getal van nul tot één zou in theorie kunnen worden gebruikt voor een betrouwbaarheidsniveau. In de praktijk zijn 90 procent, 95 procent en 99 procent allemaal gangbare betrouwbaarheidsniveaus.
De foutenmarge van een betrouwbaarheidsniveau wordt bepaald door een aantal factoren. We kunnen dit zien door de formule voor foutmarge te onderzoeken. Een foutmarge heeft de vorm:
Foutmarge = (Statistiek voor betrouwbaarheidsniveau) * (standaardafwijking / fout)
De statistiek voor het betrouwbaarheidsniveau hangt af van welke kansverdeling wordt gebruikt en welk betrouwbaarheidsniveau we hebben gekozen. Bijvoorbeeld als Cis ons vertrouwensniveau en we werken dan met een normale verdeling C is het gebied onder de curve tussen -z* naar z*. Dit nummer z* is het getal in onze foutmargeformule.
De andere term die nodig is in onze foutmarge is de standaardafwijking of standaardfout. De standaarddeviatie van de distributie waarmee we werken heeft hier de voorkeur. Typische parameters uit de populatie zijn echter onbekend. Dit aantal is meestal niet beschikbaar bij het vormen van betrouwbaarheidsintervallen in de praktijk.
Om met deze onzekerheid in het kennen van de standaardafwijking om te gaan, gebruiken we in plaats daarvan de standaardfout. De standaardfout die overeenkomt met een standaardafwijking is een schatting van deze standaardafwijking. Wat de standaardfout zo krachtig maakt, is dat deze wordt berekend op basis van de eenvoudige steekproef die wordt gebruikt om onze schatting te berekenen. Er is geen extra informatie nodig omdat de steekproef alle schattingen voor ons doet.
Er zijn verschillende situaties die om betrouwbaarheidsintervallen vragen. Deze betrouwbaarheidsintervallen worden gebruikt om een aantal verschillende parameters te schatten. Hoewel deze aspecten verschillend zijn, zijn al deze betrouwbaarheidsintervallen verenigd door hetzelfde algemene formaat. Enkele veelvoorkomende betrouwbaarheidsintervallen zijn die voor een populatiegemiddelde, populatievariantie, populatie-aandeel, het verschil tussen twee populatiegemiddelden en het verschil tussen twee populatie-proporties..