In inferentiële statistieken is een van de belangrijkste doelen het schatten van een onbekende populatieparameter. U begint met een statistische steekproef en hieruit kunt u een reeks waarden voor de parameter bepalen. Dit waardenbereik wordt een betrouwbaarheidsinterval genoemd.
Vertrouwensintervallen
Vertrouwensintervallen zijn allemaal op een aantal manieren vergelijkbaar met elkaar. Ten eerste hebben veel tweezijdige betrouwbaarheidsintervallen dezelfde vorm:
Schatting ± Foutmarge
Ten tweede zijn de stappen voor het berekenen van betrouwbaarheidsintervallen erg vergelijkbaar, ongeacht het type betrouwbaarheidsinterval dat u probeert te vinden. Het specifieke type betrouwbaarheidsinterval dat hieronder wordt onderzocht, is een tweezijdig betrouwbaarheidsinterval voor een populatiegemiddelde wanneer u de standaarddeviatie van de populatie kent. Neem ook aan dat u werkt met een populatie die normaal wordt verdeeld.
Vertrouwensinterval voor een gemiddelde met een bekende Sigma
Hieronder is een proces om het gewenste betrouwbaarheidsinterval te vinden. Hoewel alle stappen belangrijk zijn, is de eerste vooral:
Controleer voorwaarden: Begin met ervoor te zorgen dat aan de voorwaarden voor uw betrouwbaarheidsinterval is voldaan. Stel dat u de waarde kent van de standaarddeviatie van de populatie, aangegeven met de Griekse letter sigma σ. Neem ook een normale verdeling aan.
Bereken schatting: Schat de populatieparameter - in dit geval het populatiegemiddelde - door gebruik te maken van een statistiek, wat in dit probleem het steekproefgemiddelde is. Dit omvat het vormen van een eenvoudige willekeurige steekproef uit de populatie. Soms kunt u veronderstellen dat uw steekproef een eenvoudige willekeurige steekproef is, zelfs als deze niet aan de strikte definitie voldoet.
Kritische waarde: De kritieke waarde verkrijgen z* dat komt overeen met uw zelfvertrouwen. Deze waarden worden gevonden door een tabel met z-scores te raadplegen of door de software te gebruiken. U kunt een z-score-tabel gebruiken omdat u de waarde van de standaarddeviatie van de populatie kent en u ervan uitgaat dat de populatie normaal is verdeeld. Veelvoorkomende kritische waarden zijn 1.645 voor een betrouwbaarheidsniveau van 90 procent, 1.960 voor een betrouwbaarheidsniveau van 95 procent en 2.576 voor een betrouwbaarheidsniveau van 99 procent.
Foutmarge: Bereken de foutmarge z* σ / √n, waar n is de grootte van de eenvoudige willekeurige steekproef die u hebt gevormd.
Concluderen: Voltooi door de schatting en foutmarge samen te stellen. Dit kan als een van beide worden uitgedrukt Schatting ± Foutmarge of als Schatting - foutmarge naar Schatting + foutmarge. Vermeld duidelijk het niveau van vertrouwen dat aan uw betrouwbaarheidsinterval is verbonden.
Voorbeeld
Doorloop een voorbeeld om te zien hoe u een betrouwbaarheidsinterval kunt samenstellen. Stel dat u weet dat de IQ-scores van alle inkomende hogeschoolstudenten normaal worden verdeeld met een standaarddeviatie van 15. U hebt een eenvoudige willekeurige steekproef van 100 eerstejaarsstudenten en de gemiddelde IQ-score voor deze steekproef is 120. Zoek een 90-procent betrouwbaarheidsinterval voor de gemiddelde IQ-score voor de hele populatie inkomende eerstejaarsstudenten.
Doorloop de stappen die hierboven zijn beschreven:
Controleer voorwaarden: Aan de voorwaarden is voldaan omdat u te horen heeft gekregen dat de standaarddeviatie van de populatie 15 is en dat u te maken hebt met een normale verdeling.
Bereken schatting: Er is u verteld dat u een eenvoudige willekeurige steekproef van maat 100 heeft. Het gemiddelde IQ voor deze steekproef is 120, dus dit is uw schatting.
Kritische waarde: De kritische waarde voor het betrouwbaarheidsniveau van 90 procent wordt gegeven door z* = 1.645.
Foutmarge: Gebruik de foutmargeformule en krijg een fout van z* σ / √n = (1.645) (15) / √ (100) = 2.467.
Concluderen: Sluit af door alles samen te voegen. Een betrouwbaarheidsinterval van 90 procent voor de gemiddelde IQ-score van de populatie is 120 ± 2.467. Als alternatief kunt u dit betrouwbaarheidsinterval aangeven als 117.5325 tot 122.4675.
Praktische overwegingen
Vertrouwensintervallen van het bovenstaande type zijn niet erg realistisch. Het is zeer zeldzaam om de standaarddeviatie van de populatie te kennen, maar niet om het populatiegemiddelde te kennen. Er zijn manieren waarop deze onrealistische veronderstelling kan worden verwijderd.
Hoewel je een normale verdeling hebt aangenomen, hoeft deze veronderstelling niet te worden overgenomen. Leuke monsters, die geen sterke scheefheid vertonen of uitschieters hebben, samen met een voldoende grote steekproefgrootte, stellen u in staat om de centrale limietstelling te gebruiken. Daarom bent u gerechtigd om een tabel met z-scores te gebruiken, zelfs voor populaties die normaal niet worden verdeeld.