Een van de belangrijkste onderdelen van inferentiële statistieken is de ontwikkeling van manieren om betrouwbaarheidsintervallen te berekenen. Vertrouwensintervallen bieden ons een manier om een populatieparameter te schatten. In plaats van te zeggen dat de parameter gelijk is aan een exacte waarde, zeggen we dat de parameter binnen een bereik van waarden valt. Dit waardenbereik is meestal een schatting, samen met een foutenmarge die we optellen en aftrekken van de schatting.
Aan elk interval is een niveau van vertrouwen verbonden. Het betrouwbaarheidsniveau geeft een meting van hoe vaak op de lange termijn de methode die wordt gebruikt om ons betrouwbaarheidsinterval te verkrijgen, de ware populatieparameter vastlegt.
Het is handig om bij het leren over statistieken enkele voorbeelden te zien. Hieronder zullen we verschillende voorbeelden van betrouwbaarheidsintervallen over een populatiegemiddelde bekijken. We zullen zien dat de methode die we gebruiken om een betrouwbaarheidsinterval over een gemiddelde te construeren afhangt van verdere informatie over onze populatie. Concreet hangt de aanpak die we afhangen van het feit of we de standaarddeviatie van de populatie kennen of niet.
Probleemstelling
We beginnen met een eenvoudige steekproef van 25 een bepaalde soort salamanders en meten hun staarten. De gemiddelde staartlengte van ons monster is 5 cm.
Als we weten dat 0.2 cm de standaardafwijking is van de staartlengtes van alle salamanders in de populatie, wat is dan een betrouwbaarheidsinterval van 90% voor de gemiddelde staartlengte van alle salamanders in de populatie?
Als we weten dat 0.2 cm de standaardafwijking is van de staartlengtes van alle salamanders in de populatie, wat is dan een betrouwbaarheidsinterval van 95% voor de gemiddelde staartlengte van alle salamanders in de populatie?
Als we vaststellen dat die 0.2 cm de standaardafwijking is van de staartlengtes van de salamanders in onze steekproef de populatie, wat is dan een betrouwbaarheidsinterval van 90% voor de gemiddelde staartlengte van alle salamanders in de populatie?
Als we vaststellen dat die 0.2 cm de standaardafwijking is van de staartlengtes van de salamanders in onze steekproef de populatie, wat is dan een betrouwbaarheidsinterval van 95% voor de gemiddelde staartlengte van alle salamanders in de populatie?
Bespreking van de problemen
We beginnen met het analyseren van elk van deze problemen. In de eerste twee problemen kennen we de waarde van de standaarddeviatie van de populatie. Het verschil tussen deze twee problemen is dat het vertrouwensniveau groter is in # 2 dan wat het is voor # 1.
In de tweede twee problemen is de standaarddeviatie van de populatie onbekend. Voor deze twee problemen zullen we deze parameter schatten met de standaarddeviatie van de steekproef. Zoals we in de eerste twee problemen hebben gezien, hebben we hier ook verschillende niveaus van vertrouwen.
Oplossingen
We zullen oplossingen voor elk van de bovenstaande problemen berekenen.
Omdat we de populatiestandaarddeviatie kennen, zullen we een tabel met z-scores gebruiken. De waarde van z dat overeenkomt met een 90% betrouwbaarheidsinterval is 1.645. Door de formule voor de foutmarge te gebruiken, hebben we een betrouwbaarheidsinterval van 5 - 1.645 (0.2 / 5) tot 5 + 1.645 (0.2 / 5). (De 5 in de noemer hier is omdat we de vierkantswortel van 25 hebben genomen). Na het uitvoeren van de rekenkunde hebben we 4,934 cm tot 5,066 cm als betrouwbaarheidsinterval voor het populatiegemiddelde.
Omdat we de populatiestandaarddeviatie kennen, zullen we een tabel met z-scores gebruiken. De waarde van z dat overeenkomt met een 95% betrouwbaarheidsinterval is 1,96. Door de formule voor de foutmarge te gebruiken, hebben we een betrouwbaarheidsinterval van 5 - 1,96 (0,2 / 5) tot 5 + 1,96 (0,2 / 5). Na het uitvoeren van de rekenkunde hebben we 4,922 cm tot 5,078 cm als betrouwbaarheidsinterval voor het populatiegemiddelde.
Hier kennen we de standaardafwijking van de populatie niet, alleen de standaardafwijking van de steekproef. We zullen dus een tabel met t-scores gebruiken. Wanneer we een tabel van gebruiken t scores moeten we weten hoeveel vrijheidsgraden we hebben. In dit geval zijn er 24 vrijheidsgraden, wat minder is dan de steekproefgrootte van 25. De waarde van t dat overeenkomt met een 90% betrouwbaarheidsinterval is 1,71. Door de formule voor de foutmarge te gebruiken, hebben we een betrouwbaarheidsinterval van 5 - 1,71 (0,2 / 5) tot 5 + 1,71 (0,2 / 5). Na het uitvoeren van de rekenkunde hebben we 4,932 cm tot 5,068 cm als betrouwbaarheidsinterval voor het populatiegemiddelde.
Hier kennen we de standaardafwijking van de populatie niet, alleen de standaardafwijking van de steekproef. We zullen dus opnieuw een tabel met t-scores gebruiken. Er zijn 24 vrijheidsgraden, wat minder is dan de steekproefgrootte van 25. De waarde van t dat overeenkomt met een betrouwbaarheidsinterval van 95% is 2,06. Door de formule voor de foutmarge te gebruiken, hebben we een betrouwbaarheidsinterval van 5 - 2,06 (0,2 / 5) tot 5 + 2,06 (0,2 / 5). Na het uitvoeren van de rekenkunde hebben we 4,912 cm tot 5,082 cm als betrouwbaarheidsinterval voor het populatiegemiddelde.
Bespreking van de oplossingen
Er zijn een paar dingen om op te merken bij het vergelijken van deze oplossingen. De eerste is dat hoe groter onze waarde is naarmate ons niveau van vertrouwen toenam z of t waarmee we zijn geëindigd. De reden hiervoor is dat we een groter interval nodig hebben om er zekerder van te zijn dat we inderdaad het populatiegemiddelde in ons betrouwbaarheidsinterval hebben vastgelegd..
Het andere kenmerk dat moet worden opgemerkt, is dat voor een bepaald betrouwbaarheidsinterval, degenen die gebruiken t zijn breder dan die met z. De reden hiervoor is dat een t distributie heeft grotere variabiliteit in zijn staart dan een standaard normale distributie.
De sleutel tot het corrigeren van oplossingen voor dit soort problemen is dat als we de standaardafwijking van de populatie kennen, we een tabel gebruiken z-scores. Als we de populatiestandaarddeviatie niet kennen, gebruiken we een tabel met t scores.