Een betrouwbaarheidsinterval voor een gemiddelde berekenen

Inferentiële statistieken betreffen het proces van het beginnen met een statistische steekproef en vervolgens komen tot de waarde van een populatieparameter die onbekend is. De onbekende waarde wordt niet rechtstreeks bepaald. We eindigen eerder met een schatting die binnen een bereik van waarden valt. Dit bereik is wiskundig bekend als een interval van reële getallen en wordt specifiek een betrouwbaarheidsinterval genoemd.

Vertrouwensintervallen zijn allemaal op een aantal manieren vergelijkbaar met elkaar. Tweezijdige betrouwbaarheidsintervallen hebben allemaal dezelfde vorm:

Schatting ± Foutmarge

Overeenkomsten in betrouwbaarheidsintervallen strekken zich ook uit tot de stappen die worden gebruikt om betrouwbaarheidsintervallen te berekenen. We zullen onderzoeken hoe we een tweezijdig betrouwbaarheidsinterval voor een populatiegemiddelde kunnen bepalen wanneer de standaarddeviatie van de populatie onbekend is. Een onderliggende veronderstelling is dat we steekproeven nemen van een normaal verdeelde populatie.

Proces voor betrouwbaarheidsinterval voor gemiddelde met een onbekende Sigma

We zullen een lijst met stappen doorlopen die nodig zijn om ons gewenste betrouwbaarheidsinterval te vinden. Hoewel alle stappen belangrijk zijn, is de eerste vooral:

  1. Controleer voorwaarden: Begin met ervoor te zorgen dat aan de voorwaarden voor ons betrouwbaarheidsinterval is voldaan. We nemen aan dat de waarde van de standaardafwijking van de populatie, aangeduid met de Griekse letter sigma σ, onbekend is en dat we met een normale verdeling werken. We kunnen de veronderstelling ontspannen dat we een normale verdeling hebben, zolang ons monster groot genoeg is en geen uitschieters of extreme scheefheid heeft.
  2. Schatting berekenen: We schatten onze populatieparameter, in dit geval het populatiegemiddelde, met behulp van een statistiek, in dit geval het steekproefgemiddelde. Dit houdt in dat we een eenvoudige steekproef uit onze populatie vormen. Soms kunnen we veronderstellen dat onze steekproef een eenvoudige willekeurige steekproef is, zelfs als deze niet aan de strikte definitie voldoet.
  3. Kritische waarde: We verkrijgen de kritische waarde t* die overeenkomen met ons betrouwbaarheidsniveau. Deze waarden worden gevonden door een tabel met t-scores te raadplegen of door de software te gebruiken. Als we een tabel gebruiken, moeten we het aantal vrijheidsgraden weten. Het aantal vrijheidsgraden is één minder dan het aantal individuen in onze steekproef.
  4. Foutmarge: Bereken de foutmarge t*s / √n, waar n is de grootte van de eenvoudige willekeurige steekproef die we hebben gevormd en s is de standaarddeviatie van de steekproef, die we verkrijgen uit onze statistische steekproef.
  5. Concluderen: Voltooi door de schatting en foutmarge samen te stellen. Dit kan als een van beide worden uitgedrukt Schatting ± Foutmarge of als Schatting - foutmarge naar Schatting + foutmarge. In de verklaring van ons betrouwbaarheidsinterval is het belangrijk om het niveau van vertrouwen aan te geven. Dit is net zo goed een onderdeel van ons betrouwbaarheidsinterval als getallen voor de schatting en de foutmarge.

Voorbeeld

Om te zien hoe we een betrouwbaarheidsinterval kunnen construeren, zullen we een voorbeeld doorlopen. Stel dat we weten dat de hoogten van een specifieke soort erwtplanten normaal verdeeld zijn. Een eenvoudig willekeurig monster van 30 erwtenplanten heeft een gemiddelde hoogte van 12 inch met een standaarddeviatie van het monster van 2 inch. Wat is een 90% betrouwbaarheidsinterval voor de gemiddelde hoogte voor de gehele populatie erwtenplanten?

We zullen de stappen doorlopen die hierboven zijn beschreven:

  1. Controleer voorwaarden: Aan de voorwaarden is voldaan omdat de populatiestandaardafwijking onbekend is en we te maken hebben met een normale verdeling.
  2. Schatting berekenen: Er is ons verteld dat we een eenvoudige steekproef van 30 erwtenplanten hebben. De gemiddelde hoogte voor dit monster is 12 inch, dus dit is onze schatting.
  3. Kritische waarde: Onze steekproef heeft een grootte van 30, en dus zijn er 29 vrijheidsgraden. De kritische waarde voor het betrouwbaarheidsniveau van 90% wordt gegeven door t* = 1.699.
  4. Foutmarge: Nu gebruiken we de formule van de foutmarge en verkrijgen we een foutmarge van t*s / √n = (1.699) (2) / √ (30) = 0,620.
  5. Concluderen: We besluiten door alles samen te voegen. Een betrouwbaarheidsinterval van 90% voor de gemiddelde lengtescore van de populatie is 12 ± 0,62 inch. Als alternatief zouden we dit betrouwbaarheidsinterval kunnen aangeven als 11,38 inch tot 12,62 inch.

Praktische overwegingen

Vertrouwensintervallen van het bovenstaande type zijn realistischer dan andere typen die kunnen worden aangetroffen in een statistiekcursus. Het is zeer zeldzaam om de standaarddeviatie van de populatie te kennen, maar niet om het populatiegemiddelde te kennen. Hier nemen we aan dat we geen van deze populatieparameters kennen.