Voorbeeld van tweetest T-test en betrouwbaarheidsinterval

Soms is het in statistieken nuttig om uitgewerkte voorbeelden van problemen te zien. Deze voorbeelden kunnen ons helpen bij het uitzoeken van soortgelijke problemen. In dit artikel zullen we het proces doorlopen van het uitvoeren van inferentiële statistieken voor een resultaat met betrekking tot twee populatiegemiddelden. We zullen niet alleen zien hoe we een hypothesetest over het verschil van twee populatiegemiddelden kunnen uitvoeren, we zullen ook een betrouwbaarheidsinterval voor dit verschil construeren. De methoden die we gebruiken worden soms een twee steekproef t-test en een twee steekproef t betrouwbaarheidsinterval genoemd.

De probleemstelling

Stel dat we de wiskundige aanleg van basisschoolkinderen willen testen. Een vraag die we kunnen hebben is of hogere rangniveaus hogere gemiddelde testscores hebben.

Een eenvoudige willekeurige steekproef van 27 derde klassers krijgt een wiskundetest, hun antwoorden worden gescoord en de resultaten blijken een gemiddelde score van 75 punten te hebben met een standaarddeviatie van 3 steekproeven.

Een eenvoudige steekproef van 20 vijfde klassers krijgt dezelfde wiskundetest en hun antwoorden worden gescoord. De gemiddelde score voor de vijfde klassers is 84 punten met een steekproefstandaardafwijking van 5 punten.

Gegeven dit scenario stellen we de volgende vragen:

  • Biedt de steekproefgegevens ons bewijs dat de gemiddelde testscore van de populatie van alle vijfde klassers de gemiddelde testscore van de populatie van alle derde klassers overschrijdt?
  • Wat is een betrouwbaarheidsinterval van 95% voor het verschil in gemiddelde testscores tussen de populaties van derde en vijfde klassers?

Voorwaarden en procedure

We moeten selecteren welke procedure we moeten gebruiken. Daarbij moeten we ervoor zorgen en controleren of aan de voorwaarden voor deze procedure is voldaan. We worden gevraagd om twee populatiegemiddelden te vergelijken. Een verzameling methoden die hiervoor kunnen worden gebruikt, zijn die voor tweemonsterings-t-procedures.

Om deze t-procedures voor twee monsters te gebruiken, moeten we ervoor zorgen dat de volgende voorwaarden van toepassing zijn:

  • We hebben twee eenvoudige willekeurige steekproeven van de twee relevante populaties.
  • Onze eenvoudige steekproeven vormen niet meer dan 5% van de bevolking.
  • De twee steekproeven zijn onafhankelijk van elkaar en er is geen overeenstemming tussen de onderwerpen.
  • De variabele wordt normaal verdeeld.
  • Zowel het populatiegemiddelde als de standaarddeviatie zijn onbekend voor beide populaties.

We zien dat aan de meeste van deze voorwaarden is voldaan. Er is ons verteld dat we eenvoudige steekproeven hebben. De populaties die we bestuderen zijn groot, omdat er miljoenen studenten in deze klasniveaus zijn.

De voorwaarde die we niet automatisch kunnen aannemen, is als de testscores normaal worden verdeeld. Omdat we een steekproefgrootte hebben die groot genoeg is, hebben we door de robuustheid van onze t-procedures niet noodzakelijkerwijs de variabele nodig om normaal te worden verdeeld.

Omdat aan de voorwaarden is voldaan, voeren we een aantal voorlopige berekeningen uit.

Standaardfout

De standaardfout is een schatting van een standaardafwijking. Voor deze statistiek voegen we de steekproefvariantie van de monsters toe en nemen we de vierkantswortel. Dit geeft de formule:

(s1 2 / n1 + s22 / n2)1/2

Door de bovenstaande waarden te gebruiken, zien we dat de waarde van de standaardfout is