Voorbeeld van een Chi-Square Goodness of Fit-test

De chi-kwadraat goedheid van fit-test is een nuttig om een ​​theoretisch model te vergelijken met waargenomen gegevens. Deze test is een type van de meer algemene chikwadraat-test. Zoals met elk onderwerp in wiskunde of statistiek, kan het nuttig zijn om een ​​voorbeeld te doorlopen om te begrijpen wat er gebeurt, door een voorbeeld van de chi-kwadraat goedheid van fit-test.

Overweeg een standaardpakket M & M's van melkchocolade. Er zijn zes verschillende kleuren: rood, oranje, geel, groen, blauw en bruin. Stel dat we nieuwsgierig zijn naar de verdeling van deze kleuren en vragen: komen alle zes kleuren in gelijke mate voor? Dit is het type vraag dat kan worden beantwoord met een goede fit-test.

omgeving

We beginnen met het vaststellen van de instelling en waarom de goedheid van fit-test geschikt is. Onze kleurvariabele is categorisch. Er zijn zes niveaus van deze variabele, die overeenkomen met de zes kleuren die mogelijk zijn. We nemen aan dat de M & M's die we tellen een eenvoudige steekproef zullen zijn van de populatie van alle M & M's.

Null en alternatieve hypothesen

De nul- en alternatieve hypotheses voor onze goedheid van fit-test weerspiegelen de veronderstelling die we maken over de bevolking. Omdat we testen of de kleuren in gelijke verhoudingen voorkomen, is onze nulhypothese dat alle kleuren in dezelfde verhoudingen voorkomen. Meer formeel, als p1 is het bevolkingsaandeel van rood snoep, p2 is het bevolkingsaandeel van oranje snoepjes, enzovoort, dan is de nulhypothese dat p1 = p2 = ... = p6 = 1/6.

De alternatieve hypothese is dat ten minste een van de populaties niet gelijk is aan 1/6.

Werkelijke en verwachte tellingen

De werkelijke tellingen zijn het aantal snoepjes voor elk van de zes kleuren. De verwachte telling verwijst naar wat we zouden verwachten als de nulhypothese waar zou zijn. We zullen laten n wees de grootte van onze steekproef. Het verwachte aantal rode snoepjes is p1 n of n/ 6. In feite is voor dit voorbeeld het verwachte aantal snoepjes voor elk van de zes kleuren eenvoudig n keer pik, of n/ 6.

Chi-square Statistic for Goodness of Fit

We zullen nu een chikwadraatstatistiek berekenen voor een specifiek voorbeeld. Stel dat we een eenvoudige steekproef van 600 M & M-snoepjes hebben met de volgende verdeling:

  • 212 van de snoepjes zijn blauw.
  • 147 van de snoepjes zijn oranje.
  • 103 van de snoepjes zijn groen.
  • 50 van de snoepjes zijn rood.
  • 46 van de snoepjes zijn geel.
  • 42 van de snoepjes zijn bruin.

Als de nulhypothese waar was, zouden de verwachte tellingen voor elk van deze kleuren (1/6) x 600 = 100 zijn. We gebruiken dit nu in onze berekening van de chikwadraat statistiek.

We berekenen de bijdrage aan onze statistiek uit elk van de kleuren. Elk is van de vorm (werkelijk - verwacht)2/Verwacht.:

  • Voor blauw hebben we (212 - 100)2/ 100 = 125,44
  • Voor sinaasappel hebben we (147 - 100)2/ 100 = 22.09
  • Voor groen hebben we (103 - 100)2/ 100 = 0,09
  • Voor rood hebben we (50 - 100)2/ 100 = 25
  • Voor geel hebben we (46 - 100)2/ 100 = 29.16
  • Voor bruin hebben we (42 - 100)2/ 100 = 33,64

We tellen dan al deze bijdragen en bepalen dat onze chikwadraat statistiek 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42 is.

Graden van vrijheid

Het aantal vrijheidsgraden voor een goede fit-test is gewoon een minder dan het aantal niveaus van onze variabele. Aangezien er zes kleuren waren, hebben we 6 - 1 = 5 vrijheidsgraden.

Chi-kwadraat tabel en P-waarde

De chikwadraat statistiek van 235,42 die we hebben berekend, komt overeen met een bepaalde locatie op een chikwadraatverdeling met vijf vrijheidsgraden. We hebben nu een p-waarde nodig om de waarschijnlijkheid te bepalen van het verkrijgen van een teststatistiek die minstens zo extreem is als 235.42, terwijl we aannemen dat de nulhypothese waar is.

Microsoft's Excel kan voor deze berekening worden gebruikt. We vinden dat onze teststatistiek met vijf vrijheidsgraden een p-waarde van 7,29 x 10 heeft-49. Dit is een extreem kleine p-waarde.

Beslissingsregel

We nemen onze beslissing om de nulhypothese te verwerpen op basis van de grootte van de p-waarde. Omdat we een zeer minuscule p-waarde hebben, verwerpen we de nulhypothese. We concluderen dat M & M's niet gelijk verdeeld zijn over de zes verschillende kleuren. Een vervolganalyse zou kunnen worden gebruikt om een ​​betrouwbaarheidsinterval te bepalen voor het populatiepercentage van één bepaalde kleur.