Kritieke waarden vinden met een Chi-kwadraat tabel

Het gebruik van statistische tabellen is een veel voorkomend onderwerp in veel statistische cursussen. Hoewel software berekeningen uitvoert, is de vaardigheid om tabellen te lezen nog steeds belangrijk. We zullen zien hoe we een tabel met waarden voor een chikwadraatverdeling kunnen gebruiken om een kritische waarde te bepalen. De tabel die we zullen gebruiken, bevindt zich hier, maar andere chikwadraattafels zijn ingedeeld op manieren die erg op deze lijken.

Kritische waarde

Het gebruik van een chikwadraat-tabel die we zullen onderzoeken, is het bepalen van een kritische waarde. Kritische waarden zijn belangrijk in zowel hypothesetests als betrouwbaarheidsintervallen. Voor hypothesetests vertelt een kritische waarde ons de grens van hoe extreem een teststatistiek we nodig hebben om de nulhypothese te verwerpen. Voor betrouwbaarheidsintervallen is een kritieke waarde een van de ingrediënten die bij de berekening van een foutmarge worden gebruikt.

Om een kritische waarde te bepalen, moeten we drie dingen weten:

Het aantal vrijheidsgraden
Het aantal en type staarten
Het niveau van significantie.

Graden van vrijheid

Het eerste punt van belang is het aantal vrijheidsgraden. Dit getal vertelt ons welke van de ontelbare oneindig veel chikwadraatverdelingen die we in ons probleem moeten gebruiken. De manier waarop we dit aantal bepalen, is afhankelijk van het precieze probleem waarmee we onze chikwadraatverdeling gebruiken. Drie veel voorkomende voorbeelden volgen.

Als we een goede fit-test doen, is het aantal vrijheidsgraden een minder dan het aantal uitkomsten voor ons model.
Als we een betrouwbaarheidsinterval voor een populatievariantie construeren, is het aantal vrijheidsgraden een minder dan het aantal waarden in onze steekproef.
Voor een chikwadraat-test van de onafhankelijkheid van twee categorische variabelen hebben we een tweerichtings-contingentietabel met r rijen en c kolommen. Het aantal vrijheidsgraden is (r - 1) (c - 1).

In deze tabel komt het aantal vrijheidsgraden overeen met de rij die we zullen gebruiken.

Als de tabel waarmee we werken niet het exacte aantal vrijheidsgraden weergeeft waar ons probleem om vraagt, dan is er een vuistregel die we gebruiken. We ronden het aantal vrijheidsgraden naar beneden af op de hoogste ingediende waarde. Stel bijvoorbeeld dat we 59 vrijheidsgraden hebben. Als onze tabel alleen lijnen voor 50 en 60 vrijheidsgraden heeft, gebruiken we de lijn met 50 vrijheidsgraden.

rok

Het volgende dat we moeten overwegen, is het aantal en het type staarten dat wordt gebruikt. Een chikwadraatverdeling is scheef naar rechts, en daarom worden meestal eenzijdige tests met de rechterstaart gebruikt. Als we echter een tweezijdig betrouwbaarheidsinterval berekenen, moeten we een tweezijdige test overwegen met zowel een rechter- als een linkerstaart in onze chikwadraatverdeling.

Niveau van vertrouwen

Het laatste stukje informatie dat we moeten weten, is het niveau van vertrouwen of betekenis. Dit is een waarschijnlijkheid die doorgaans wordt aangeduid met alfa. Vervolgens moeten we deze waarschijnlijkheid (samen met de informatie over onze staarten) vertalen in de juiste kolom voor gebruik in onze tabel. Vaak hangt deze stap af van hoe onze tafel is opgebouwd.

Voorbeeld

We zullen bijvoorbeeld een goedheid van fit-test overwegen voor een twaalfzijdige dobbelsteen. Onze nulhypothese is dat alle kanten even waarschijnlijk worden gerold, en dus elke zijde een kans heeft dat 1/12 wordt gerold. Omdat er 12 resultaten zijn, zijn er 12 -1 = 11 vrijheidsgraden. Dit betekent dat we de rij gemarkeerd met 11 zullen gebruiken voor onze berekeningen.

Een goedheid van fit-test is een eenzijdige test. De staart die we hiervoor gebruiken is de juiste staart. Stel dat het significantieniveau 0,05 = 5% is. Dit is de waarschijnlijkheid in de rechter staart van de verdeling. Onze tabel is ingesteld op waarschijnlijkheid in de linkerstaart. Dus links van onze kritische waarde moet 1 - 0,05 = 0,95 zijn. Dit betekent dat we de kolom gebruiken die overeenkomt met 0,95 en rij 11 om een kritische waarde van 19.675 te geven.

Als de chikwadraat statistiek die we berekenen op basis van onze gegevens groter is dan of gelijk is aan19.675, dan verwerpen we de nulhypothese met een significantie van 5%. Als onze chikwadraat statistiek kleiner is dan 19.675, dan falen we de nulhypothese te verwerpen.

Wetenschap