Welk niveau van Alpha bepaalt de statistische significantie?

Niet alle resultaten van hypothesetoetsen zijn gelijk. Aan een hypothesetest of test van statistische significantie is meestal een significantieniveau verbonden. Dit significantieniveau is een getal dat meestal wordt aangeduid met de Griekse letter alfa. Een vraag die in een statistische klasse opkomt, is: "Welke waarde van alfa moet worden gebruikt voor onze hypothesetests?"

Het antwoord op deze vraag is, net als bij veel andere vragen in de statistiek, "het hangt van de situatie af." We zullen onderzoeken wat we hiermee bedoelen. Veel tijdschriften in verschillende disciplines definiëren dat statistisch significante resultaten die zijn waarvoor alfa gelijk is aan 0,05 of 5%. Maar het belangrijkste om op te merken is dat er geen universele waarde van alfa is die voor alle statistische tests moet worden gebruikt.

Veelgebruikte waarden Niveaus van betekenis

Het getal dat wordt weergegeven door alfa is een waarschijnlijkheid, dus het kan een waarde hebben van elk niet-negatief reëel getal kleiner dan één. Hoewel in theorie elk getal tussen 0 en 1 kan worden gebruikt voor alfa, is dit niet het geval bij de statistische praktijk. Van alle significantieniveaus zijn de waarden van 0,10, 0,05 en 0,01 de waarden die het meest worden gebruikt voor alfa. Zoals we zullen zien, kunnen er redenen zijn om andere alfa-waarden te gebruiken dan de meest gebruikte getallen.

Niveau van betekenis en Type I-fouten

Eén overweging tegen een "one size fits all" -waarde voor alpha heeft te maken met wat dit getal de waarschijnlijkheid is. Het significantieniveau van een hypothesetest is exact gelijk aan de waarschijnlijkheid van een Type I-fout. Een Type I-fout bestaat uit het ten onrechte afwijzen van de nulhypothese wanneer de nulhypothese feitelijk waar is. Hoe kleiner de waarde van alpha, hoe minder waarschijnlijk het is dat we een echte nulhypothese verwerpen.

Er zijn verschillende gevallen waarin het acceptabeler is om een ​​Type I-fout te hebben. Een grotere alpha-waarde, zelfs een waarde groter dan 0,10 kan geschikt zijn wanneer een kleinere alpha-waarde een minder gewenste uitkomst oplevert.

Overweeg bij medische screening op een ziekte de mogelijkheden van een test die ten onrechte positief test voor een ziekte met een test die ten onrechte negatief test voor een ziekte. Een vals positief leidt tot angst voor onze patiënt, maar zal leiden tot andere tests die zullen bepalen dat het oordeel van onze test inderdaad onjuist was. Een vals negatief geeft onze patiënt de verkeerde veronderstelling dat hij geen ziekte heeft, terwijl hij dat wel doet. Het gevolg is dat de ziekte niet wordt behandeld. Gegeven de keuze, zouden we liever voorwaarden hebben die resulteren in een vals positief dan een vals negatief.

In deze situatie zouden we graag een grotere waarde voor alpha accepteren als het resulteerde in een afweging van een lagere kans op een vals negatief.

Niveau van betekenis en P-waarden

Een significantieniveau is een waarde die we instellen om de statistische significantie te bepalen. Dit wordt de standaard waarmee we de berekende p-waarde van onze teststatistiek meten. Om te zeggen dat een resultaat statistisch significant is op het niveau alpha, betekent gewoon dat de p-waarde kleiner is dan alpha. Bijvoorbeeld, voor een waarde van alpha = 0,05, als de p-waarde groter is dan 0,05, dan falen we de nulhypothese te verwerpen.

Er zijn enkele gevallen waarin we een zeer kleine p-waarde nodig hebben om een ​​nulhypothese te verwerpen. Als onze nulhypothese iets betreft dat algemeen als waar wordt geaccepteerd, dan moet er een hoge mate van bewijs zijn om de nulhypothese te verwerpen. Dit wordt geleverd door een p-waarde die veel kleiner is dan de veelgebruikte waarden voor alfa.

Conclusie

Er is niet één alfa-waarde die de statistische significantie bepaalt. Hoewel getallen zoals 0,10, 0,05 en 0,01 waarden zijn die vaak worden gebruikt voor alfa, is er geen dwingende wiskundige stelling die zegt dat dit de enige significantieniveaus zijn die we kunnen gebruiken. Zoals met veel dingen in de statistiek, moeten we nadenken voordat we berekenen en vooral gezond verstand gebruiken.