Hoe een hypothesetest uit te voeren

Het idee van hypothesetesten is relatief eenvoudig. In verschillende onderzoeken observeren we bepaalde gebeurtenissen. We moeten vragen, is het evenement alleen door toeval, of is er een oorzaak waarnaar we moeten zoeken? We moeten een manier hebben om onderscheid te maken tussen gebeurtenissen die zich gemakkelijk toevallig voordoen en gebeurtenissen die hoogst onwaarschijnlijk zijn. Een dergelijke methode moet worden gestroomlijnd en goed gedefinieerd, zodat anderen onze statistische experimenten kunnen repliceren.

Er zijn een paar verschillende methoden die worden gebruikt om hypothesetests uit te voeren. Een van deze methoden staat bekend als de traditionele methode, en een andere heeft betrekking op wat bekend staat als een p-waarde. De stappen van deze twee meest voorkomende methoden zijn tot op zekere hoogte identiek en lopen dan enigszins uiteen. Zowel de traditionele methode voor het testen van hypothesen als de p-waarde methode worden hieronder beschreven.

De traditionele methode

De traditionele methode is als volgt:

  1. Begin met de bewering of hypothese die wordt getest. Vorm ook een verklaring voor het geval dat de hypothese onjuist is.
  2. Druk beide uitspraken uit de eerste stap in wiskundige symbolen uit. Deze verklaringen gebruiken symbolen zoals ongelijkheden en gelijktekens.
  3. Bepaal welke van de twee symbolische verklaringen geen gelijkheid bevat. Dit kan eenvoudig een "niet gelijk" -teken zijn, maar ook een "is minder dan" -teken (). De verklaring die ongelijkheid bevat, wordt de alternatieve hypothese genoemd en wordt aangegeven H1 of Heen.
  4. De uitspraak uit de eerste stap die de uitspraak doet dat een parameter gelijk is aan een bepaalde waarde, wordt de nulhypothese genoemd H0.
  5. Kies welk significantieniveau dat we willen. Een significantieniveau wordt meestal aangeduid met de Griekse letter alfa. Hier moeten we Type I-fouten overwegen. Een Type I-fout treedt op wanneer we een nulhypothese verwerpen die feitelijk waar is. Als we ons erg zorgen maken over deze mogelijkheid, moet onze waarde voor alpha klein zijn. Er is een beetje een afweging hier. Hoe kleiner de alfa, hoe duurder het experiment. De waarden 0,05 en 0,01 zijn algemene waarden die worden gebruikt voor alfa, maar elk positief getal tussen 0 en 0,50 kan worden gebruikt voor een significantieniveau.
  6. Bepaal welke statistiek en distributie we moeten gebruiken. Het type distributie wordt bepaald door kenmerken van de gegevens. Gemeenschappelijke distributies omvatten z partituur, t score en chi-kwadraat.
  7. Zoek de teststatistiek en de kritieke waarde voor deze statistiek. Hier zullen we moeten overwegen of we een tweezijdige test uitvoeren (meestal wanneer de alternatieve hypothese een 'is niet gelijk aan'-symbool of een eenzijdige test bevat (meestal gebruikt wanneer een ongelijkheid betrokken is bij de verklaring van de alternatieve hypothese).
  8. Van het type distributie, betrouwbaarheidsniveau, kritische waarde en teststatistiek schetsen we een grafiek.
  9. Als de teststatistiek zich in onze kritieke regio bevindt, moeten we de nulhypothese verwerpen. De alternatieve hypothese bestaat. Als de teststatistiek zich niet in onze kritieke regio bevindt, kunnen we de nulhypothese niet verwerpen. Dit bewijst niet dat de nulhypothese waar is, maar geeft een manier om te kwantificeren hoe waarschijnlijk het is dat deze waar is.
  10. We vermelden nu de resultaten van de hypothesetest zodanig dat de oorspronkelijke claim wordt aangepakt.

De p-Waarde methode

De p-waardemethode is bijna identiek aan de traditionele methode. De eerste zes stappen zijn hetzelfde. Voor stap zeven vinden we de teststatistiek en p-waarde. We verwerpen dan de nulhypothese als de p-waarde is kleiner dan of gelijk aan alfa. We falen de nulhypothese te verwerpen als de p-waarde is groter dan alfa. We sluiten de test vervolgens af zoals eerder, door de resultaten duidelijk te vermelden.