Een van de doelen van statistieken is om gegevens op een zinvolle manier te ordenen. Tweerichtingstabellen zijn een belangrijke manier om een bepaald type gepaarde gegevens te ordenen. Net als bij de constructie van grafieken of tabellen in statistieken, is het erg belangrijk om te weten met welke soorten variabelen we werken. Als we kwantitatieve gegevens hebben, moet een grafiek zoals een histogram of stengel en bladplot worden gebruikt. Als we categorische gegevens hebben, is een staafdiagram of cirkeldiagram geschikt.
Bij het werken met gepaarde gegevens moeten we voorzichtig zijn. Er is een spreidingsdiagram voor gepaarde kwantitatieve gegevens, maar wat voor soort grafiek is er voor gepaarde categorische gegevens? Wanneer we twee categorische variabelen hebben, moeten we een tabel met twee richtingen gebruiken.
Ten eerste herinneren we eraan dat categorische gegevens betrekking hebben op kenmerken of categorieën. Het is niet kwantitatief en heeft geen numerieke waarden.
Een tweerichtings tabel omvat het opsommen van alle waarden of niveaus voor twee categorische variabelen. Alle waarden voor een van de variabelen worden in een verticale kolom weergegeven. De waarden voor de andere variabele worden weergegeven langs een horizontale rij. Als de eerste variabele heeft m waarden en de tweede variabele heeft n waarden, dan komt er een totaal van mn vermeldingen in de tabel. Elk van deze items komt overeen met een specifieke waarde voor elk van de twee variabelen.
Langs elke rij en langs elke kolom worden de items opgeteld. Deze totalen zijn belangrijk bij het bepalen van marginale en voorwaardelijke verdelingen. Deze totalen zijn ook belangrijk wanneer we een chikwadraat-test voor onafhankelijkheid uitvoeren.
We zullen bijvoorbeeld een situatie bekijken waarin we kijken naar verschillende secties van een statistiekcursus aan een universiteit. We willen een tweerichtingstabel samenstellen om te bepalen welke eventuele verschillen er tussen de mannen en vrouwen in de cursus zijn. Om dit te bereiken, tellen we het aantal van elke letterklasse dat werd verdiend door leden van elk geslacht.
We merken op dat de eerste categorische variabele die van het geslacht is, en er zijn twee mogelijke waarden in de studie van mannen en vrouwen. De tweede categorische variabele is die van letterklasse, en er zijn vijf waarden die worden gegeven door A, B, C, D en F. Dit betekent dat we een tweewegtabel hebben met 2 x 5 = 10 ingangen, plus een extra rij en een extra kolom die nodig is om de rij- en kolomtotalen te tabellen.
Ons onderzoek toont aan dat:
Deze informatie wordt ingevoerd in de onderstaande tweerichtingslijst. Het totaal van elke rij geeft aan hoeveel van elk soort cijfer is verdiend. De kolomtotalen vertellen ons het aantal mannen en het aantal vrouwen.
Tweezijdige tabellen helpen om onze gegevens te ordenen wanneer we twee categorische variabelen hebben. Deze tabel kan worden gebruikt om ons te helpen twee verschillende groepen in onze gegevens te vergelijken. We zouden bijvoorbeeld de relatieve prestaties van mannen in de statistiekcursus kunnen vergelijken met de prestaties van vrouwen in de cursus.
Na het vormen van een tweerichtings tabel, kan de volgende stap zijn om de gegevens statistisch te analyseren. We kunnen vragen of de variabelen die in het onderzoek aanwezig zijn, onafhankelijk zijn van elkaar of niet. Om deze vraag te beantwoorden, kunnen we een chikwadraat-test op de tweerichtingslijst gebruiken.
Mannetje | Vrouw | Totaal | |
EEN | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Totaal | 280 | 260 | 540 |