Een van de vele manieren waarop variabelen in statistieken kunnen worden geclassificeerd, is rekening te houden met de verschillen tussen verklarende en responsvariabelen. Hoewel deze variabelen gerelateerd zijn, zijn er belangrijke verschillen tussen hen. Na het definiëren van dit soort variabelen zullen we zien dat de juiste identificatie van deze variabelen een directe invloed heeft op andere aspecten van statistieken, zoals de constructie van een spreidingsdiagram en de helling van een regressielijn.
We beginnen met het bekijken van de definities van dit soort variabelen. Een responsvariabele is een bepaalde hoeveelheid waarover we in ons onderzoek een vraag stellen. Een verklarende variabele is elke factor die de responsvariabele kan beïnvloeden. Hoewel er veel verklarende variabelen kunnen zijn, zullen we ons primair bezighouden met een enkele verklarende variabele.
Een responsvariabele is mogelijk niet aanwezig in een onderzoek. De naamgeving van dit type variabele hangt af van de vragen die door een onderzoeker worden gesteld. Het uitvoeren van een observationeel onderzoek zou een voorbeeld zijn van een geval waarin er geen responsvariabele is. Een experiment heeft een responsvariabele. Het zorgvuldige ontwerp van een experiment probeert vast te stellen dat de wijzigingen in een responsvariabele rechtstreeks worden veroorzaakt door wijzigingen in de verklarende variabelen.
Om deze concepten te verkennen zullen we een paar voorbeelden onderzoeken. Stel voor het eerste voorbeeld dat een onderzoeker geïnteresseerd is in het bestuderen van de stemming en attitudes van een groep eerstejaars studenten. Alle eerstejaarsstudenten krijgen een reeks vragen. Deze vragen zijn bedoeld om de mate van heimwee van een student te beoordelen. Studenten geven in het onderzoek ook aan hoe ver hun universiteit van huis is.
Een onderzoeker die deze gegevens onderzoekt, is misschien gewoon geïnteresseerd in de soorten reacties van studenten. Misschien is de reden hiervoor om een algemeen beeld te hebben van de samenstelling van een nieuwe eerstejaarsstudent. In dit geval is er geen responsvariabele. Dit komt omdat niemand ziet of de waarde van de ene variabele de waarde van een andere beïnvloedt.
Een andere onderzoeker zou dezelfde gegevens kunnen gebruiken om te proberen te antwoorden als studenten die van verder weg kwamen meer heimwee hadden. In dit geval zijn de gegevens met betrekking tot de problemen met heimwee de waarden van een antwoordvariabele en vormen de gegevens die de afstand tot thuis aangeven de verklarende variabele.
Voor het tweede voorbeeld zijn we misschien nieuwsgierig of het aantal uren dat aan huiswerk is besteed van invloed is op het cijfer dat een student op een examen verdient. In dit geval, omdat we laten zien dat de waarde van de ene variabele de waarde van een andere verandert, is er een verklarende en een responsvariabele. Het aantal bestudeerde uren is de verklarende variabele en de score op de test is de responsvariabele.
Wanneer we met gepaarde kwantitatieve gegevens werken, is het passend om een spreidingsdiagram te gebruiken. Het doel van dit soort grafieken is om relaties en trends binnen de gepaarde gegevens aan te tonen. We hebben niet zowel een verklarende als een responsvariabele nodig. Als dit het geval is, kan elke variabele langs elke as worden uitgezet. In het geval dat er een respons- en verklarende variabele is, wordt de verklarende variabele altijd uitgezet langs de X of horizontale as van een Cartesiaans coördinatensysteem. De responsvariabele wordt vervolgens uitgezet langs de Y as.
Het onderscheid tussen verklarende en responsvariabelen is vergelijkbaar met een andere classificatie. Soms verwijzen we naar variabelen als onafhankelijk of afhankelijk. De waarde van een afhankelijke variabele is afhankelijk van die van een onafhankelijke variabele. Een responsvariabele komt dus overeen met een afhankelijke variabele, terwijl een verklarende variabele overeenkomt met een onafhankelijke variabele. Deze terminologie wordt meestal niet gebruikt in statistieken omdat de verklarende variabele niet echt onafhankelijk is. In plaats daarvan neemt de variabele alleen de waarden aan die worden waargenomen. We hebben mogelijk geen controle over de waarden van een verklarende variabele.