Correlatie is een belangrijk statistisch hulpmiddel. Deze methode in de statistiek kan ons helpen de relatie tussen twee variabelen te bepalen en te beschrijven. We moeten voorzichtig zijn om correlatie correct te gebruiken en te interpreteren. Een dergelijke waarschuwing is om altijd te onthouden dat correlatie geen oorzakelijk verband impliceert. Er zijn andere aspecten van correlatie waar we voorzichtig mee moeten zijn. Bij het werken met correlatie moeten we ook voorzichtig zijn met ecologische correlatie.
Ecologische correlatie is een correlatie op basis van gemiddelden. Hoewel dit nuttig kan zijn, en soms zelfs noodzakelijk om te overwegen, moeten we voorzichtig zijn om niet aan te nemen dat dit soort correlatie ook op individuen van toepassing is.
We zullen het concept van ecologische correlatie illustreren en benadrukken dat het niet misbruikt zal worden, door enkele voorbeelden te bekijken. Een voorbeeld van een ecologische correlatie tussen twee variabelen is het aantal jaren opleiding en het gemiddelde inkomen. We kunnen zien dat deze twee variabelen behoorlijk sterk gecorreleerd zijn: hoe hoger het aantal opleidingsjaren, hoe hoger het gemiddelde inkomensniveau. Het zou een vergissing zijn om vervolgens te denken dat deze correlatie geldt voor individuele inkomens.
Wanneer we personen met dezelfde opleiding beschouwen, zijn de inkomensniveaus gespreid. Als we een spreidingsdiagram van deze gegevens zouden construeren, zouden we deze spreiding van punten zien. Het gevolg zou zijn dat de correlatie tussen opleiding en individuele inkomens veel zwakker zou zijn dan de correlatie tussen opleidingsjaren en gemiddelde inkomens.
Een ander voorbeeld van ecologische correlatie dat we zullen overwegen, betreft stempatronen en inkomensniveau. Op het niveau van de staat stemmen rijkere staten meestal in een hoger percentage voor Democratische kandidaten. Armere staten stemmen in grotere proporties voor Republikeinse kandidaten. Voor individuen verandert deze correlatie. Een groter deel van armere individuen stemt democratisch en een groter deel van rijke individuen stemt republikeins.
Een derde voorbeeld van ecologische correlatie is wanneer we kijken naar het aantal uren wekelijkse training en de gemiddelde body mass index. Hier is het aantal trainingsuren de verklarende variabele en de gemiddelde body mass index is de respons. Naarmate lichaamsbeweging toeneemt, verwachten we dat de body mass index daalt. We zouden dus een sterke negatieve correlatie tussen deze variabelen waarnemen. Wanneer we echter naar het individuele niveau kijken, zou de correlatie niet zo sterk zijn.
Ecologische correlatie is gerelateerd aan de ecologische denkfout en is een voorbeeld van dit soort denkfout. Dit type logische denkfout leidt ertoe dat een statistische verklaring met betrekking tot een groep ook van toepassing is op de individuen binnen die groep. Dit is een vorm van de splitsingsfout, die uitspraken met groepen voor individuen vergist.
Een andere manier waarop ecologische denkfouten in statistieken voorkomen, is de paradox van Simpson. De paradox van Simpson verwijst naar de vergelijking tussen twee individuen of populaties. We zullen een onderscheid maken tussen deze twee door A en B. Een serie metingen kan laten zien dat een variabele altijd een hogere waarde heeft voor A in plaats van B. Maar als we de waarden van deze variabele gemiddelde nemen, zien we dat B groter is dan A.
De term ecologisch is gerelateerd aan ecologie. Een gebruik van de term ecologie is om te verwijzen naar een bepaalde tak van de biologie. Dit deel van de biologie bestudeert de interacties tussen organismen en hun omgeving. Deze overweging van een individu als onderdeel van iets veel groters is de betekenis waarin dit soort correlatie wordt genoemd.