Het verschil tussen het gemiddelde, de mediaan en de modus

Metingen van centrale neiging zijn getallen die beschrijven wat gemiddeld of typisch is binnen een gegevensdistributie. Er zijn drie belangrijke maten voor centrale tendens: gemiddelde, mediaan en modus. Hoewel het allemaal maten van centrale neiging zijn, wordt elk anders berekend en meet het iets anders dan de anderen.

De betekenis

Het gemiddelde is de meest gebruikelijke maat voor centrale neiging die wordt gebruikt door onderzoekers en mensen in allerlei beroepen. Het is de maat voor centrale neiging die ook wordt aangeduid als het gemiddelde. Een onderzoeker kan het gemiddelde gebruiken om de gegevensverdeling van variabelen te meten die zijn gemeten als intervallen of verhoudingen. Dit zijn variabelen die numeriek overeenkomstige categorieën of reeksen bevatten (zoals ras, klasse, geslacht of opleidingsniveau), evenals variabelen die numeriek worden gemeten vanaf een schaal die begint met nul (zoals gezinsinkomen of het aantal kinderen binnen een gezin).

Een gemiddelde is heel eenvoudig te berekenen. Men moet gewoon alle gegevenswaarden of "scores" toevoegen en deze som vervolgens delen door het totale aantal scores in de gegevensverdeling. Als bijvoorbeeld vijf gezinnen respectievelijk 0, 2, 2, 3 en 5 kinderen hebben, is het gemiddelde aantal kinderen (0 + 2 + 2 + 3 + 5) / 5 = 12/5 = 2.4. Dit betekent dat de vijf huishoudens gemiddeld 2,4 kinderen hebben.

De mediaan

De mediaan is de waarde in het midden van een gegevensdistributie wanneer die gegevens zijn georganiseerd van de laagste tot de hoogste waarde. Deze maat voor centrale neiging kan worden berekend voor variabelen die worden gemeten met ordinale, interval- of verhoudingsschalen.

Het berekenen van de mediaan is ook vrij eenvoudig. Laten we aannemen dat we de volgende lijst met getallen hebben: 5, 7, 10, 43, 2, 69, 31, 6, 22. Eerst moeten we de getallen rangschikken van laag naar hoog. Het resultaat is dit: 2, 5, 6, 7, 10, 22, 31, 43, 69. De mediaan is 10 omdat dit het exacte middelste getal is. Er zijn vier nummers onder de 10 en vier nummers boven de 10.

Als uw gegevensdistributie een even aantal gevallen heeft, wat betekent dat er geen exact midden is, past u het gegevensbereik eenvoudig aan om de mediaan te berekenen. Als we bijvoorbeeld het nummer 87 aan het einde van onze bovenstaande lijst met nummers toevoegen, hebben we 10 totale nummers in onze distributie, dus er is geen enkel middelste nummer. In dit geval neemt men het gemiddelde van de scores voor de twee middelste getallen. In onze nieuwe lijst zijn de twee middelste getallen 10 en 22. Dus nemen we het gemiddelde van die twee getallen: (10 + 22) / 2 = 16. Onze mediaan is nu 16.

De mode

De modus is de maat voor de centrale neiging die de categorie of score identificeert die het meest voorkomt bij de distributie van gegevens. Met andere woorden, het is de meest voorkomende score of de score die het hoogste aantal keren in een distributie verschijnt. De modus kan worden berekend voor elk type gegevens, inclusief die gemeten als nominale variabelen, of op naam.

Laten we bijvoorbeeld zeggen dat we kijken naar huisdieren die eigendom zijn van 100 families en de verdeling ziet er als volgt uit:

Dier   Aantal families dat het bezit

  • Hond: 60
  • Cat: 35
  • Vis: 17
  • Hamster: 13
  • Snake: 3

De modus hier is "hond" omdat meer families een hond bezitten dan enig ander dier. Merk op dat de modus altijd wordt uitgedrukt als de categorie of score, niet de frequentie van die score. In het bovenstaande voorbeeld is de modus bijvoorbeeld 'hond', niet 60, wat het aantal keren is dat hond verschijnt.

Sommige distributies hebben helemaal geen modus. Dit gebeurt wanneer elke categorie dezelfde frequentie heeft. Andere distributies kunnen meer dan één modus hebben. Wanneer een distributie bijvoorbeeld twee scores of categorieën met dezelfde hoogste frequentie heeft, wordt deze vaak 'bimodaal' genoemd.