Een gegevensset is bimodaal als deze twee modi heeft. Dit betekent dat er geen enkele gegevenswaarde met de hoogste frequentie voorkomt. In plaats daarvan zijn er twee gegevenswaarden die overeenkomen voor het hebben van de hoogste frequentie.
Om deze definitie te begrijpen, kijken we naar een voorbeeld van een set met één modus en stellen dit vervolgens in contrast met een bimodale gegevensset. Stel dat we de volgende gegevensset hebben:
1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 8, 10, 10
We tellen de frequentie van elk nummer in de gegevensset:
Hier zien we dat 2 het meest voorkomt, en dus is het de modus van de gegevensset.
We contrasteren dit voorbeeld met het volgende
1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 10, 10, 10, 10, 10
We tellen de frequentie van elk nummer in de gegevensset:
Hier komen 7 en 10 vijf keer voor. Dit is hoger dan een van de andere gegevenswaarden. We zeggen dus dat de gegevensset bimodaal is, wat betekent dat deze twee modi heeft. Elk voorbeeld van een bimodale gegevensset lijkt hier op.
De modus is een manier om het midden van een set gegevens te meten. Soms is de gemiddelde waarde van een variabele de meest voorkomende. Om deze reden is het belangrijk om te zien of een gegevensset bimodaal is. In plaats van een enkele modus zouden we er twee hebben.
Een belangrijke implicatie van een bimodale gegevensset is dat deze ons kan onthullen dat er twee verschillende soorten personen in een gegevensset zijn vertegenwoordigd. Een histogram van een bimodale gegevensset vertoont twee pieken of bulten.
Een histogram van bimodale testscores heeft bijvoorbeeld twee pieken. Deze pieken komen overeen met waar de hoogste frequentie van studenten heeft gescoord. Als er twee modi zijn, kan dit aantonen dat er twee soorten studenten zijn: degenen die waren voorbereid op de test en degenen die niet waren voorbereid.