Definitie van Bimodal in de statistiek

Een gegevensset is bimodaal als deze twee modi heeft. Dit betekent dat er geen enkele gegevenswaarde met de hoogste frequentie voorkomt. In plaats daarvan zijn er twee gegevenswaarden die overeenkomen voor het hebben van de hoogste frequentie.

Voorbeeld van een bimodale gegevensset

Om deze definitie te begrijpen, kijken we naar een voorbeeld van een set met één modus en stellen dit vervolgens in contrast met een bimodale gegevensset. Stel dat we de volgende gegevensset hebben:

1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 8, 10, 10

We tellen de frequentie van elk nummer in de gegevensset:

1 komt drie keer in de set voor
2 komt vier keer voor in de set
3 komt één keer in de set voor
4 komt één keer in de set voor
5 komt twee keer in de set voor
6 komt drie keer voor in de set
7 komt drie keer voor in de set
8 komt één keer in de set voor
9 treedt op in de ingestelde nul keer
10 komt twee keer in de set voor

Hier zien we dat 2 het meest voorkomt, en dus is het de modus van de gegevensset.

We contrasteren dit voorbeeld met het volgende

1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 10, 10, 10, 10, 10

We tellen de frequentie van elk nummer in de gegevensset:

1 komt drie keer in de set voor
2 komt vier keer voor in de set
3 komt één keer in de set voor
4 komt één keer in de set voor
5 komt twee keer in de set voor
6 komt drie keer voor in de set
7 komt vijf keer voor in de set
8 komt één keer in de set voor
9 treedt op in de ingestelde nul keer
10 komt vijf keer in de set voor

Hier komen 7 en 10 vijf keer voor. Dit is hoger dan een van de andere gegevenswaarden. We zeggen dus dat de gegevensset bimodaal is, wat betekent dat deze twee modi heeft. Elk voorbeeld van een bimodale gegevensset lijkt hier op.

Implicaties van een bimodale verdeling

De modus is een manier om het midden van een set gegevens te meten. Soms is de gemiddelde waarde van een variabele de meest voorkomende. Om deze reden is het belangrijk om te zien of een gegevensset bimodaal is. In plaats van een enkele modus zouden we er twee hebben.

Een belangrijke implicatie van een bimodale gegevensset is dat deze ons kan onthullen dat er twee verschillende soorten personen in een gegevensset zijn vertegenwoordigd. Een histogram van een bimodale gegevensset vertoont twee pieken of bulten.

Een histogram van bimodale testscores heeft bijvoorbeeld twee pieken. Deze pieken komen overeen met waar de hoogste frequentie van studenten heeft gescoord. Als er twee modi zijn, kan dit aantonen dat er twee soorten studenten zijn: degenen die waren voorbereid op de test en degenen die niet waren voorbereid.

Wetenschap