Een histogram is een type grafiek dat brede toepassingen in de statistiek heeft. Histogrammen geven een visuele interpretatie van numerieke gegevens door het aantal gegevenspunten aan te geven dat binnen een bereik van waarden ligt. Deze waardenbereiken worden klassen of bins genoemd. De frequentie van de gegevens die in elke klasse vallen, wordt weergegeven door het gebruik van een balk. Hoe hoger de balk, hoe groter de frequentie van gegevenswaarden in die prullenbak.
Op het eerste gezicht lijken histogrammen erg op staafdiagrammen. Beide grafieken maken gebruik van verticale balken om gegevens weer te geven. De hoogte van een balk komt overeen met de relatieve frequentie van de hoeveelheid gegevens in de klasse. Hoe hoger de balk, hoe hoger de frequentie van de gegevens. Hoe lager de balk, hoe lager de frequentie van gegevens. Maar uiterlijk kan bedriegen. Hier eindigen de overeenkomsten tussen de twee soorten grafieken.
De reden dat dit soort grafieken verschillend zijn, heeft te maken met het meetniveau van de gegevens. Enerzijds worden staafdiagrammen gebruikt voor gegevens op het nominale meetniveau. Staafdiagrammen meten de frequentie van categorische gegevens en de klassen voor een staafdiagram zijn deze categorieën. Aan de andere kant worden histogrammen gebruikt voor gegevens die ten minste op het ordinale meetniveau liggen. De klassen voor een histogram zijn waardenbereiken.
Een ander belangrijk verschil tussen staafgrafieken en histogrammen heeft te maken met de volgorde van de staven. In een staafdiagram is het gebruikelijk om de staven te herschikken in volgorde van afnemende hoogte. De staven in een histogram kunnen echter niet worden verplaatst. Ze moeten worden weergegeven in de volgorde waarin de klassen voorkomen.
Bovenstaand diagram toont ons een histogram. Stel dat vier munten worden omgedraaid en de resultaten worden vastgelegd. Het gebruik van de juiste binomiale distributietabel of eenvoudige berekeningen met de binomiale formule toont de waarschijnlijkheid dat er geen koppen worden weergegeven 1/16, de kans dat één kop wordt weergegeven is 4/16. De kans op twee hoofden is 6/16. De kans op drie koppen is 4/16. De waarschijnlijkheid van vier koppen is 1/16.
We construeren in totaal vijf klassen, elk met een breedte. Deze klassen komen overeen met het aantal mogelijke koppen: nul, één, twee, drie of vier. Boven elke klasse tekenen we een verticale balk of rechthoek. De hoogten van deze balken komen overeen met de waarschijnlijkheden die worden genoemd voor ons waarschijnlijkheidsexperiment om vier munten om te draaien en de koppen te tellen.
Het bovenstaande voorbeeld toont niet alleen de constructie van een histogram, maar het laat ook zien dat discrete waarschijnlijkheidsverdelingen kunnen worden weergegeven met een histogram. Inderdaad, en discrete waarschijnlijkheidsverdeling kan worden weergegeven door een histogram.
Om een histogram te construeren dat een waarschijnlijkheidsverdeling vertegenwoordigt, beginnen we met het selecteren van de klassen. Dit zouden de uitkomsten van een waarschijnlijkheidsexperiment moeten zijn. De breedte van elk van deze klassen moet één eenheid zijn. De hoogten van de balken van het histogram zijn de kansen voor elk van de uitkomsten. Met een op deze manier geconstrueerd histogram zijn de gebieden van de balken ook waarschijnlijkheden.
Aangezien dit soort histogram ons waarschijnlijkheden geeft, is het onderworpen aan een aantal voorwaarden. Een bepaling is dat alleen niet-negatieve getallen kunnen worden gebruikt voor de schaal die ons de hoogte van een gegeven balk van het histogram geeft. Een tweede voorwaarde is dat, aangezien de waarschijnlijkheid gelijk is aan het gebied, alle gebieden van de balken in totaal één moeten zijn, gelijk aan 100%.
De balken in een histogram hoeven geen waarschijnlijkheden te zijn. Histogrammen zijn nuttig op andere gebieden dan waarschijnlijkheid. Telkens wanneer we de frequentie van het voorkomen van kwantitatieve gegevens willen vergelijken, kan een histogram worden gebruikt om onze gegevensset weer te geven.