Er zijn verschillende beschrijvende statistieken. Getallen zoals het gemiddelde, de mediaan, de modus, scheefheid, kurtosis, standaardafwijking, eerste kwartiel en derde kwartiel, om er maar een paar te noemen, vertellen elk iets over onze gegevens. In plaats van deze beschrijvende statistieken afzonderlijk te bekijken, helpt het soms om ze te combineren om ons een compleet beeld te geven. Met dit doel voor ogen is de samenvatting met vijf cijfers een handige manier om vijf beschrijvende statistieken te combineren.
Het is duidelijk dat er vijf getallen in onze samenvatting moeten zijn, maar welke vijf? De gekozen cijfers zijn bedoeld om ons te helpen het centrum van onze gegevens te kennen, evenals hoe verspreid de gegevenspunten zijn. Met dit in gedachten bestaat de samenvatting met vijf cijfers uit het volgende:
Het gemiddelde en de standaarddeviatie kunnen ook samen worden gebruikt om het centrum en de verspreiding van een set gegevens over te brengen. Beide statistieken zijn echter gevoelig voor uitbijters. Het mediaan, het eerste kwartiel en het derde kwartiel worden niet zo sterk beïnvloed door uitbijters.
Gegeven de volgende set gegevens, zullen we de samenvatting met vijf cijfers rapporteren:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
De gegevensset bevat in totaal twintig punten. De mediaan is dus het gemiddelde van de tiende en elfde gegevenswaarden of:
(7 + 8) / 2 = 7,5.
De mediaan van de onderste helft van de gegevens is het eerste kwartiel. De onderste helft is:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Zo berekenen weQ1= (4 + 6) / 2 = 5.
De mediaan van de bovenste helft van de oorspronkelijke gegevensset is het derde kwartiel. We moeten de mediaan vinden van:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Zo berekenen weQ3= (15 + 15) / 2 = 15.
We verzamelen alle bovenstaande resultaten samen en melden dat de samenvatting met vijf cijfers voor de bovenstaande gegevensset 1, 5, 7.5, 12, 20 is.
Vijf samenvattingen van getallen kunnen met elkaar worden vergeleken. We zullen ontdekken dat twee sets met vergelijkbare middelen en standaarddeviaties heel verschillende vijf getalsamenvattingen kunnen hebben. Om eenvoudig twee vijf getallenoverzichten in één oogopslag te vergelijken, kunnen we een boxplot of box en whiskersgrafiek gebruiken.