Wat is de 5-cijferige samenvatting?

Er zijn verschillende beschrijvende statistieken. Getallen zoals het gemiddelde, de mediaan, de modus, scheefheid, kurtosis, standaardafwijking, eerste kwartiel en derde kwartiel, om er maar een paar te noemen, vertellen elk iets over onze gegevens. In plaats van deze beschrijvende statistieken afzonderlijk te bekijken, helpt het soms om ze te combineren om ons een compleet beeld te geven. Met dit doel voor ogen is de samenvatting met vijf cijfers een handige manier om vijf beschrijvende statistieken te combineren.

Welke vijf nummers?

Het is duidelijk dat er vijf getallen in onze samenvatting moeten zijn, maar welke vijf? De gekozen cijfers zijn bedoeld om ons te helpen het centrum van onze gegevens te kennen, evenals hoe verspreid de gegevenspunten zijn. Met dit in gedachten bestaat de samenvatting met vijf cijfers uit het volgende:

  • Het minimum - dit is de kleinste waarde in onze dataset.
  • Het eerste kwartiel - dit nummer wordt aangegeven Q1 en 25% van onze gegevens valt onder het eerste kwartiel.
  • De mediaan - dit is het middenpunt van de gegevens. 50% van alle gegevens valt onder de mediaan.
  • Het derde kwartiel - dit nummer wordt aangegeven Q3 en 75% van onze gegevens valt onder het derde kwartiel.
  • Het maximum - dit is de grootste waarde in onze gegevensset.

Het gemiddelde en de standaarddeviatie kunnen ook samen worden gebruikt om het centrum en de verspreiding van een set gegevens over te brengen. Beide statistieken zijn echter gevoelig voor uitbijters. Het mediaan, het eerste kwartiel en het derde kwartiel worden niet zo sterk beïnvloed door uitbijters.

Een voorbeeld

Gegeven de volgende set gegevens, zullen we de samenvatting met vijf cijfers rapporteren:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

De gegevensset bevat in totaal twintig punten. De mediaan is dus het gemiddelde van de tiende en elfde gegevenswaarden of:

(7 + 8) / 2 = 7,5.

De mediaan van de onderste helft van de gegevens is het eerste kwartiel. De onderste helft is:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Zo berekenen weQ1= (4 + 6) / 2 = 5.

De mediaan van de bovenste helft van de oorspronkelijke gegevensset is het derde kwartiel. We moeten de mediaan vinden van:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Zo berekenen weQ3= (15 + 15) / 2 = 15.

We verzamelen alle bovenstaande resultaten samen en melden dat de samenvatting met vijf cijfers voor de bovenstaande gegevensset 1, 5, 7.5, 12, 20 is.

Grafische weergave

Vijf samenvattingen van getallen kunnen met elkaar worden vergeleken. We zullen ontdekken dat twee sets met vergelijkbare middelen en standaarddeviaties heel verschillende vijf getalsamenvattingen kunnen hebben. Om eenvoudig twee vijf getallenoverzichten in één oogopslag te vergelijken, kunnen we een boxplot of box en whiskersgrafiek gebruiken.