Het eerste en derde kwartiel zijn beschrijvende statistieken die positiemetingen in een gegevensset zijn. Net zoals de mediaan het middenpunt van een gegevensset aangeeft, markeert het eerste kwartiel het kwart of 25% -punt. Ongeveer 25% van de gegevenswaarden is kleiner dan of gelijk aan het eerste kwartiel. Het derde kwartiel is vergelijkbaar, maar voor de bovenste 25% van de gegevenswaarden. We zullen deze ideeën in meer detail nader bekijken in het volgende.
Er zijn verschillende manieren om het midden van een set gegevens te meten. Het gemiddelde, de mediaan, de modus en het middenbereik hebben allemaal hun voordelen en beperkingen bij het weergeven van het midden van de gegevens. Van al deze manieren om het gemiddelde te vinden, is de mediaan het meest bestand tegen uitbijters. Het markeert het midden van de gegevens in die zin dat de helft van de gegevens kleiner is dan de mediaan.
Er is geen reden om te stoppen met het vinden van alleen het midden. Wat als we zouden besluiten dit proces voort te zetten? We kunnen de mediaan van de onderste helft van onze gegevens berekenen. De helft van 50% is 25%. Dus de helft van de helft of een kwart van de gegevens zou hieronder liggen. Omdat we te maken hebben met een kwart van de oorspronkelijke set, wordt deze mediaan van de onderste helft van de gegevens het eerste kwartiel genoemd en wordt aangegeven met Q1.
Er is geen reden waarom we naar de onderste helft van de gegevens hebben gekeken. In plaats daarvan hadden we naar de bovenste helft kunnen kijken en dezelfde stappen als hierboven hebben uitgevoerd. De mediaan van deze helft, die we zullen aangeven Q3 splitst de gegevensset ook in kwartalen. Dit getal geeft echter het bovenste kwart van de gegevens aan. Dus driekwart van de gegevens is lager dan ons aantal Q3. Dit is waarom we bellen Q3 het derde kwartiel.
Laten we een voorbeeld bekijken om dit allemaal duidelijk te maken. Het kan nuttig zijn om eerst te bekijken hoe u de mediaan van sommige gegevens kunt berekenen. Begin met de volgende gegevensset:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Er zijn in totaal twintig gegevenspunten in de set. We beginnen met het vinden van de mediaan. Aangezien er een even aantal gegevenswaarden is, is de mediaan het gemiddelde van de tiende en elfde waarden. Met andere woorden, de mediaan is:
(7 + 8) / 2 = 7,5.
Kijk nu naar de onderste helft van de gegevens. De mediaan van deze helft wordt gevonden tussen de vijfde en zesde waarden van:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Het eerste kwartiel blijkt dus gelijk te zijn Q1 = (4 + 6) / 2 = 5
Kijk naar de bovenste helft van de oorspronkelijke gegevensset om het derde kwartiel te vinden. We moeten de mediaan vinden van:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Hier is de mediaan (15 + 15) / 2 = 15. Dus het derde kwartiel Q3 = 15.
Kwartielen helpen ons om een vollediger beeld te krijgen van onze dataset als geheel. Het eerste en derde kwartiel geven ons informatie over de interne structuur van onze gegevens. De middelste helft van de gegevens valt tussen het eerste en derde kwartiel en is gecentreerd rond de mediaan. Het verschil tussen het eerste en derde kwartiel, het interkwartielbereik genoemd, laat zien hoe de gegevens zijn gerangschikt over de mediaan. Een klein interkwartielbereik geeft gegevens aan die over de mediaan klonteren. Een groter interkwartielbereik laat zien dat de gegevens meer verspreid zijn.
Een meer gedetailleerd beeld van de gegevens kan worden verkregen door de hoogste waarde te kennen, de maximale waarde genoemd, en de laagste waarde, de minimale waarde genoemd. Het minimum, eerste kwartiel, mediaan, derde kwartiel en maximum zijn een reeks van vijf waarden die de samenvatting met vijf cijfers wordt genoemd. Een effectieve manier om deze vijf nummers weer te geven, wordt een boxplot of box and whisker-grafiek genoemd.