De interkwartielbereikregel is handig bij het detecteren van de aanwezigheid van uitbijters. Uitbijters zijn individuele waarden die buiten het algemene patroon van de rest van de gegevens vallen. Deze definitie is enigszins vaag en subjectief, dus het is nuttig om een regel te hebben om te helpen overwegen of een gegevenspunt echt een uitbijter is.
Elke gegevensset kan worden beschreven aan de hand van de samenvatting met vijf cijfers. Deze vijf nummers, in oplopende volgorde, bestaan uit:
Deze vijf nummers kunnen worden gebruikt om ons nogal wat over onze gegevens te vertellen. Het bereik, dat bijvoorbeeld het minimum is dat wordt afgetrokken van het maximum, is een indicator voor het spreiden van de gegevensset..
Vergelijkbaar met het bereik, maar minder gevoelig voor uitbijters, is het interkwartielbereik. Het interkwartielbereik wordt op vrijwel dezelfde manier berekend als het bereik. Het enige dat we doen is het eerste kwartiel van het derde kwartiel aftrekken:
IQR = Q3 - Q1.
Het interkwartielbereik laat zien hoe de gegevens over de mediaan worden verspreid. Het is minder gevoelig dan het bereik voor uitbijters.
Het interkwartielbereik kan worden gebruikt om uitbijters te detecteren. Het enige dat we moeten doen, is het volgende:
Het is belangrijk om te onthouden dat dit een vuistregel is en in het algemeen geldt. Over het algemeen moeten we onze analyse opvolgen. Elke potentiële uitbijter die met deze methode wordt verkregen, moet worden onderzocht in de context van de volledige set gegevens.
We zullen deze interkwartielbereikregel aan het werk zien met een numeriek voorbeeld. Stel dat we de volgende gegevensset hebben: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. De vijf cijfersamenvatting voor deze gegevensset is minimaal = 1, eerste kwartiel = 4, mediaan = 7, derde kwartiel = 10 en maximum = 17. We kunnen de gegevens bekijken en zeggen dat 17 een uitbijter is. Maar wat zegt onze interkwartielafstandsregel??
We berekenen het interkwartielbereik
Q3 - Q1 = 10 - 4 = 6
We vermenigvuldigen nu met 1,5 en hebben 1,5 x 6 = 9. Negen minder dan het eerste kwartiel is 4 - 9 = -5. Geen gegevens zijn minder dan dit. Negen meer dan het derde kwartiel is 10 + 9 = 19. Geen gegevens zijn groter dan dit. Ondanks dat de maximale waarde vijf meer is dan het dichtstbijzijnde gegevenspunt, geeft de regel voor interkwartielbereik aan dat deze waarschijnlijk niet als een uitbijter voor deze gegevensset moet worden beschouwd.