Wat is de interkwartielafstandsregel?

De interkwartielbereikregel is handig bij het detecteren van de aanwezigheid van uitbijters. Uitbijters zijn individuele waarden die buiten het algemene patroon van de rest van de gegevens vallen. Deze definitie is enigszins vaag en subjectief, dus het is nuttig om een ​​regel te hebben om te helpen overwegen of een gegevenspunt echt een uitbijter is.

Het interkwartielbereik

Elke gegevensset kan worden beschreven aan de hand van de samenvatting met vijf cijfers. Deze vijf nummers, in oplopende volgorde, bestaan ​​uit:

  • De minimale of laagste waarde van de gegevensset
  • Het eerste kwartiel Q1 - dit vertegenwoordigt een kwart van de weg door de lijst met alle gegevens
  • De mediaan van de gegevensset - dit is het middelpunt van de lijst met alle gegevens
  • Het derde kwartiel Q3 - dit vertegenwoordigt driekwart van de weg door de lijst met alle gegevens
  • De maximale of hoogste waarde van de gegevensset.

Deze vijf nummers kunnen worden gebruikt om ons nogal wat over onze gegevens te vertellen. Het bereik, dat bijvoorbeeld het minimum is dat wordt afgetrokken van het maximum, is een indicator voor het spreiden van de gegevensset..

Vergelijkbaar met het bereik, maar minder gevoelig voor uitbijters, is het interkwartielbereik. Het interkwartielbereik wordt op vrijwel dezelfde manier berekend als het bereik. Het enige dat we doen is het eerste kwartiel van het derde kwartiel aftrekken:

IQR = Q3 - Q1.

Het interkwartielbereik laat zien hoe de gegevens over de mediaan worden verspreid. Het is minder gevoelig dan het bereik voor uitbijters.

Interkwartielregel voor uitbijters

Het interkwartielbereik kan worden gebruikt om uitbijters te detecteren. Het enige dat we moeten doen, is het volgende:

  1. Bereken het interkwartielbereik voor onze gegevens
  2. Vermenigvuldig het interkwartielbereik (IQR) met het getal 1,5
  3. Voeg 1,5 x (IQR) toe aan het derde kwartiel. Elk getal groter dan dit is een vermoedelijke uitbijter.
  4. Trek 1,5 x (IQR) af van het eerste kwartiel. Elk getal lager dan dit is een vermoedelijke uitbijter.

Het is belangrijk om te onthouden dat dit een vuistregel is en in het algemeen geldt. Over het algemeen moeten we onze analyse opvolgen. Elke potentiële uitbijter die met deze methode wordt verkregen, moet worden onderzocht in de context van de volledige set gegevens.

Voorbeeld

We zullen deze interkwartielbereikregel aan het werk zien met een numeriek voorbeeld. Stel dat we de volgende gegevensset hebben: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. De vijf cijfersamenvatting voor deze gegevensset is minimaal = 1, eerste kwartiel = 4, mediaan = 7, derde kwartiel = 10 en maximum = 17. We kunnen de gegevens bekijken en zeggen dat 17 een uitbijter is. Maar wat zegt onze interkwartielafstandsregel??

We berekenen het interkwartielbereik

Q3 - Q1 = 10 - 4 = 6

We vermenigvuldigen nu met 1,5 en hebben 1,5 x 6 = 9. Negen minder dan het eerste kwartiel is 4 - 9 = -5. Geen gegevens zijn minder dan dit. Negen meer dan het derde kwartiel is 10 + 9 = 19. Geen gegevens zijn groter dan dit. Ondanks dat de maximale waarde vijf meer is dan het dichtstbijzijnde gegevenspunt, geeft de regel voor interkwartielbereik aan dat deze waarschijnlijk niet als een uitbijter voor deze gegevensset moet worden beschouwd.