Wat is een bereik in de statistiek?

In de statistiek en wiskunde is het bereik het verschil tussen de maximum- en minimumwaarden van een gegevensset en dient het als een van twee belangrijke kenmerken van een gegevensset. De formule voor een bereik is de maximale waarde minus de minimale waarde in de gegevensset, waardoor statistici een beter inzicht krijgen in hoe gevarieerd de gegevensset is.

Twee belangrijke kenmerken van een gegevensset omvatten het midden van de gegevens en de verspreiding van de gegevens, en het centrum kan op een aantal manieren worden gemeten: de meest populaire hiervan zijn het gemiddelde, de mediaan, de modus en het middenbereik, maar in op een vergelijkbare manier zijn er verschillende manieren om te berekenen hoe verspreid de gegevensset is en de eenvoudigste en grofste spreidingsmaat wordt het bereik genoemd.

De berekening van het bereik is heel eenvoudig. Het enige wat we moeten doen is het verschil vinden tussen de grootste gegevenswaarde in onze set en de kleinste gegevenswaarde. Kort gezegd hebben we de volgende formule: Bereik = Maximale waarde - Minimale waarde. De gegevensset 4,6,10, 15, 18 heeft bijvoorbeeld een maximum van 18, een minimum van 4 en een bereik van 18-4 = 14.

Bereikbeperkingen

Het bereik is een zeer grove meting van de verspreiding van gegevens, omdat het extreem gevoelig is voor uitbijters, en als gevolg hiervan zijn er bepaalde beperkingen aan het nut van een echt bereik van een gegevensset voor statistici, omdat een enkele gegevenswaarde grote gevolgen kan hebben de waarde van het bereik.

Beschouw bijvoorbeeld de gegevensset 1, 2, 3, 4, 6, 7, 7, 8. De maximale waarde is 8, het minimum is 1 en het bereik is 7. Neem vervolgens dezelfde gegevensset in overweging, alleen met de waarde 100 inbegrepen. Het bereik wordt nu 100-1 = 99 waarbij de toevoeging van een enkel extra gegevenspunt de waarde van het bereik sterk beïnvloedde. De standaardafwijking is een andere spreidingsmaat die minder gevoelig is voor uitbijters, maar het nadeel is dat de berekening van de standaardafwijking veel gecompliceerder is.

Het bereik vertelt ons ook niets over de interne kenmerken van onze gegevensset. We beschouwen bijvoorbeeld de gegevensset 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 waar het bereik voor deze gegevensset is 10-1 = 9. Als we dit vervolgens vergelijken met de gegevensset van 1, 1, 1, 2, 9, 9, 9, 10. Hier is het bereik echter nogmaals negen, voor deze tweede set en in tegenstelling tot de eerste set, de gegevens is geclusterd rond het minimum en maximum. Andere statistieken, zoals het eerste en derde kwartiel, zouden moeten worden gebruikt om een ​​deel van deze interne structuur te detecteren.

Toepassingen van bereik

Het bereik is een goede manier om een ​​heel basisbegrip te krijgen van hoe gespreide getallen in de gegevensset echt zijn, omdat het gemakkelijk te berekenen is omdat het alleen een eenvoudige rekenkundige bewerking vereist, maar er zijn ook een paar andere toepassingen van het bereik van een gegevensset in statistieken.

Het bereik kan ook worden gebruikt om een ​​andere spreidingsmaat te schatten, de standaardafwijking. In plaats van een vrij gecompliceerde formule te doorlopen om de standaardafwijking te vinden, kunnen we in plaats daarvan de zogenaamde bereikregel gebruiken. Het bereik is fundamenteel in deze berekening.

Het bereik komt ook voor in een boxplot of box en whiskersplot. De maximale en minimale waarden worden beide in een grafiek weergegeven aan het einde van de snorharen van de grafiek en de totale lengte van de snorharen en het vak is gelijk aan het bereik.