De ongelijkheid van Chebyshev zegt dat ten minste 1-1 /K2 van gegevens uit een monster moet binnen vallen K standaardafwijkingen van het gemiddelde (hier K is een positief reëel getal groter dan één).
Elke gegevensset die normaal wordt gedistribueerd, of in de vorm van een klokcurve, heeft verschillende functies. Een daarvan behandelt de verspreiding van de gegevens ten opzichte van het aantal standaardafwijkingen van het gemiddelde. Bij een normale verdeling weten we dat 68% van de gegevens een standaardafwijking van het gemiddelde is, 95% twee standaardafwijkingen van het gemiddelde is en ongeveer 99% binnen drie standaardafwijkingen van het gemiddelde ligt..
Maar als de gegevensset niet in de vorm van een klokcurve wordt verdeeld, kan een andere hoeveelheid binnen één standaarddeviatie liggen. De ongelijkheid van Chebyshev biedt een manier om te weten welke fractie van gegevens erin valt K standaardafwijkingen van het gemiddelde voor ieder gegevensset.
We kunnen de bovenstaande ongelijkheid ook vermelden door de uitdrukking "gegevens uit een steekproef" te vervangen door kansverdeling. Dit komt omdat de ongelijkheid van Chebyshev het gevolg is van waarschijnlijkheid, die vervolgens kan worden toegepast op statistieken.
Het is belangrijk op te merken dat deze ongelijkheid een resultaat is dat wiskundig is bewezen. Het is niet zoals de empirische relatie tussen het gemiddelde en de modus, of de vuistregel die het bereik en de standaarddeviatie verbindt.
Om de ongelijkheid te illustreren, zullen we er enkele waarden van bekijken K:
Stel dat we de gewichten van honden in het plaatselijke dierenasiel hebben bemonsterd en hebben vastgesteld dat ons monster een gemiddelde heeft van 20 pond met een standaardafwijking van 3 pond. Met het gebruik van Chebyshev's ongelijkheid weten we dat ten minste 75% van de honden die we hebben bemonsterd gewichten hebben die twee standaarddeviaties van het gemiddelde zijn. Twee keer geeft de standaarddeviatie ons 2 x 3 = 6. Aftrekken en dit optellen bij het gemiddelde van 20. Dit vertelt ons dat 75% van de honden een gewicht heeft van 14 pond tot 26 pond.
Als we meer weten over de distributie waarmee we werken, kunnen we meestal garanderen dat meer gegevens een bepaald aantal standaarddeviaties afwijken van het gemiddelde. Als we bijvoorbeeld weten dat we een normale verdeling hebben, zijn 95% van de gegevens twee standaardafwijkingen van het gemiddelde. De ongelijkheid van Chebyshev zegt dat we dat in deze situatie weten minstens 75% van de gegevens zijn twee standaardafwijkingen van het gemiddelde. Zoals we in dit geval kunnen zien, kan het veel meer zijn dan deze 75%.
De waarde van de ongelijkheid is dat het ons een "slechter geval" -scenario geeft waarin het enige wat we weten over onze steekproefgegevens (of waarschijnlijkheidsverdeling) het gemiddelde en de standaarddeviatie is. Als we niets anders weten over onze gegevens, geeft de ongelijkheid van Chebyshev extra inzicht in hoe verspreid de gegevensset is.
De ongelijkheid is vernoemd naar de Russische wiskundige Pafnuty Chebyshev, die de ongelijkheid voor het eerst verklaarde zonder bewijs in 1874. Tien jaar later werd de ongelijkheid bewezen door Markov in zijn Ph.D. proefschrift. Vanwege verschillen in hoe het Russische alfabet in het Engels te vertegenwoordigen, wordt het Chebyshev ook gespeld als Tchebysheff.