Hoe de kurtosis van distributies te classificeren

Verdelingen van gegevens en kansverdelingen hebben niet allemaal dezelfde vorm. Sommige zijn asymmetrisch en scheef naar links of naar rechts. Andere distributies zijn bimodaal en hebben twee pieken. Een ander kenmerk om te overwegen bij het praten over een verdeling is de vorm van de uiteinden van de verdeling uiterst links en uiterst rechts. Kurtosis is de maat voor de dikte of zwaarte van de staarten van een verdeling. De kurtosis van een distributie valt onder een van de drie categorieën classificatie:

  • Mesokurtic
  • Leptokurtic
  • Platykurtic

We zullen elk van deze classificaties achtereenvolgens behandelen. Ons onderzoek van deze categorieën zal niet zo nauwkeurig zijn als we zouden kunnen zijn als we de technische wiskundige definitie van kurtosis zouden gebruiken.

Mesokurtic

Kurtosis wordt meestal gemeten met betrekking tot de normale verdeling. Een verdeling met staarten die ongeveer op dezelfde manier zijn gevormd als elke normale verdeling, niet alleen de standaard normale verdeling, zou mesokurtisch zijn. De kurtosis van een mesokurtische verdeling is niet hoog of laag, maar wordt eerder beschouwd als een basislijn voor de twee andere classificaties.

Naast normale distributies, binomiale distributies waarvoor p is bijna 1/2 worden beschouwd als mesokurtisch.

Leptokurtic

Een leptokurtische verdeling is er een met kurtosis die groter is dan een mesokurtische verdeling. Leptokurtische distributies worden soms geïdentificeerd door pieken die dun en lang zijn. De staarten van deze verdelingen, zowel rechts als links, zijn dik en zwaar. Leptokurtische distributies worden aangeduid met het voorvoegsel 'lepto', wat 'mager' betekent.

Er zijn veel voorbeelden van leptokurtische distributies. Een van de meest bekende leptokurtische distributies is de distributie van Student.

Platykurtic

De derde classificatie voor kurtosis is platykurtisch. Platykurtische verdelingen zijn die met slanke staarten. Vaak hebben ze een piek lager dan een mesokurtische verdeling. De naam van dit soort distributies komt van de betekenis van het voorvoegsel 'platy' wat 'breed' betekent.

Alle uniforme distributies zijn platykurtisch. Bovendien is de discrete waarschijnlijkheidsverdeling van een enkele tik van een munt platykurtisch.

Berekening van Kurtosis

Deze classificaties van kurtosis zijn nog enigszins subjectief en kwalitatief. Hoewel we misschien kunnen zien dat een verdeling dikkere staarten heeft dan een normale verdeling, wat als we de grafiek van een normale verdeling niet hebben om mee te vergelijken? Wat als we willen zeggen dat de ene distributie meer leptokurtisch is dan de andere?

Om dit soort vragen te beantwoorden, hebben we niet alleen een kwalitatieve beschrijving van kurtosis nodig, maar een kwantitatieve maat. De gebruikte formule is μ4/ σ4 waar μ4 is het vierde moment van Pearson over het gemiddelde en sigma is de standaarddeviatie.

Overmaat Kurtosis

Nu we een manier hebben om kurtosis te berekenen, kunnen we de verkregen waarden vergelijken in plaats van vormen. De normale verdeling blijkt een kurtosis van drie te hebben. Dit wordt nu onze basis voor mesokurtische distributies. Een verdeling met kurtosis groter dan drie is leptokurtisch en een verdeling met kurtosis minder dan drie is platykurtisch.

Omdat we een mesokurtische verdeling behandelen als een basislijn voor onze andere distributies, kunnen we drie aftrekken van onze standaardberekening voor kurtosis. De formule μ4/ σ4 - 3 is de formule voor overtollige kurtosis. We zouden dan een verdeling kunnen classificeren uit zijn overtollige kurtosis:

  • Mesokurtische distributies hebben overtollige kurtosis van nul.
  • Platykurtische distributies hebben negatieve overmatige kurtosis.
  • Leptokurtische distributies hebben positieve overmatige kurtosis.