De mediaan van een gegevensset is het middenpunt waarin exact de helft van de gegevenswaarden kleiner is dan of gelijk aan de mediaan. Op een vergelijkbare manier kunnen we nadenken over de mediaan van een continue kansverdeling, maar in plaats van de middelste waarde in een set gegevens te vinden, vinden we het midden van de verdeling op een andere manier.
Het totale oppervlak onder een waarschijnlijkheidsdichtheidsfunctie is 1, wat 100% vertegenwoordigt, en bijgevolg kan de helft hiervan worden weergegeven met de helft of 50 procent. Een van de grote ideeën van wiskundige statistieken is dat waarschijnlijkheid wordt weergegeven door het gebied onder de curve van de dichtheidsfunctie, dat wordt berekend door een integraal, en dus is de mediaan van een continue verdeling het punt op de reële getallenlijn waar precies de helft van het gebied ligt aan de linkerkant.
Dit kan beknopter worden verklaard door de volgende onjuiste integraal. De mediaan van de continue willekeurige variabele X met dichtheidsfunctie f( X) is de waarde M zodanig dat:
0.5 = ∫m − ∞f (x) dx0.5 = \ int_ m ^ - \ infty f (x) dx0.5 = ∫m − ∞ f (x) dx
We berekenen nu de mediaan voor de exponentiële verdeling Exp (A). Een willekeurige variabele met deze verdeling heeft een dichtheidsfunctie f(X) = e-X/EEN/ A voor X een niet-negatief reëel getal. De functie bevat ook de wiskundige constante e, ongeveer gelijk aan 2.71828.
Omdat de kansdichtheidsfunctie nul is voor elke negatieve waarde van X, het enige dat we moeten doen is het volgende integreren en oplossen voor M:
0,5 = ∫0M f (x) dx
Sinds de integraal ∫ e-X/EEN/AdvertentieX = -e-X/EEN, het resultaat is dat
0,5 = -e-M / A + 1
Dit betekent dat 0,5 = e-M / A en na het nemen van de natuurlijke logaritme van beide zijden van de vergelijking, hebben we:
ln (1/2) = -M / A
Sinds 1/2 = 2-1, door eigenschappen van logaritmen schrijven we:
- ln2 = -M / A
Beide zijden vermenigvuldigen met A geeft ons het resultaat dat de mediaan M = A ln2.
Eén consequentie van dit resultaat moet worden vermeld: het gemiddelde van de exponentiële verdeling Exp (A) is A, en aangezien ln2 kleiner is dan 1, volgt hieruit dat het product Aln2 kleiner is dan A. Dit betekent dat de mediaan van de exponentiële verdeling is minder dan het gemiddelde.
Dit is logisch als we nadenken over de grafiek van de waarschijnlijkheidsdichtheidsfunctie. Vanwege de lange staart staat deze verdeling scheef naar rechts. Vaak wanneer een verdeling naar rechts is scheef, is het gemiddelde rechts van de mediaan.
Wat dit betekent in termen van statistische analyse is dat we vaak kunnen voorspellen dat het gemiddelde en de mediaan niet direct correleren, gezien de waarschijnlijkheid dat gegevens naar rechts worden scheefgetrokken, wat kan worden uitgedrukt als het middelmatige gemiddelde ongelijkheidsbewijs dat bekend staat als de ongelijkheid van Chebyshev.
Overweeg bijvoorbeeld een gegevensset die stelt dat een persoon in totaal 30 bezoekers binnen 10 uur ontvangt, waarbij de gemiddelde wachttijd voor een bezoeker 20 minuten is, terwijl de gegevensset kan aangeven dat de mediane wachttijd ergens zou zijn tussen 20 en 30 minuten als meer dan de helft van die bezoekers binnen de eerste vijf uur kwam.