De median för en uppsättning data är mittvägspunkten där exakt hälften av datavärdena är mindre än eller lika med medianen. På liknande sätt kan vi tänka på medianen för a kontinuerligsannolikhetsfördelning, men snarare än att hitta mittvärdet i en uppsättning data, finner vi mitten av distributionen på ett annat sätt.
Den totala arean under en sannolikhetsdensitetsfunktion är 1, vilket representerar 100%, och som ett resultat kan hälften av detta representeras av halv eller 50 procent. En av de stora idéerna i matematisk statistik är att sannolikheten representeras av området under kurvan för densitetsfunktion, som beräknas med en integral, och därmed är medianen för en kontinuerlig distribution punkten på de riktigt nummer linje där exakt hälften av området ligger till vänster.
Detta kan anges mer kortfattat av följande felaktiga integral. Medianen för den kontinuerliga slumpmässiga variabeln X med densitetsfunktion f( x) är värdet M så att:
0.5=∫m−∞f(x)dx
Median för exponentiell distribution
Vi beräknar nu medianen för exponentiell distribution Exp (A). En slumpmässig variabel med denna distribution har densitetsfunktion f(x) = e-x/ A/ A för x valfritt verkligt antal. Funktionen innehåller också matematisk konstant e, ungefär lika med 2,71828.
Eftersom sannolikhetsdensitetsfunktionen är noll för något negativt värde på x, allt vi måste göra är att integrera följande och lösa för M:
0,5 = ∫0M f (x) dx
Sedan integralen ∫ e-x/ A/ A dx = -e-x/ A, resultatet är det
0,5 = -e-M / A + 1
Detta betyder att 0,5 = e-M / A och efter att ha tagit den naturliga logaritmen på båda sidor av ekvationen, har vi:
ln (1/2) = -M / A
Sedan 1/2 = 2-1, efter egenskaper hos logaritmer vi skriver:
- ln2 = -M / A
Att multiplicera båda sidor med A ger oss resultatet att median M = A ln2.
Median-medeljämlikhet i statistik
En konsekvens av detta resultat bör nämnas: medelvärdet för den exponentiella fördelningen Exp (A) är A, och eftersom ln2 är mindre än 1 följer det att produkten Aln2 är mindre än A. Detta innebär att medianen för den exponentiella fördelningen är mindre än medelvärdet.
Detta är meningsfullt om vi tänker på grafen för sannolikhetsdensitetsfunktionen. På grund av den långa svansen är denna fördelning sned åt höger. Många gånger när en fördelning är sned åt höger är medelvärdet till höger om medianen.
Vad detta betyder när det gäller statistisk analys är att vi ofta kan förutsäga att medelvärdet och medianen inte direkt korrelerar med tanke på sannolikheten för att data är sned åt höger, vilket kan uttryckas som ett median-medeljämlikt bevis känd som Chebysjevs ojämlikhet.
Tänk som exempel på en datauppsättning som visar att en person får totalt 30 besökare på 10 timmar, där den genomsnittliga väntetiden för en besökare är 20 minuter, medan uppsättningen av data kan visa att medianväntetiden skulle vara någonstans mellan 20 och 30 minuter om över hälften av de besökarna kom i de första fem timmarna.