Loi de probabilité à queue lourde

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Ébauche

Modèle:Confusion

Long tail.

Dans la théorie des probabilités, une loi de probabilité à queue lourde est une loi de probabilité dont les queues ne sont pas exponentiellement bornées[1], ce qui signifie qu'elles ont des queues plus « lourdes » que la loi exponentielle. Dans de nombreuses applications, c'est la queue droite de la distribution qui est intéressante, mais une distribution peut avoir une queue lourde à gauche, ou les deux queues peuvent être lourdes.

Il y a trois sous-classes importantes de lois à queue lourde, les lois à queue épaisse, les lois à longue queue et les lois sous-exponentielles. Dans la pratique, toutes les lois à queue lourde couramment utilisées appartiennent à la classe sous-exponentielle.

Définitions

Loi à queue lourde

La loi d'une variable aléatoire X de fonction de répartition F est dite à queue lourde (à droite) si sa fonction génératrice des moments MX(t), est infinie pour tout t > 0., soit[2]Modèle:,[3]:

t>0,etxdF(x)=.

On peut traduire cette propriété en termes de densité de distribution de queue

F(x)[X>x]

comme

t>0,limxetxF(x)=.

Loi à queue longue

La loi d'une variable aléatoire X de fonction de répartition F est dite à queue longue (à droite) si [1]

t>0,limx[X>x+tX>x]=1,

ou

t>0,F(x+t)xF(x).

On peut le comprendre ainsi : à partir d'un certain niveau, la probabilité qu'une variable aléatoire à queue longue dépasse un niveau supérieur tend vers 1.

Une loi à queue longue est nécessairement à queue lourde, mais la réciproque est fausse : il est possible de construire des lois à queue lourde mais pas longue

Lois sous-exponentielles

La sous-exponentialité est définie en termes de convolution de densités de probabilités. Pour deux variables aléatoires iid X1,X2 de même fonction de répartition F, la convolution de F avec elle-même, notée F*2, est définie par l'intégrale de Lebesgue-Stieltjes :

[X1+X2x]=F*2(x)=0xF(xy)dF(y),

et la convolution d'ordre n F*n est définie par récurrence :

F*n(x)=0xF(xy)dF*n1(y).

La fonction de répartition de queue F est telle que F(x)=1F(x).

Une loi de fonction de répartition F est dite sous-exponentielle (à droite)[1]Modèle:,[4]Modèle:,[5] si :

F*2(x)x2F(x).

On en déduit[6]:

n1, F*n(x)xnF(x).

On peut y voir l'interprétation probabiliste suivante[6]: pour une somme de n variables aléatoires iid X1,,Xn de loi commune F,

[X1++Xn>x]x[max(X1,,Xn)>x].

On désigne cette propriété comme le principe du grand saut simple[7] ou principe de la catastrophe[8]

Une loi F sur la droite réelle complète est sous-exponentielle si la loi F11[0,[ l'est[9]; la fonction 11[0,[ est la fonction indicatrice de la demi-droite positive. De façon alternative, une variable aléatoire X réelle est sous-exponentielle ssi X+=max(0,X) est sous-exponentielle.

Toutes les lois sous-exponentielles sont à queue longue, mais on peut construire des lois à queue longue mais non sous-exponentielles.

Exemples de lois à queue lourde

Parmi les lois classiques à queue lourde, toutes sont sous-exponentielles[6].

Dans les lois à queue lourde à droite, on trouve :

Parmi les lois à deux queues lourdes :

Relation aux lois à queue épaisse

Une Modèle:Lien est une loi pour laquelle la densité de probabilités, pour de grandes valeurs de x, décroit en xa. Puisqu'une fonction puissance est toujours bornée par une fonction exponentielle, les lois à queue épaisse sont toujours à queue lourde. Certaines lois, cependant, ont une queue qui décroit vers 0 plus lentement que la fonction exponentielle (dont sont à queue lourde), mais plus rapidement qu'une fonction puissance (donc pas à queue épaisse).

Références

Modèle:Traduction/Référence

Modèle:Portail