Loi de Gumbel

De testwiki
Version datée du 16 mars 2025 à 19:29 par imported>JrmieJ (growthexperiments-addlink-summary-summary:2|1|0)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Modèle:Ébauche Modèle:Infobox Distribution statistiques En théorie des probabilités, la loi de Gumbel (ou distribution de Gumbel), du nom d'Émil Julius Gumbel, est une loi de probabilité continue. La loi de Gumbel est un cas particulier de la loi d'extremum généralisée au même titre que la loi de Weibull ou la loi de Fréchet. La loi de Gumbel est une approximation satisfaisante de la loi du maximum d'un échantillon de variables aléatoires indépendantes toutes de même loi, dès que cette loi appartient, précisément, au domaine d'attraction de la loi de Gumbel. Parmi les lois appartenant au domaine d'attraction de la loi de Gumbel, on compte la loi exponentielle[1].

La loi de Gumbel peut par exemple servir à prévoir le niveau des crues d'un fleuve, à condition de disposer des mesures des débits maximaux sur une période d'au moins dix ans. Elle peut également servir à prédire la probabilité d'un événement critique, comme un tremblement de terre.

Définitions

Fonction de répartition

Etant donné deux paramètres μ et β, la fonction de répartition de la loi de Gumbel est donné par :

F(x;μ,β)=exp(exp(μxβ)).

Distribution standard de Gumbel

La distribution standard de Gumbel correspond au cas où μ=0 et β=1, avec une fonction de répartition cumulative donnée par :

F(x)=eex

La fonction densité de probabilité associée est la suivante :

f(x)=e(x+ex).

Dans ce cas, le mode est 0, la médiane est ln(ln(2))0.3665, la moyenne est γ0.5772 (la Constante d'Euler-Mascheroni), et l'écart-type est π/61.2825.

Les cumulants, pour n > 1, sont donnés par :

κn=(n1)!ζ(n).

Propriétés

Le mode est μ, tandis que la médiane est μβln(ln2), et l'espérance est donnée par :

E(X)=μ+γβ,

γ est la Constante d'Euler-Mascheroni.

L'écart-type σ est βπ/6, d'où β=σ6/π0.78σ. [2]

Au mode, où x=μ, la valeur de F(x;μ,β) devient e10.37, quelle que soit la valeur de β.

Si G1,,Gk sont des variables aléatoires de Gumbel, indépendantes et identiquement distribuées, avec pour paramètres (μ,β), alors max{G1,,Gk} suit également une loi de Gumbel avec le jeu de paramètres (μ+βlnk,β).

Si G1,G2, sont des variables aléatoires de Gumbel, indépendantes et identiquement distribuées, telles que max{G1,,Gk}βlnk a la même distribution que G1 pour tout entier naturel k, alors G1 suit nécessairement une loi de Gumbel avec un paramètre d'échelle β (il suffit en fait de considérer seulement deux valeurs distinctes de k>1 qui sont premières entre elles).

Distributions associées

Loi de Gumbel discrète

De nombreux problèmes de mathématiques discrètes concernent l'étude d'un paramètre extrémal qui s'avère suivre une version discrète de la loi de Gumbel[3]Modèle:,[4]. Cette version discrète est la loi de Y=X, où X suit la loi de Gumbel continue Gumbel(μ,β). On a ainsi P(Yh)=exp(exp((hμ)/β)) pour tout h. Notons DGumbel(μ,β) la version discrète, on a XDGumbel(μ,β) et XDGumbel(μ1,β).

Il n'y a pas de forme close connue pour la moyenne, variance (et moments d'ordre supérieur) de la loi de Gumbel discrète, mais il est facile d'en obtenir des évaluations numériques à grande précision via des sommes infinies convergeant très rapidement, ceci donne, par exemple, 𝔼[DGumbel(0,1)]=1.077240905953631072609..., mais c'est un problème ouvert que d'obtenir une forme close pour cette constante (il est plausible qu'il n'en existe pas).

Aguech, Althagafi et Banderier[3] donnent diverses bornes liant les versions discrètes et continues de Gumbel et ils explicitent par des méthodes de transformée de Mellin les phénomènes de fluctuation qui apparaissent lorsqu'on a une suite de variables aléatoires Ynclnn qui converge vers une Gumbel discrète.

Lois continues

  • Si Modèle:Mvar suit une loi de Gumbel, alors la distribution conditionnelle de Modèle:Math dans le cas où Modèle:Mvar est strictement positif, ou de façon équivalente, dans le cas où Modèle:Mvar est strictement négatif, suit une loi de Gompertz. La fonction de répartition Modèle:Mvar de Modèle:Mvar est reliée à Modèle:Mvar la fonction de répartition de Modèle:Mvar, par la formule suivante : G(y)=(Yy)=(Xy|X0)=(F(0)F(y))/F(0) pour Modèle:Math. Les densités sont donc reliées par g(y)=f(y)/F(0) : la densité de la loi Gompertz est proportionnelle à la densité de Gumbel réfléchie et restreinte aux valeurs strictement positives[5].
  • Si Modèle:Mvar suit une exponentielle de moyenne égale à 1, alors Modèle:Math suit une distribution standard de Gumbel.
  • Si X,YGumbel(μ,β) alors XYLogistic(0,β).

La théorie associée aux Modèle:Lien fournit une version multivariée de la loi de Gumbel.

Occurrence et applications

Applications de la loi de Gumbel continue

Ajustement d'une loi de Gumbel à partir de données observées (maximums journaliers des cumuls de précipitations)

Gumbel a montré que la valeur maximale (ou dernier statistique d'ordre) dans un échantillon de variable aléatoires suivant une distribution exponentielle, moins le logarithme naturel de la taille de l’échantillon[6], tend vers la distribution de Gumbel à mesure que la taille de l’échantillon augmente[7].

Concrètement, soit ρ(x)=ex la distribution de probabilité de x et Q(x)=1ex sa fonction de répartition. Alors, la valeur maximale parmi N réalisations de x est inférieure à X si et seulement si toutes les réalisations sont inférieures à X. Ainsi, la fonction de répartition de la valeur maximale x~ satisfait :

P(x~log(N)X)=P(x~X+log(N))=[Q(X+log(N))]N=(1eXN)N,

et, pour une valeur importante de N, le membre de droite converge vers eeX.

En hydrologie, la distribution de Gumbel est donc utilisée pour analyser des variables telles que les valeurs maximales mensuelles et annuelles des précipitations journalières et des débits fluviaux[2], ainsi que pour décrire les périodes de sécheresse[8].

Gumbel a également montré que l'estimateur Modèle:Frac pour la probabilité d’un événement — où r est le rang de la valeur observée dans la série de données et n est le nombre total d'observations — est un estimateur non biaisé de la probabilité cumulative autour du mode de la distribution. Par conséquent, cet estimateur est souvent utilisé pour tracer les courbes.

Occurrences de la loi de Gumbel discrète

En combinatoire, la distribution de Gumbel discrète apparaît comme loi limite du temps d'atteinte dans le problème du collectionneur de coupons. Ce résultat est dû à Laplace en 1812 dans sa Théorie analytique des probabilités, et constitue la première occurrence historique de ce qui fut ensuite appelé loi de Gumbel.

En théorie des nombres, la distribution de Gumbel discrète approxime le nombre de termes dans une partition d'un entier aléatoire[9] ainsi que la taille ajustée des tendances des écarts entre nombres premiers et des écarts maximaux entre les constellations de nombres premiers[10].

En théorie des probabilités, elle apparaît comme la loi de la hauteur maximale atteinte par des marches discrètes (sur le réseau 2), où le processus peut à chaque étape être réinitialisé à son point de départ[3].

En analyse d'algorithmes, elle apparaît par exemple dans l'étude de la propagation maximale d'une retenue dans des algorithmes d'addition en base b[11].

Génération de variables aléatoires

Puisque la fonction quantile (fonction inverse de la fonction de répartition), Q(p), d'une distribution de Gumbel est donnée par :

Q(p)=μβln(ln(p)),

la variable aléatoire Q(U) suit une distribution de Gumbel avec les paramètres μ et β lorsque la variable aléatoire U est tirée de la loi uniforme sur l'intervalle (0,1).

Ajustement graphique de la loi de Gumbel

Exemple d’un ajustement graphique de la loi de Gumbel (Cours L.Neppel)

Avant l’ère des logiciels, le papier probabiliste était utilisé pour représenter la distribution de Gumbel (voir illustration). Le graphique est basé sur la linéarisation de la fonction de répartition F :

ln(ln(F))=xμβ

Sur le graphique, l'axe horizontal est construit avec une échelle logarithmique double. L'axe vertical est linéaire. En reportant F sur l'axe horizontal du papier et la variable x sur l'axe vertical, la distribution est représentée par une droite de pente 1/β. Lorsque des logiciels d’ajustement de distribution comme CumFreq sont devenus disponibles, la tâche de représentation graphique de la distribution a été facilitée.

Astuces de reparamétrisation de Gumbel

En apprentissage automatique, la distribution de Gumbel est parfois utilisée pour générer des échantillons à partir de la distribution catégorielle. Cette technique est appelée "astuce de Gumbel-max" et est un exemple particulier des "astuces de reparamétrisation"[12].

En détail, soit (π1,,πn) des valeurs non négatives, non nulles, et soit g1,,gn des échantillons indépendants de Gumbel(0, 1). Alors, par une intégration de routine, on a : Pr(j=argmaxi(gi+logπi))=πjiπi C'est-à-dire, argmaxi(gi+logπi)Categorical(πjiπi)j.

De manière équivalente, étant donné x1,...,xn, on peut échantillonner à partir de sa distribution de Boltzmann via : Pr(j=argmaxi(gi+xi))=exjiexi Des équations connexes incluent[13] :

  • Si xExp(λ), alors (lnxγ)Gumbel(γ+lnλ,1).
  • maxi(gi+logπi)Gumbel(log(iπi),1).
  • 𝔼[maxi(gi+βxi)]=log(ieβxi)+γ.

Voir aussi

Notes

Modèle:Traduction/Référence Modèle:Références

Bibliographie

Modèle:Palette Modèle:Portail

  1. Regular variation, Bingham, Goldie et Teugels.
  2. 2,0 et 2,1 Modèle:Ouvrage
  3. 3,0 3,1 et 3,2 Modèle:Article
  4. Analytic Combinatorics, Flajolet et Sedgewick.
  5. Modèle:Article
  6. Modèle:Lien web
  7. Modèle:Ouvrage
  8. Modèle:Article
  9. Modèle:Article
  10. Modèle:Article Article 13.5.2.
  11. Modèle:Article
  12. Modèle:Lien conférence
  13. Modèle:Article