Loi de Gumbel
Modèle:Ébauche Modèle:Infobox Distribution statistiques En théorie des probabilités, la loi de Gumbel (ou distribution de Gumbel), du nom d'Émil Julius Gumbel, est une loi de probabilité continue. La loi de Gumbel est un cas particulier de la loi d'extremum généralisée au même titre que la loi de Weibull ou la loi de Fréchet. La loi de Gumbel est une approximation satisfaisante de la loi du maximum d'un échantillon de variables aléatoires indépendantes toutes de même loi, dès que cette loi appartient, précisément, au domaine d'attraction de la loi de Gumbel. Parmi les lois appartenant au domaine d'attraction de la loi de Gumbel, on compte la loi exponentielle[1].
La loi de Gumbel peut par exemple servir à prévoir le niveau des crues d'un fleuve, à condition de disposer des mesures des débits maximaux sur une période d'au moins dix ans. Elle peut également servir à prédire la probabilité d'un événement critique, comme un tremblement de terre.
Définitions
Fonction de répartition
Etant donné deux paramètres et , la fonction de répartition de la loi de Gumbel est donné par :
Distribution standard de Gumbel
La distribution standard de Gumbel correspond au cas où et , avec une fonction de répartition cumulative donnée par :
La fonction densité de probabilité associée est la suivante :
Dans ce cas, le mode est 0, la médiane est , la moyenne est (la Constante d'Euler-Mascheroni), et l'écart-type est
Les cumulants, pour n > 1, sont donnés par :
Propriétés
Le mode est , tandis que la médiane est et l'espérance est donnée par :
- ,
où est la Constante d'Euler-Mascheroni.
L'écart-type est , d'où [2]
Au mode, où , la valeur de devient , quelle que soit la valeur de .
Si sont des variables aléatoires de Gumbel, indépendantes et identiquement distribuées, avec pour paramètres , alors suit également une loi de Gumbel avec le jeu de paramètres
Si sont des variables aléatoires de Gumbel, indépendantes et identiquement distribuées, telles que a la même distribution que pour tout entier naturel , alors suit nécessairement une loi de Gumbel avec un paramètre d'échelle (il suffit en fait de considérer seulement deux valeurs distinctes de qui sont premières entre elles).
Distributions associées
Loi de Gumbel discrète
De nombreux problèmes de mathématiques discrètes concernent l'étude d'un paramètre extrémal qui s'avère suivre une version discrète de la loi de Gumbel[3]Modèle:,[4]. Cette version discrète est la loi de , où suit la loi de Gumbel continue . On a ainsi pour tout . Notons la version discrète, on a et .
Il n'y a pas de forme close connue pour la moyenne, variance (et moments d'ordre supérieur) de la loi de Gumbel discrète, mais il est facile d'en obtenir des évaluations numériques à grande précision via des sommes infinies convergeant très rapidement, ceci donne, par exemple, , mais c'est un problème ouvert que d'obtenir une forme close pour cette constante (il est plausible qu'il n'en existe pas).
Aguech, Althagafi et Banderier[3] donnent diverses bornes liant les versions discrètes et continues de Gumbel et ils explicitent par des méthodes de transformée de Mellin les phénomènes de fluctuation qui apparaissent lorsqu'on a une suite de variables aléatoires qui converge vers une Gumbel discrète.
Lois continues
- Si Modèle:Mvar suit une loi de Gumbel, alors la distribution conditionnelle de Modèle:Math dans le cas où Modèle:Mvar est strictement positif, ou de façon équivalente, dans le cas où Modèle:Mvar est strictement négatif, suit une loi de Gompertz. La fonction de répartition Modèle:Mvar de Modèle:Mvar est reliée à Modèle:Mvar la fonction de répartition de Modèle:Mvar, par la formule suivante : pour Modèle:Math. Les densités sont donc reliées par : la densité de la loi Gompertz est proportionnelle à la densité de Gumbel réfléchie et restreinte aux valeurs strictement positives[5].
- Si Modèle:Mvar suit une exponentielle de moyenne égale à 1, alors Modèle:Math suit une distribution standard de Gumbel.
- Si alors .
La théorie associée aux Modèle:Lien fournit une version multivariée de la loi de Gumbel.
Occurrence et applications
Applications de la loi de Gumbel continue

Gumbel a montré que la valeur maximale (ou dernier statistique d'ordre) dans un échantillon de variable aléatoires suivant une distribution exponentielle, moins le logarithme naturel de la taille de l’échantillon[6], tend vers la distribution de Gumbel à mesure que la taille de l’échantillon augmente[7].
Concrètement, soit la distribution de probabilité de et sa fonction de répartition. Alors, la valeur maximale parmi réalisations de est inférieure à si et seulement si toutes les réalisations sont inférieures à . Ainsi, la fonction de répartition de la valeur maximale satisfait :
et, pour une valeur importante de , le membre de droite converge vers
En hydrologie, la distribution de Gumbel est donc utilisée pour analyser des variables telles que les valeurs maximales mensuelles et annuelles des précipitations journalières et des débits fluviaux[2], ainsi que pour décrire les périodes de sécheresse[8].
Gumbel a également montré que l'estimateur Modèle:Frac pour la probabilité d’un événement — où r est le rang de la valeur observée dans la série de données et n est le nombre total d'observations — est un estimateur non biaisé de la probabilité cumulative autour du mode de la distribution. Par conséquent, cet estimateur est souvent utilisé pour tracer les courbes.
Occurrences de la loi de Gumbel discrète
En combinatoire, la distribution de Gumbel discrète apparaît comme loi limite du temps d'atteinte dans le problème du collectionneur de coupons. Ce résultat est dû à Laplace en 1812 dans sa Théorie analytique des probabilités, et constitue la première occurrence historique de ce qui fut ensuite appelé loi de Gumbel.
En théorie des nombres, la distribution de Gumbel discrète approxime le nombre de termes dans une partition d'un entier aléatoire[9] ainsi que la taille ajustée des tendances des écarts entre nombres premiers et des écarts maximaux entre les constellations de nombres premiers[10].
En théorie des probabilités, elle apparaît comme la loi de la hauteur maximale atteinte par des marches discrètes (sur le réseau ), où le processus peut à chaque étape être réinitialisé à son point de départ[3].
En analyse d'algorithmes, elle apparaît par exemple dans l'étude de la propagation maximale d'une retenue dans des algorithmes d'addition en base [11].
Génération de variables aléatoires
Puisque la fonction quantile (fonction inverse de la fonction de répartition), , d'une distribution de Gumbel est donnée par :
la variable aléatoire suit une distribution de Gumbel avec les paramètres et lorsque la variable aléatoire est tirée de la loi uniforme sur l'intervalle .
Ajustement graphique de la loi de Gumbel

Avant l’ère des logiciels, le papier probabiliste était utilisé pour représenter la distribution de Gumbel (voir illustration). Le graphique est basé sur la linéarisation de la fonction de répartition :
Sur le graphique, l'axe horizontal est construit avec une échelle logarithmique double. L'axe vertical est linéaire. En reportant sur l'axe horizontal du papier et la variable sur l'axe vertical, la distribution est représentée par une droite de pente 1. Lorsque des logiciels d’ajustement de distribution comme CumFreq sont devenus disponibles, la tâche de représentation graphique de la distribution a été facilitée.
Astuces de reparamétrisation de Gumbel
En apprentissage automatique, la distribution de Gumbel est parfois utilisée pour générer des échantillons à partir de la distribution catégorielle. Cette technique est appelée "astuce de Gumbel-max" et est un exemple particulier des "astuces de reparamétrisation"[12].
En détail, soit des valeurs non négatives, non nulles, et soit des échantillons indépendants de Gumbel(0, 1). Alors, par une intégration de routine, on a : C'est-à-dire, .
De manière équivalente, étant donné , on peut échantillonner à partir de sa distribution de Boltzmann via : Des équations connexes incluent[13] :
- Si , alors .
- .
Voir aussi
Notes
Modèle:Traduction/Référence Modèle:Références
Bibliographie
- ↑ Regular variation, Bingham, Goldie et Teugels.
- ↑ 2,0 et 2,1 Modèle:Ouvrage
- ↑ 3,0 3,1 et 3,2 Modèle:Article
- ↑ Analytic Combinatorics, Flajolet et Sedgewick.
- ↑ Modèle:Article
- ↑ Modèle:Lien web
- ↑ Modèle:Ouvrage
- ↑ Modèle:Article
- ↑ Modèle:Article
- ↑ Modèle:Article Article 13.5.2.
- ↑ Modèle:Article
- ↑ Modèle:Lien conférence
- ↑ Modèle:Article