Théorie des valeurs extrêmes

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Confusion La théorie des valeurs extrêmes est une branche des statistiques qui s'intéresse aux valeurs extrêmes des distributions de probabilité. Elle a été développée par Émil Julius Gumbel.

Méthodes

La théorie des valeurs extrêmes permet de connaître le comportement asymptotique des maxima de valeurs prises par les valeurs de variables aléatoires identiquement distribuées et indépendantes[1]. Cette loi comporte des paramètres que l'on peut estimer soit en se basant sur les valeurs extrêmes prises dans des blocs de taille fixe des données à disposition (méthode des maxima), soit en s'intéressant à la distribution des données supérieures à un certain seuil (méthode des excès)[1]. Pour pouvoir être appliquée, la théorie des valeurs extrêmes doit donc disposer de beaucoup de données[1].

Distribution limite

Soient X1,...,Xn des variables aléatoires indépendantes et identiquement distribuées. La théorie des valeurs extrêmes s'intéresse au comportement limite des extrêmes de l'échantillon, c'est-à-dire max(X1,...,Xn) ou, de manière équivalente, min(X1,...,Xn) lorsque n approche l'infini. Une certaine intuition peut être construite en faisant le rapprochement avec le théorème central limite. Ce dernier s'intéresse au comportement limite de la somme des variables aléatoires de l'échantillon.

Soit F la distribution ayant générée {Xn}. Alors, en posant Mn comme étant la borne supérieure pouvant être générée par F, on a,

max(X1,...,Xn)Mn,

signifie convergence en probabilité, puisque,

(max(X1,...,Xn)x)=(X1x,...,Xnx)=Fn(x),

qui converge lorsque n+ à 0 pour x<Mn et à 1 pour xMn. Or, nous souhaitons avoir un comportement limite qui tend vers une distribution non-dégénérée. Pour cela, il est nécessaire de standardiser l'extrême de l'échantillon. Supposons qu'il existe une séquence an>0 et une séquence bn si bien que, max(X1,...,Xn)bnan a une distribution limite non-dégénérée,

limn+Fn(anx+bn)=G(x).

Domaine d'attraction

Il est nécessaire de poser une série de conditions nécessaires et suffisantes sur F afin de pouvoir garantir la convergence en limite des extrêmes vers G. Le domaine d'attraction maximal ou domaine d'attraction est la classe de distribution satisfaisant les conditions nécessaires et suffisantes. Il existe trois types de distributions limites. A eux trois, ils comprennent toutes les distributions limites de variables aléatoire indépendantes et identiquement distribuées qui convergent vers une distribution limite non-dégénérée:

  1. La loi de Gumbel ;
  2. La loi de Fréchet ;
  3. La loi de Weibull.

Ces trois distributions constituent les membres de la loi d'extremum généralisée.

Applications

La théorie des valeurs extrêmes est appliquée en hydrologie pour prévoir les crues, en océanographie dans l'étude des vagues scélérates[2], en épidémiologie pour identifier rapidement les maladies émergentes[1], en démographie pour prévoir la distribution de probabilité de l'âge maximum que l'être humain pourra atteindre, en assurance pour prévoir les grands sinistres, en finance ou encore en climatologie et météorologie par exemple pour anticiper les futurs dépassement de records de canicule[3]Modèle:,[4].

Notes et références

Modèle:Références

Voir aussi

Bibliographie

Articles connexes

Modèle:Portail