Convergence de variables aléatoires

De testwiki
Aller à la navigation Aller à la recherche

Dans la théorie des probabilités, il existe différentes notions de convergence de variables aléatoires. La convergence (dans un des sens décrits ci-dessous) de suites de variables aléatoires est un concept important de la théorie des probabilités utilisé notamment en statistique et dans l'étude des processus stochastiques. Par exemple, la moyenne de Modèle:Mvar variables aléatoires indépendantes et identiquement distribuées converge presque sûrement vers l'espérance commune de ces variables aléatoires (si celle-ci existe). Ce résultat est connu sous le nom de loi forte des grands nombres.

Dans cet article, on suppose que Modèle:Math est une suite de variables aléatoires réelles, que Modèle:Mvar est une variable aléatoire réelle, et que toutes ces variables sont définies sur un même espace probabilisé (Ω,,). D'éventuelles généralisations seront discutées.

Les différents modes de convergence

Il existe plusieurs notions de convergence de variables aléatoires. Elles ont toutes en commun le fait qu'elles sont insensibles face à d'éventuelles modifications négligeables des variables aléatoires. Plus précisément, si (Xn) converge vers X (selon n'importe lequel des sens ci-dessous) et si Y,Y1,Y2, sont d'autres variables aléatoires telles que (Yn=Xn)=1 pour tout n et (Y=X)=1, alors (Yn) converge aussi vers Y.

Convergence essentiellement uniforme (ou L)

Rappelons qu'une variable aléatoire réelle Y est dite essentiellement bornée s'il existe un nombre M>0, appelé borne essentielle, tel que (|Y|M)=1. Dans ce cas on définit ||Y||L comme la borne inférieure de l'ensemble des bornes essentielles de Y.Modèle:ThéorèmeRemarques :

  • Le fait que Xn et X soient essentiellement bornées implique que XnX l'est aussi. Ainsi la quantité ||XnX||L est bien définie. Plus précisément l'ensemble des variables aléatoires réelles définies sur (Ω,,) essentiellement bornées est un espace vectoriel réel pour lequel la fonction ||||L est une semi-norme. Attention ce n'est pas une norme, en général on quotiente par le sous-espace des variables aléatoires presque-sûrement nulles. Sur cet espace quotient, ||||L induit une norme.
  • Par abus de langage on parle parfois de « convergence uniforme » au lieu de « convergence essentiellement uniforme ». Cependant il ne faut pas s'y tromper, la notion de convergence donnée ci-dessus est plus faible que la convergence uniforme au sens strict. En effet, il se pourrait que les variables XnX soient toutes essentiellement bornées mais non bornées au sens strict auquel cas la convergence uniforme au sens strict n'aurait pas de sens. La raison pour laquelle on considère la convergence essentiellement uniforme plutôt que la convergence uniforme au sens strict et celle donnée plus haut : on veut que la convergence soit insensible face aux modifications négligeables des variables aléatoires. Ce ne serait pas le cas si on prenait la convergence uniforme au sens strict. Donnons un exemple concret : prenons Ω={0,1} muni de la tribu ={,{0},{1},Ω} et de la probabilité définie par ({0})=0 et ({1})=1. Prenons les variables définies par X(0)=0, X(1)=1, Xn(0)=n et Xn(1)=1+1/n pour tout n. Il est clair que (Xn) ne converge pas uniformément vers X au sens strict puisque pour tout n,supΩ|XnX|=n. En revanche (Xn) converge essentiellement uniformément vers X puisque pour tout n, ||XnX||L=1/n.
  • Si (Xn) converge essentiellement uniformément vers X alors il existe un évènement E de probabilité 1 tel que, restreint à E, (Xn) converge uniformément vers X au sens strict. Plus précisément, supΩ|𝟏EXn𝟏EX| tend vers 0, où 𝟏E est la variable aléatoire qui vaut 1 sur E et 0 ailleurs (elle est donc presque-sûrement égale à 1).
  • La convergence essentiellement uniforme se généralise à des variables aléatoires à valeurs dans un espace vectoriel normé muni de sa tribu borélienne. Il est même possible de généraliser cette notion de convergence à des fonctions mesurables sur un espace mesuré.

Convergence en moyenne d'ordre p (ou Lp)

Rappelons qu'une variable aléatoire réelle Y est dite avoir un moment d'ordre p > 0 fini si 𝔼(|Y|p)<+. Dans ce cas on définit ||Y||Lp:=𝔼(|Y|p)1/p. Modèle:Théorème

Remarques :

  • Le fait que Xn et X aient un moment d'ordre p fini implique que XnX aussi (pour p ≥ 1 cela est une conséquence de l'inégalité de Minkowski). Ainsi la quantité ||XnX||Lp est bien définie. Plus précisément l'ensemble des variables aléatoires réelles définies sur (Ω,,) ayant un moment d'ordre p fini est un espace vectoriel réel pour lequel la fonction ||||Lp est une semi-norme, quand p ≥ 1, et est une semi-quasi-norme, quand 0 < p < 1. Attention ce n'est pas une norme, en général on quotiente par le sous-espace des variables aléatoires presque-sûrement nulles. Sur cet espace quotient, ||||Lp induit une norme quand p ≥ 1 et induit une quasi-norme quand 0 < p < 1.
  • Pour p = 1, on parle simplement de convergence en moyenne et pour p = 2 de convergence en moyenne quadratique.
  • La convergence en moyenne d'ordre p se généralise à des variables aléatoires à valeurs dans un espace vectoriel normé muni de sa tribu borélienne. Il est même possible de généraliser cette notion de convergence à des fonctions mesurables sur un espace mesuré.
  • Pour r =2, on a le résultat suivant :

Modèle:Théorème

Modèle:Démonstration

Convergence presque sûre

On rappelle qu'un ensemble négligeable de l'espace probabilisé (Ω,,) est un sous-ensemble NΩ tel qu'il existe A vérifiant (A)=0 et NA. Autrement dit, un ensemble négligeable est un sous-ensemble de Ω inclus dans un ensemble de probabilité nulle.Modèle:Théorème

Remarques :

  • L'ensemble {limnXn=X}={ωΩ|limnXn(ω)=X(ω)} appartient bien à la tribu , donc sa probabilité est bien définie. En effet cela peut se voir en écrivant {limnXn=X}=m1N1nN{|XnX|1/m} et en utilisant les propriétés de stabilité d'une tribu.
  • La convergence presque sûre est équivalente à la condition :
ε>0,(lim infn{|XnX|<ε})=1
ainsi qu'à la condition :
ε>0,(lim supn{|XnX|>ε})=0
où ces limites inférieure et supérieure de suites d'ensembles sont définies par
lim infn{|XnX|<ε}:=NnN{|XnX|<ε}={|XnX|<ε a` partir dun certain rang}
et
lim supn{|XnX|>ε}:=NnN{|XnX|>ε}={|XnX|>ε infiniment souvent}.
  • La convergence presque sûre est utilisée dans la loi forte des grands nombres.
  • La convergence presque sûre se généralise à des variables aléatoires à valeurs dans un espace topologique muni de sa tribu borélienne. Il est même possible de généraliser cette notion de convergence à des fonctions mesurables sur un espace mesuré, on parle alors de convergence presque partout.

Convergence en probabilité

Modèle:ThéorèmeRemarques :

  • La convergence en probabilité se généralise à des variables aléatoires à valeurs dans un espace métrique muni de sa tribu borélienne. Dans ce cas il faut remplacer |XnX| par d(Xn,X) dans la définition, où d désigne la distance. Il est même possible de généraliser cette notion de convergence à des fonctions mesurables sur un espace mesuré, on parle alors de convergence en mesure.

Convergence en loi

Modèle:Article détaillé Modèle:Théorème

Remarques :

  • Le fait que f soit continue nous assure qu'elle est mesurable, donc par composition, f(Xn) et f(X) aussi. De plus, le fait que f soit bornée implique que f(Xn) et f(X) sont aussi bornées. Ainsi les quantités 𝔼[f(Xn)] et 𝔼[f(X)] sont bien définies.
  • Dans le cas de variables aléatoires à valeurs entières, la convergence en loi est équivalente à :
limn(Xn=m)=(X=m), pour tout entier Modèle:Mvar.
limnFn(a)=F(a), pour tout réel Modèle:MvarModèle:Mvar est continue.
Puisque Modèle:Math, cela signifie que la probabilité que Modèle:Mvar appartienne à un certain intervalle est très proche de la probabilité que Modèle:Mvar soit dans cet intervalle pour Modèle:Mvar suffisamment grand.
  • Un autre résultat important donnant des critères équivalents de convergence en loi est le théorème porte-manteau.
  • Le théorème de convergence de Lévy donne une équivalence entre la convergence en loi et la convergence, en tout point, des fonctions caractéristiques.
  • La convergence en loi se généralise à des variables aléatoires à valeurs dans un espace topologique muni de sa tribu borélienne.

Exemples

Convergence en loi

Modèle:Exemple

Modèle:Exemple

Modèle:Exemple

Convergence d'une fonction d'une variable aléatoire

Un théorème très pratique, le lemme de l'application continue (LAC), désigné en anglais généralement sous le nom de Modèle:Lang, établit qu'une fonction Modèle:Mvar continue appliquée à une variable qui converge vers Modèle:Mvar convergera vers Modèle:Math pour tous les modes de convergence :

Modèle:Théorème

Remarque : Ce théorème s'avère être faux pour la convergence LModèle:2. Un contre-exemple possible est le suivant : on pose

Xn:={1avec proba 11/n2navec proba 1/n2 pour n*, et g:xx2 continue sur .

On a bien XnL2X=1 mais pas g(Xn)L2g(X)=X2=1. Modèle:Exemple

Liens entre les différents modes de convergence

Convergences L et Lp

Modèle:Théorème

Modèle:DémonstrationÀ noter que si (Xn) et X sont essentiellement bornées, alors elles admettent un moment d'ordre p fini. Il est donc légitime de parler de la convergence en norme Lp.

La réciproque du résultat est fausse. Par exemple, soit une suite de variables aléatoires (Xn) à valeurs dans {0,1} telles que (Xn=1)=1/n pour tout n1. Alors, pour tout p>0, (Xn) converge vers 0 en norme Lp car ||Xn||Lp=(1/n)1/p. Pourtant elle ne converge pas en norme L car ||Xn||L=1.

Convergences Lp et Lq

Modèle:Théorème

Modèle:DémonstrationÀ noter que si (Xn) et X ont un moment d'ordre p fini, alors elles ont aussi un moment d'ordre q fini. Il est donc légitime de parler de la convergence en norme Lq.

La réciproque du résultat est fausse. Par exemple, soit une suite de variables aléatoires (Xn) à valeurs dans + telles que (Xn=0)=11/np et (Xn=n)=1/np pour tout n1. Alors (Xn) converge vers 0 en norme Lq car ||Xn||Lqq=nqp. Pourtant elle ne converge pas en norme Lp car ||Xn||Lp=1.

Convergences Lp et en probabilité

Modèle:Théorème

Modèle:DémonstrationLa réciproque du résultat est fausse. Par exemple, soit Y une variable aléatoire de loi uniforme sur [0,1] et on pose Xn:=n1{Y1/n}. Alors (Xn) converge vers 0 en probabilité car (|Xn|ε)=1/n pour nε. Cette suite converge même presque sûrement vers 0. Pourtant elle ne converge pas en norme L1 car ||Xn||L1=1.

Le théorème de Lebesgue-Vitali et le lemme de Riesz-Scheffé[1] donnent chacun une condition suffisante pour que la convergence en probabilité donne la convergence en moyenne d'ordre p. La condition du premier est l'uniforme intégrabilité et la condition du second est la convergence des moments d'ordre p.Modèle:ThéorèmeModèle:Théorème

Convergences L et presque sûre

Modèle:ThéorèmeLa réciproque du résultat est fausse. Par exemple, soit Y une variable aléatoire de loi uniforme sur [0,1] et on pose la suite de variables Xn:=1{Y1/n}. Alors la suite (Xn) converge vers 0 presque sûrement mais elle ne converge pas vers 0 dans L car ||Xn||L=1 pour tout n.

Le théorème d'Egoroff donne une réciproque partielle : s'il y a convergence presque sûre, alors il y a convergence uniforme sur des évènements de probabilité aussi proche de 1 que l'on souhaite (sans jamais atteindre 1 exactement).Modèle:ThéorèmeÀ noter que dans le théorème d'Egoroff la convergence est uniforme ce qui est plus fort que la convergence essentiellement uniforme.

Convergence presque sûre et en probabilité

Modèle:Théorème

Modèle:DémonstrationLa réciproque du résultat est fausse. Par exemple, soit Y une variable aléatoire de loi uniforme sur [0,1]. On crée la suite intervalles I1:=[0,1],I2:=[0,1/2],I3:=[1/2,1],I4:=[0,1/4],I5:=[1/4,2/4],I6:=[2/4,3/4],I7:=[3/4,1],I8:=[0,1/8],... Plus explicitement, pour tout n* on pose kn:=log2(n) et an:=n2kn. On crée alors In:=[an/2kn,(an+1)/2kn]. On définit ensuite Xn:=𝟏{YIn}. Alors la suite (Xn) converge en probabilité vers 0. Elle converge même dans Lp pour tout p>0 car 𝔼[|Xn|p]=1/2kn. Pourtant cette suite ne converge pas presque sûrement vers 0 car presque sûrement il existe une infinité de n tels que YIn.

Il est également possible de trouver des suites qui convergent en probabilité mais qui converge ni presque sûrement, ni dans Lp comme le montre l'exemple suivant. Modèle:Exemple

Modèle:ExempleLes trois propriétés suivantes donnent des réciproques partielles. La première dit que la convergence en probabilité implique la converge presque sûre d'une sous-suite. La deuxième est une conséquence du théorème de Borell-Cantelli et dit que si la convergence en probabilité a lieu assez rapidement alors la convergence presque sûre a lieu également. Enfin, la troisième dit que la convergence en probabilité est équivalente à la convergence presque sûre pour une somme de variables aléatoires indépendantes[2]Modèle:,[3].Modèle:Théorème

Modèle:Théorème

Modèle:Théorème

Convergence en probabilité et en loi

Modèle:Théorème

Modèle:Démonstration

Modèle:Théorème

Modèle:Démonstration

Modèle:Théorème

Convergence presque sûre et en loi

La convergence presque sûre implique la convergence en loi, puisqu'elle implique la convergence en probabilité et cette dernière implique celle en loi. La réciproque est fausse. Le théorème de représentation de Skorokhod donne une réciproque partielle.

Diagramme résumant les liens entre les différents modes de convergences de variables aléatoires. Une double flèche représente une implication. Une flèche simple représente une «réciproque partielle» ou un résultat permettant, sous certaines hypothèses, de passer d'un mode de convergence à un autre mode plus fort.

Notes et références

Modèle:Références

Bibliographie

Liens externes

  • [1] : cours de l’école centrale de Paris de 1e année sur la convergence des variables aléatoires


Modèle:Palette Modèle:Portail