Convergence en loi

De testwiki
Version datée du 24 novembre 2024 à 01:24 par imported>Libertinus Mercator (growthexperiments-addlink-summary-summary:3|0|0)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

En théorie des probabilités, il existe différentes notions de convergence de variables aléatoires. Certaines de ces notions ne sont pas spécifiques des probabilités, mais de l'analyse en général, comme la convergence presque sûre de variables aléatoires, ou encore la convergence [[espace Lp|Modèle:Math]]. La convergence en loi de suites de variables aléatoires est un concept appartenant plus spécifiquement à la théorie des probabilités, utilisé notamment en statistique et dans l'étude des processus stochastiques. La convergence en loi est souvent notée en ajoutant la lettre (ou 𝒟 pour distribution) au-dessus de la flèche de convergence :

XnX.

La convergence en loi est la forme la plus faible de convergence de variables aléatoires au sens où, en général, elle n'implique pas les autres formes de convergence de variables aléatoires, alors que ces autres formes de convergence impliquent la convergence en loi. Le théorème central limite, un des résultats les plus importants de la théorie des probabilités, concerne la convergence en loi d'une suite de variables aléatoires.

Définition

Soit X une variable aléatoire et soit (Xn)n1 une suite de variables aléatoires, toutes à valeurs dans le même espace métrique (E, d). Modèle:Théorème

Notons, et cela distingue la convergence en loi des autres types de convergence de variables aléatoires, que les variables aléatoires X et Xn ne sont pas nécessairement définies sur les mêmes espaces probabilisés mais peuvent être définies sur des espaces probabilisés tous différents, disons (Ωn,𝒜n,n)n1 et (Ω,𝒜,). En effet la convergence en loi est en réalité la convergence d'une suite de mesures de probabilités, les lois de probabilités des variables aléatoires, (Xn)n1, vers la loi de X, X. En effet, en vertu du théorème de transfert, la définition peut se réécrire : pour toute fonction φ continue bornée sur E,

limn EφdXn = EφdX,

ce qui impose uniquement que l'espace d'arrivée des variables aléatoires, E, soit le même. Cette reformulation fait aussi apparaître que chaque variable aléatoire peut être remplacée par une autre sans que la convergence en loi soit affectée, pourvu que les deux variables aléatoires intervenant dans l'échange aient même loi. Cette notion de convergence est équivalente à la convergence dans la topologie faible-*.

La convergence en loi est souvent notée en ajoutant la lettre (ou 𝒟 pour distribution) au-dessus de la flèche de convergence :

XnX,oubienXn𝒟X.

Le théorème porte-manteau

Modèle:Article détaillé Modèle:Théorème

La propriété 5 préfigure le Modèle:Lien. Par ailleurs la propriété 5 possède un cas particulier d'usage fréquent, dans le cas où E est la droite réelle (voir la prochaine section).

Cas des variables aléatoires réelles

Convergence en loi et fonction de répartition

Considérons une suite X1 , X2 , ... , Xn , de variables aléatoires réelles, et une autre variable aléatoire réelle X. Soient F1, F2, ..., Fn la suite des fonctions de répartition associées aux variables aléatoires réelles X1, X2, ..., Xn et soit F la fonction de répartition de la variable aléatoire réelle X. Autrement dit, Fn est définie par Fn(x)=P(Xnx), et F par F(x)=P(Xx). On a le théorème suivant : Modèle:Théorème

Une structure possible pour la démonstration est 3.⇒1.⇒2.⇒3. Modèle:Démonstration Modèle:Démonstration Modèle:Démonstration Le point 2 sert souvent, dans le cas des variables aléatoires réelles, de définition de la convergence en loi. L'implication 1.⇒3. reste vraie lorsque les variables aléatoires réelles sont remplacées par des variables aléatoires à valeurs dans un espace de Lusin (S,d), i.e. un espace métrisable assez général (S=d et S=𝒞([0,1],) en sont des exemples). L'implication 1.⇒3. porte alors le nom de théorème de représentation de Skorokhod.

Puisque F(a) = P(Xa), le point 2 signifie que, pour n suffisamment grand, la probabilité que X appartienne à un certain intervalle est très proche de la probabilité que Xn soit dans cet intervalle.

Modèle:Théorème Cette conséquence du théorème de Dini est très utile, par exemple pour démontrer le théorème central limite pour les quantiles, ou pour démontrer le théorème central limite pour les processus de renouvellement.

Convergence en loi et fonctions caractéristiques

Modèle:Théorème

Autrement dit, (Xn) converge en loi vers X si et seulement si la fonction caractéristique de la variable aléatoire réelle Xn converge simplement vers la fonction caractéristique de la variable aléatoire réelle X.

Convergence en loi et moments

Les moments (quand ils existent) peuvent s'obtenir à partir des dérivées en 0 de la fonction caractéristique. Mais comme la convergence simple des fonctions caractéristiques n'implique pas la convergence des dérivées en 0, en règle générale la convergence en loi n'implique pas la convergence des moments.

Par exemple soit (Xn) la suite des variables aléatoires tels que P(Xn=0)=11n et P(Xn=n)=1n. Alors (Xn) ont pour espérance E(Xn)=1 et pour variances V(Xn)=n1. La suite Xn converge en loi vers la constante X=0, la suite des espérances converge vers 1, qui n'est pas l'espérance de la limite E(X)=0, et la suite des variances ne converge même pas, alors que la variance de la limite est V(X)=0.

En revanche, si les variables Xn sont uniformément bornées (|Xn|M) et convergent en loi vers X, alors X est bornée (|X|M) et tous les moments E(Xnr) convergent vers E(Xr). Modèle:Démonstration

Exemples

Modèle:Exemple

Modèle:Exemple

Modèle:Exemple

Exemples importants

Les exemples de convergence en loi sont foison, le plus célèbre étant le Théorème central limite, cité plus haut, dû à Pierre-Simon de Laplace, pour lequel l'espace métrique (E, d) considéré est tout simplement la droite réelle munie de sa distance usuelle. Donnons deux exemples importants où l'espace métrique considéré, l'espace de Banach (𝒞([0,1]),||.||),  est moins élémentaire.

Soient (Un,n1) une suite iid de variables aléatoires centrées, de carré intégrable et de variance σ2. On interpole la marche aléatoire k=1nUk de manière affine par morceaux en considérant le processus (Xn(t),t0) défini, pour t ∈ [0,1], par

Xn(t)=1σn(k=1[nt]Uk+(nt[nt])U[nt]+1),

[x] désigne la partie entière de x. Considérons l'espace 𝒞([0,1]) des fonctions à valeurs réelles et continues sur [0,1]. On munit 𝒞([0,1]) de la tribu borélienne et de la norme infinie ||.|| . Ainsi, Xn est une variable aléatoire à valeurs dans (𝒞([0,1]),) . Modèle:Théorème Ici B est vu comme un élément aléatoire de (𝒞([0,1]),). Les diverses normalisations, indice [nt] comme indice terminal de la sommation, et facteur 1σn  devant la somme, correspondent à un « zoom arrière » par rapport à la trajectoire de la marche aléatoire : on « s'éloigne » de la représentation graphique de la marche aléatoire, en rétrécissant sa représentation graphique par un facteur 1n  le long de l'axe horizontal et par un facteur 1σn  le long de l'axe vertical, coefficients de réduction assurant, d'après le théorème central-limite, que le résultat de la réduction sera un graphe non-trivial : un coefficient de réduction vertical plus fort donnerait une trajectoire écrasée sur l'axe des abscisses, et un coefficient plus faible ferait apparaitre de fréquentes oscillations « d'amplitude infinie ». Le théorème de Donsker peut être vu comme une justification théorique de l'utilisation du mouvement brownien pour décrire la trajectoire de certaines particules, avec ses applications à l'étude du comportement thermodynamique des gaz (théorie cinétique des gaz), et du phénomène de diffusion, ou encore comme une justification théorique de l'utilisation du mouvement brownien en mathématiques financières : le mouvement brownien se comporte comme une marche aléatoire à sauts très fréquents, ces sauts étant de petite amplitude.

Théorème de Donsker pour les processus empiriques

Soit (Xi,i1) une suite iid de variables aléatoires de loi uniforme sur [0,1]. On note F la fonction de répartition commune des variables Xi. ( F(t)=[Xit] ) On définit la fonction de répartition empirique Fn de l'échantillon X1,X2,..., Xn par

Fn(t)=1ni=1n11Xit,t[0,1]

ainsi que le processus empirique associé Wn par

Wn(t)=n(Fn(t)F(t))=1ni=1n(11XitF(t)),t[0,1].

Considérons l'espace D([0,1]) des fonctions càdlàg (continues à droite et avec limites à gauche) sur [0,1] muni de la topologie de Skorokhod.

Modèle:Théorème Ce théorème précise le théorème fondamental de la statistique, le Théorème de Glivenko-Cantelli, en donnant la vitesse de convergence, 𝒪(1/n),  du processus empirique vers la fonction de répartition. Il justifie l'emploi de la distribution de Kolmogorov-Smirnov dans le test du même nom.

À voir

Notes


Références

Article connexe

Modèle:Lien

Modèle:Portail