Théorème d'approximation de Komlós-Major-Tusnády

De testwiki
Aller à la navigation Aller à la recherche

Le théorème d'approximation de Komlós-Major-Tusnády ou approximation KMT est un résultat d'approximation forte qui donne une borne d'approximation de la somme partielle de variables aléatoires centrées réduites i.i.d. dont la fonction génératrice des moments est définie sur un voisinage de 0. Il affirme en particulier que cette somme peut être approchée par un mouvement brownien avec une erreur de O(logn).

Histoire

En 1961, le mathématicien Skorokhod établit qu'une somme de variables i.i.d. centrées réduites pouvait être représentée par un mouvement brownien stoppé en certains temps d'arrêt[1].

C'est avec ce résultat que Strassen démontra en 1964 qu'une telle somme pouvait être approchée par un mouvement brownien avec une erreur de o(nloglogn)[2]. Bien que ce soit la meilleure borne, elle est insuffisamment générale pour démontrer des théorèmes de convergence classiques comme le théorème de Donsker[3]. La théorie de l'approximation forte émerge à partir de ce résultat.

C'est en 1975-1976 qu'émerge une meilleure approximation grâce aux mathématiciens János Komlós, Gábor Tusnády et Péter Major. Sous réserve d'une hypothèse plus forte, il est possible d'approcher la somme partielle par un mouvement brownien avec une erreur de O(logn). La preuve de ce résultat utilise une méthode appelée la construction hongroise[4]Modèle:,[5].

Énoncé

Approximation forte des sommes partielles

Soit une suite de variables (Xn)n* i.i.d. centrées réduites dont la fonction génératrice des moments est définie sur un voisinage de 0. Il existe alors un mouvement brownien (Bt)t0 vérifiant pour tout x et n*,

(max1kn|SkBk|>Clogn+x)<Keλx,

C,K,λ sont des constantes positives dépendant de la distribution des Xn.

En particulier, le lemme de Borel-Cantelli implique que max1kn|SkBk|=p.s.O(logn).

Approximation forte du processus empirique

Ce théorème admet également une version pour l'approximation forte du processus empirique uniforme Si (Un)n* est une suite de variables i.i.d. de loi uniforme sur [0,1] alors il existe une suite de ponts browniens (Pn(t))n* tel que

n*,x>0,(sup0t1|αnU(t)Pn(t)|>n1/2(Clogn+x))Leλx,

avec C,L,λ des constantes universelles positives. Par conséquent, d'après le lemme de Borel-Cantelli,

supt[0,1]|αnU(t)Pn(t)|=O(n1/2logn).

Bretagnolle et Massart ont même pu donner des valeurs pour les constantes universelles : ils ont montré que l'on pouvait prendre en particulier C=12,L=2,λ=1/6[6].

Rappel : le processus empirique uniforme est défini par

0t1,αnU(t)=n([1ni=1n𝟏{Uit}]t).

Optimalité

La bornée proposée par KMT est la meilleure possible excepté le cas où X1 serait lui-même une loi normale. En effet[3], s'il existe un mouvement brownien (Bt)t0 vérifiant |SnBn|=op.s.(logn) alors Xi est une loi normale centrée réduite.

Ce résultat est également optimal dans le sens où si l'hypothèse d'existence de la fonction génératrice des moments au voisinage de 0 est supprimée alors la borne donnée par KMT n'est plus valide. En effet[3], si c'est le cas alors pour tout mouvement brownien (Bt)t0, presque-sûrement on a,

lim supn+SnBnlogn=+.

L'approximation est également optimale dans le cas du processus empirique. En effet[4], pour toute suite de ponts browniens

(Pt)0t1

définis sur le même espace de probabilité que le processus empirique

(αnU(t))0t1

on a que

(sup0t1|αnU(t)Pn(t)|16n1/2logn)n+1.

Références

Modèle:Portail