Approximation forte

De testwiki
Aller à la navigation Aller à la recherche

L'approximation forte est une notion en probabilité théorique qui est apparue durant la seconde moitié du Modèle:S-, notamment après le théorème de Strassen de 1964. Les résultats d'approximation forte permettent de créer des espaces de probabilité convenables sur lesquels les sommes partielles ou le processus empirique, vont être proches des objets (comme le mouvement brownien ou le pont brownien) vers lesquels ils convergent.

Principe

Le théorème de représentation de Skorokhod énonce qu'une suite de variables aléatoires (Xn)n converge en loi vers une variable aléatoire X s'il existe un espace aléatoire sur lequel sont définies des copies (Yn)n et Y respectivement de (Xn)n et X tels que la suite (Yn)n converge presque sûrement vers Y.

L'approximation forte consiste donc à construire ces espaces de probabilités sur lesquels les objets que l'on étudie, comme les sommes partielles Sn=i=1nXi ou le processus empirique αn=n(PnP) (où Pn est la mesure empirique et P la loi des variables Xi supposées i.i.d.). vont être proches de leurs limites, comme le mouvement brownien ou le pont brownien. En outre de donner un moyen pratique d'établir une convergence en loi, l'approximation forte donne une vitesse de convergence vers l'objet limite.

Approximation forte des sommes partielles

Soient X1,,Xn des variables i.i.d. et Sn=i=1nXi la somme partielle de ces variables aléatoires. En 1961, le théorème de Skorokhod établit qu'on peut écrire en loi une somme partielle comme un mouvement brownien évalué en des temps d'arrêts.

À la suite de ce résultat, le théorème de Strassen apparaît en 1964 et introduit pour la première fois la notion d'approximation forte. Il établit que sous la seule condition que les variables admettent un moment d'ordre deux, on peut approcher presque-sûrement sur un espace de probabilité convenable la somme partielle Sn par un mouvement brownien Bn avec une borne en o(nloglogn). Bien qu'il soit optimal et puissant, ce résultat n'est pas suffisant pour démontrer des théorèmes comme le théorème de Donsker.

En 1975-1976[1]Modèle:,[2], les mathématiciens Komlós, Tusnády et Major établissent que si la fonction génératrice des variables aléatoires est définie sur un voisinage de 0 alors on peut approcher presque-sûrement Sn par un mouvement brownien avec une borne en O(logn). Ce résultat est connu comme le théorème d'approximation KMT. C'est un résultat optimal aussi bien par rapport à la borne d'approximation que par l'hypothèse d'existence de la fonction génératrice au voisinage de 0.

Approximation forte du processus empirique

Approximation du processus empirique

Le premier résultat concernant l'approximation forte du processus empirique est dû à Brillinger en 1969[3]. Celui-ci établit que si (Un)n* est une suite de variables i.i.d. de loi uniforme sur [0,1] alors il existe une suite de copies (U~n)n* et une suite de ponts browniens (Pn(t))n* tel que presque-sûrement

supt[0,1]|αnU~(t)Pn(t)|=O(n1/4(logn)1/2(loglogn)1/4).

Dans leurs articles[1]Modèle:,[2], Komlós, Tusnády et Major ont établi que si (Un)n* est une suite de variables i.i.d. de loi uniforme sur [0,1] alors il existe une suite de ponts browniens (Pn(t))n* tel que presque-sûrement

(supt[0,1]|αnU(t)Pn(t)|>n1/2(Clogn+x))Leλx

C,λ,L

sont des constantes universelles positives. Ce qui entraîne d'après le lemme de Borel-Cantelli : presque-sûrement,

supt[0,1]|αnU(t)Pn(t)|=O(n1/2logn).

L'approximation du processus empirique fourni par KMT est encore cette fois optimale.

Approximation du processus empirique par un processus de Kiefer

Modèle:Article détaillé

Jack Kiefer fut le premier mathématicien à considérer le processus empirique

αn(t)

comme un processus à deux paramètres et que celui-ci devait par conséquent être approché par un processus gaussien bidimensionnel. Il prouve notamment que si

(Un)n*

est une suite de variables i.i.d. de loi uniforme sur

[0,1]

, il existe un processus de Kiefer

(K(t,x))0t1,x0

vérifiant presque-sûrement[4]

supt[0,1]|nαn(t)K(t,n)|=O(n1/3(logn)2/3).

Par la suite, le théorème KMT fournit une meilleure approximation du processus empirique par le processus de Kiefer : si

(Un)n*

est une suite de variables i.i.d. de loi uniforme sur

[0,1]

alors il existe un processus de Kiefer

(K(y,t))0y1,t0

tel que[5]

(max1knsupt[0,1]|k1/2αk(y)K(y,k)|>(Clogn+x)logn)<Leλx

C,λ,L sont des constantes universelles positives. Ce qui entraîne d'après le lemme de Borel-Cantelli : presque-sûrement,

sup0y1|n1/2αn(y)K(y,n)|=O(log2n).

Approximation du processus empirique indexé par une classe de fonctions

Berthet et Mason ont généralisé en 2006[6] l'approximation forte du processus empirique indexé par une classe de fonctions soumises à des conditions d'entropie. On travaillera avec des variables (Xi)i* i.i.d. de loi P=X définies sur un espace de probabilité (Ω,𝒯,) à valeurs dans un espace (𝒳,𝒜), avec une classe de fonctions incluses dans l'ensemble des fonctions mesurables de (𝒳,𝒜) à valeurs réelles. On pose les hypothèses suivantes :

Hypothèse .i : f,||f||𝒳=supx𝒳|f(x)|<M/2 ;

Hypothèse .ii : est ponctuellement mesurable, i.e. il existe un sous-ensemble dénombrable ~ tel que tout élément de puisse s'écrire comme limite d'une suite d'éléments de ~.

Hypothèse VC : c0>0,ν0>0 et une enveloppe de fonction F de tel que

supQN(F,ε||F||Q,2,dQ)c0εν0,0<ε<1,

  • le supremum est pris parmi toutes les mesures de probabilité Q de (𝒳,𝒜) pour lesquelles 0<Q(F2)<+ ;
  • N(F,ε,d) est le nombre de recouvrement de F par des boules de rayon ε pour une distance d.
  • dQ est la semi-métrique dQ(f,g)=(𝒳(fg)2dQ)1/2 avec Q une mesure de probabilité sur (𝒳,𝒜).

Hypothèse BR : b0>0,1/2<r0<1,0<ε<1,H[ ](,ε,dP)b02ε2r0H[ ](,ε,d) est l'entropie avec crochets de de rayon ε avec la distance d, c'est-à-dire du log du nombre de recouvrement avec crochets avec les mêmes paramètres.

Si vérifie les conditions .i,.ii, VC ou BR alors θ>0, il existe Cθ>0, une suite (vn)n* de réels strictement positifs et de limite nulle, des variables (Xi)i* i.i.d. de loi P et une suite indépendante (𝔾i)i* de processus de P-pont brownien définis sur un même espace de probabilité vérifiant

(n1/2max1knkαkXi=1k𝔾i>Cθvn)nθ

et

n1/2max1knkαkXi=1k𝔾i=Op.s.(vn).

La deuxième relation provient de la première en effectuant un raisonnement par blocs et en appliquant le lemme de Borel-Cantelli.

Remarques :

  • L'hypothèse .i est une condition sur l'existence d'une enveloppe de la classe de fonction, i.e. d'une fonction mesurable F telle que f,x𝒳,|f(x)|F(x) ;
  • La seconde condition .ii permet de s'assurer de la bonne définition du processus limite ;
  • L'hypothèse VC n'est pas la définition d'une classe VC mais une propriété vérifiée par les classes VC à savoir que ce sont des classes polynomiales, c'est-à-dire que le recouvrement d'une classe VC est polynomiale en son rayon ε.

Références

Modèle:Portail