Théorème de sélection de Helly

De testwiki
Aller à la navigation Aller à la recherche

Le théorème de sélection de Helly a été établi par le mathématicien Eduard Helly en 1912[1]. Ce théorème garantit qu'une suite de fonctions qui a des variations bornées admet une sous-suite convergente[2]Modèle:,[3]Modèle:,[4]. Il permet en particulier le passage à la limite sous le signe de l'intégrale de Stieltjes.

Définitions

Soit I un intervalle réel.

Énoncé

De toute suite (fn) de fonctions réelles définies sur un intervalle Modèle:Mvar uniformément à variations bornées et uniformément bornée (R>0nxI|fn(x)|R) on peut extraire une sous-suite simplement convergente. La limite de cette sous-suite est à variations bornées.

Modèle:Démonstration/début On va d'abord démontrer le théorème pour une suite de fonctions croissantes. Pour ce faire, on utilisera deux fois le fait que pour tout ensemble dénombrable Modèle:Mvar, l'espace produit [R,R]D est séquentiellement compact, Modèle:C.-à-d. que toute suite d'applications de Modèle:Mvar dans [R,R] admet une sous-suite simplement convergente (c'est la stabilité par produits dénombrables de la compacité séquentielle).

En appliquant d'abord ce lemme à D1=I, on peut donc extraire une sous-suite, qu'on notera encore (fn), qui converge simplement sur I.

Notons Modèle:Mvar la fonction limite, définie sur I et à valeurs dans [R,R] et, pour tout point xI ,

f(x):=sup{f(y)yI,yx}etf+(x):=inf{f(z)zI,zx}.

La fonction Modèle:Mvar étant croissante (comme limite simple de fonctions croissantes), l'ensemble

D2={xI f(x)<f+(x)}(II )

est au plus dénombrable.

Soit xID2. Notons la valeur commune f(x)=f+(x) et montrons que fn(x) tend vers cette valeur. Soit ϵ>0 ; il existe y,zI tels que yxz, f(y)>ϵ et f(z)<+ϵ. Pour Modèle:Mvar assez grand, fn(y)f(y)ϵ et fn(z)f(z)+ϵ et, comme les fn sont croissantes, fn(y)fn(x)fn(z), donc

ϵ>0NnN2ϵ<fn(x)<+2ϵ,

ce qui prouve la convergence de (fn(x)) pour tout xID2.

Pour finir, on applique à nouveau le lemme (à l'ensemble D2) pour obtenir une sous-suite qui converge partout.

Cas général : on sait qu'une fonction réelle à variations bornées peut se mettre sous forme de différence de deux fonctions croissantes : f=f(c)f(d). La décomposition n'étant pas unique, il faut en trouver une telle que les deux suites (fn(c)) et (fn(d)) vérifient les hypothèses qu'on a utilisées. Notons 𝒮(J) l'ensemble des subdivisions d'un sous-intervalle Modèle:Mvar. et fixons aI. Pour toute fonction Modèle:Mvar à variations bornées sur Modèle:Mvar, notons Vu,v(f)=sup{V(f,σ)σ𝒮([u,v])} (pour tout segment [u,v]I) ; on vérifie facilement que les deux fonctions

f(c):x{Va,x(f)si xaVx,a(f)si xaetf(d):=f(c)f

sont croissantes et que si σ𝒮(I)V(f,σ)M alors |f(c)|M, donc si de plus |f|R alors |f(d)|M+R.

Les hypothèses utilisées ci-dessus sont donc satisfaites pour fn(c) et fn(d).

On applique le résultat déjà démontré à (fn(c)), puis de la suite extraite on fait une seconde extraction pour assurer la convergence de (fn(d)).

Selon le même principe, on pourrait traiter des fonctions à valeurs complexes ou, plus généralement, à valeurs dans un espace de dimension finie, en faisant des extractions en cascade pour les parties réelle et imaginaire, ou pour les composantes dans une base. Modèle:Démonstration/fin

Généralisation

On peut déduire du théorème le résultat suivant (encore par une extraction diagonale) :

Soit (fn) une suite de fonctions réelles définies sur un intervalle telle que

  • pour tout sous-intervalle compact Modèle:Mvar, il existe RK>0 tel que sup{|fn(x)|xK,n}RK ;
  • la suite est uniformément à variations bornées sur tout sous-intervalle compact.

Alors, on peut extraire de (fn) une sous suite simplement convergente. La limite de cette sous-suite est localement à variations bornées.

Interprétation en termes de compacité

Le théorème de Helly est clairement un énoncé de compacité, mais cette compacité ne concerne pas vraiment les fonctions à variations bornées.

Notons 𝒞0 l'espace vectoriel des fonctions réelles continues sur tendant vers zéro en ±, muni de la norme uniforme f=sup{|f(x)|x} et 𝒞b l'espace vectoriel des fonctions réelles continues bornées sur , avec la même norme. On sait que ce sont deux espaces de Banach, et que 𝒞0 est un sous espace fermé de 𝒞b.

Le dual de l'espace de Banach 𝒞0 s'identifie à l'espace b des mesures de Radon bornées sur , et d'après le théorème de Banach-Alaoglu, la boule unité fermée de b est *-faiblement compacte, c'est-à-dire compacte pour la topologie de la convergence simple sur 𝒞0. Elle est aussi séquentiellement compacte (comme 𝒞0 est séparable, la topologie induite sur la boule unité de b par la topologie *-faible est métrisable). C'est cette compacité qu'exprime, indirectement, le théorème de Helly, et la démonstration ci-dessus est une preuve de ce cas particulier du théorème de Banach-Alaoglu (preuve d'un intérêt limité, car la démonstration générale du théorème de Banach-Alaoglu est plus courte que celle du théorème de Helly). Montrons le lien entre les deux résultats.

On sait que toute mesure bornée se prolonge de manière unique à 𝒞b (pour des mesures positives — les seules pour lesquelles le théorème est utilisé en pratique —, c'est une conséquence du théorème de convergence monotone ; pour des mesures de signe quelconque, il faut passer par la mesure positive |μ|). Si μ est une mesure bornée, on peut donc définir la fonction de répartition F:F(x)=μ(],x]), et une condition suffisante pour qu'une suite bornée de mesures bornées (μn) converge *-faiblement vers μ est que leurs fonctions de répartition Fn convergent vers la fonction de répartition F de μ simplement sur l'ensemble des points de continuité de F (la réciproque est fausse).

Modèle:Démonstration/début Supposons que la suite de fonctions uniformément à variations bornées (Fn) converge simplement vers la fonction à variations bornées F sur l'ensemble Ec des points de continuité de F. Comme F est à variations bornées, l'ensemble des points de discontinuités est au plus dénombrable, donc Ec est dense dans . On notera μn (resp μ) les mesures bornées associées à Fn (resp F) par l'intégrale de Stieltjes. On note que n,μnM, où M est un majorant uniforme des variations des Fn et de F). Soit ]a,b] un intervalle borné limité par deux points de Ec, notons 𝟙]a,b] la fonction indicatrice de cet intervalle.

D'après la définition des intégrales de Stieltjes, 𝟙]a,b]dμn=Fn(b)Fn(a), donc limn𝟙]a,b]dμn=F(b)F(a)=𝟙]a,b]dμ. Si f est une combinaison linéaire de fonctions de ce type, il est clair que limfdμnn+fdμ.

Soit maintenant f𝒞0. Elle est uniformément continue : ϵ>0η>0|xy|<η|f(x)f(y)|<ϵ.

Soit h:0<h<η et notons xk=kh,k. Pour tout k choisissons un élément ak](k1)h,kh[Ec. Par construction, x]ak,ak+1]|f(x)f(xk)|<ϵ.

Comme f tend vers zéro à l'infini, il existe une somme finie g=k=kmink=kmaxf(xk)𝟙]ak,ak+1] telle que fg<ϵ (pour |x| assez grand, 0 est une approximation à ϵ près). On a vu que NnN|gdμngdμ|<ϵ donc

n>N|fdμnfdμ||fdμngdμn|+|gdμngdμ|+|gdμfdμ|(1+2M)ϵ.

Modèle:Démonstration/fin

On applique le plus souvent ces résultats pour des mesures de probabilité, ce qui demande des précautions supplémentaires : l'ensemble des mesures positives de masse totale inférieure ou égale à M est *-faiblement fermé (c'est une intersection de demi-espaces *-faiblement fermés) ; il est contenu dans le compact (*-faible) constitué par la boule fermée de rayon M, donc il est *-faiblement compact. Mais l'ensemble des mesures de probabilité n'est pas *-faiblement fermé ; il est par exemple évident que la suite (δn) des masses de Dirac aux points n converge *-faiblement vers zéro, or la mesure nulle n'est clairement pas une mesure de probabilité. Il faut donc des hypothèses supplémentaires, par exemple la convergence étroite, ou des conditions de tension, ces dernières pouvant, dans le cas de , s'exprimer à l'aide des fonctions de répartition.

Habituellement, les probabilistes sous entendent l'étoile et écrivent « convergence faible » au lieu de « convergence *-faible » et de même pour toutes les expressions du même type (parce que la véritable convergence faible, qui ferait intervenir le dual de l'espace des mesures, n'est jamais utilisée) ; comme l'espace 𝒞0 n'est pas réflexif, cela peut conduire à des erreurs si on utilise sans réfléchir des théorèmes sur les e.v.t. pour lesquels la distinction est importante.

Notes et références

Modèle:Références

Modèle:Portail