Convergence de mesures

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Voir homonymes

En mathématiques, plus spécifiquement en théorie des mesures, il existe différentes notions de convergence de mesures . Pour un sens général intuitif de ce que l'on entend par convergence en mesure, considérons une suite de mesures μn sur un espace, partageant une collection commune d'ensembles mesurables. Une telle suite pourrait représenter une tentative de construire des approximations «de mieux en mieux» d'une mesure μ souhaitée qui est difficile à obtenir directement. Le sens de «de mieux en mieux» est soumis à toutes les mises en garde habituelles pour prendre des limites ; pour toute tolérance d'erreur ε>0, nous exigeons que N soit suffisamment grand pour nN afin de garantir que la «différence» entre μn et μ soit inférieure à ε. Diverses notions de convergence spécifient précisément ce que le mot «différence» devrait signifier dans cette description ; ces notions ne sont pas équivalentes et varient en force.

Trois des notions de convergence les plus communes sont décrites ci-dessous.

Descriptions informelles

Cette section tente de fournir une description intuitive approximative de trois notions de convergence, en utilisant la terminologie développée dans les cours de calcul ; cette section est nécessairement imprécise ainsi qu'inexacte, et le lecteur doit se référer aux clarifications formelles des sections suivantes. En particulier, les descriptions ici n'abordent pas la possibilité que la mesure de certains ensembles puisse être infinie, ou que l'espace sous-jacent puisse présenter un comportement pathologique, et des hypothèses techniques supplémentaires sont nécessaires pour certaines des déclarations. Les affirmations de cette section sont cependant toutes correctes si (μn) est une suite de mesures de probabilité sur un espace polonais.

Les différentes notions de convergence formalisent l'affirmation selon laquelle la « valeur moyenne » de toute fonction « suffisamment agréable » devrait converger :

fdμnfdμ

Pour formaliser cela, il faut spécifier soigneusement l'ensemble des fonctions considérées et le degré d'uniformité de la convergence.

La notion de convergence faible nécessite que cette convergence ait lieu pour chaque fonction bornée continue f. Cette notion traite la convergence pour différentes fonctions f indépendamment les unes des autres, i.e. que différentes fonctions f peuvent nécessiter différentes valeurs de N ≤ n pour être approximées de façon égale (ainsi, la convergence n'est pas uniforme en f).

La notion de convergence forte formalise l'affirmation selon laquelle la mesure de chaque ensemble mesurable devrait converger:

μn(A)μ(A)

Encore une fois, aucune uniformité sur l'ensemble A n'est requise. Intuitivement, compte tenu des intégrales des fonctions « agréables », cette notion fournit plus d'uniformité qu'une convergence faible. En fait, lorsque l'on considère des suites de mesures avec une variation uniformément bornée sur un espace polonais, une forte convergence implique la convergence fdμnfdμ pour toute fonction mesurable bornée f . Comme précédemment, cette convergence n'est pas uniforme en f.

La notion de convergence en variation totale formalise l'affirmation selon laquelle la mesure de tous les ensembles mesurables doit converger uniformément, c'est-à-dire pour chaque ε>0 il existe un entier N tel que |μn(A)μ(A)|<ε pour chaque n>N et pour chaque ensemble mesurable A. Comme précédemment, cela implique une convergence des intégrales avec des fonctions mesurables bornées, mais cette fois la convergence est uniforme sur toutes les fonctions bornées par une constante fixe.

Convergence en variation totale de mesures

Il s'agit de la plus forte notion de convergence présentée sur cette page et elle est définie comme suit. Soit (X,) un espace mesurable. La distance en variation totale entre deux mesures (positives) μ et ν est alors donnée par

μνTV=supf{XfdμXfdν}.

Ici, le supremum est pris sur tous les f parcourant l'ensemble de toutes les fonctions mesurables de X dans [1,1]. Cela contraste, par exemple, avec la métrique de Wasserstein, où la définition est de la même forme, mais où le supremum est pris sur tous les f parcourant l'ensemble des fonctions mesurables de X dans [1,1] qui ont une constante de Lipschitz au plus égale à 1 ; ou avec la métrique de Radon, où le supremum est pris sur tous les f parcourant l'ensemble des fonctions continues de X dans [1,1]. Dans le cas où X est un espace polonais, la métrique de la variation totale coïncide avec la métrique de Radon.

Si μ et ν sont tous deux des mesures de probabilité, alors la distance en variation totale est également donnée par

μνTV=2supA|μ(A)ν(A)|.

L'équivalence entre ces deux définitions peut être considérée comme un cas particulier de la dualité Monge-Kantorovich. D'après les deux définitions ci-dessus, il est clair que la distance de variation totale entre les mesures de probabilité est toujours comprise entre 0 et 2.

Pour illustrer la signification de la distance en variation totale, considérons l'expérience de pensée suivante. Supposons que l'on nous donne deux mesures de probabilité μ et ν, ainsi qu'une variable aléatoire X. Nous savons que X suit la loi μ ou ν mais nous ne savons pas laquelle des deux. Supposons que ces deux mesures ont comme probabilité a priori 0,5 chacune d'être la vraie loi de X. Supposons maintenant que l'on nous donne un seul échantillon distribué selon la loi de X et qu'on nous demande ensuite de deviner laquelle des deux distributions décrit cette loi. La quantité

2+μνTV4

fournit alors une borne supérieure stricte sur la probabilité a priori que notre supposition soit correcte.

Étant donné la définition ci-dessus de la distance en variation totale, une suite (μn) de mesures définies sur le même espace de mesure converge vers une mesure μ de distance de variation totale si pour chaque ε>0, il existe un N tel que pour tout n>N, on a [1]

μnμTV<ε.

Convergence forte de mesures

Pour (X,) un espace mesurable, une suite (μn) converge fortement vers une limite μ si

limnμn(A)=μ(A)

pour tous les ensembles A .

Par exemple, du fait du lemme de Riemann–Lebesgue, la suite (μn) de mesures sur l'intervalle [1,1] donnée par μn(dx)=(1+sin(nx))dx converge fortement vers la mesure de Lebesgue, mais elle ne converge pas en variation totale.

Convergence faible des mesures

En mathématiques et en statistiques, la convergence faible (ou convergence étroite) est l'un des nombreux types de convergence liées à la convergence des mesures. Elle dépend d'une topologie de l'espace sous-jacent et n'est donc pas une notion de mesure purement théorique.

Il existe plusieurs définitions équivalentes de convergence faible d'une suite de mesures, dont certaines sont (apparemment) plus générales que d'autres. L'équivalence de ces conditions est parfois connue sous le nom de théorème de Portmanteau[2] .

Définition : Soit S un espace métrique muni de sa tribu borélienne Σ. Une suite bornée de mesures de probabilité positives Pn(n=1,2,) sur (S,Σ) converge faiblement vers la mesure positive finie P (notée PnP ) si l'une des conditions équivalentes suivantes est remplie (ici En désigne l'espérance ou la norme L1 par rapport à Pn, tandis que E désigne l'espérance ou la norme L1 par rapport à P ):

Dans le cas S, muni de sa topologie habituelle, si on désigne par (Fn) et F les fonctions de répartition des mesures Pnet P respectivement, alors Pn converge faiblement vers P si et seulement si lim\limits nFn(x)=F(x) pour tous les points de continuité x de F.

Par exemple, la suite où les Pn sont les mesures de Dirac en 1/n converge faiblement vers la mesure de Dirac en 0 (si on les considère comme des mesures sur avec la topologie habituelle), mais elle ne converge pas fortement. Ceci est clair intuitivement : nous savons seulement que 1/n est "proche" de 0 en raison de la topologie de .

Cette définition de convergence faible peut être étendue sur tout espace topologique métrisable S. Il définit également une topologie faible sur 𝒫(S), qui est l'ensemble de toutes les mesures de probabilité définies sur (S,Σ). La topologie faible est générée par la base d'ensembles ouverts suivante :

{Uϕ,x,δ|ϕ:S est bornée et continue,x𝐑 et δ>0},

Uϕ,x,δ:={μ𝒫(S):|Sϕdμx|<δ}.

Si S est également séparable, 𝒫(S) est métrisable et séparable, par exemple par la métrique de Lévy – Prokhorov, si S est également compact ou polonais, 𝒫(S) l'est également.

Si S est séparable, il s'intègre naturellement dans 𝒫(S) comme l'ensemble (fermé) des mesures de Dirac, et son enveloppe convexe est dense .

Il existe de nombreuses "flèches" pour ce type de convergence : les plus utilisées sont PnP, PnP et Pn𝒟P. .

Convergence faible des variables aléatoires

Soit (Ω,,) un espace de probabilité et X un espace métrique. Si Modèle:Nobr est une suite de variables aléatoires, alors X n converge faiblement (ou en distribution ou en loi ) vers X quand Modèle:Nobr si la suite de mesures avancées ( X n ) ( P ) converge faiblement vers X ( P ) dans le sens d'une convergence faible de mesures sur X, tel que définie ci-dessus.

Voir aussi

Références

Modèle:Références

Modèle:Portail