Distance en variation totale (probabilités)

De testwiki
Aller à la navigation Aller à la recherche

En mathématiques et plus particulièrement en théorie des probabilités et en statistique, la distance en variation totale (ou distance de variation totale ou encore distance de la variation totale) désigne une distance statistique définie sur l'ensemble des mesures de probabilité d'un espace probabilisable.

Définition

Soit μ,ν deux mesures de probabilité sur un espace probabilisable (Ω,). La distance en variation totale entre μ et ν est la quantité

dVT(μ,ν):=2supA|μ(A)ν(A)|.

Il arrive que le facteur 2 n'apparaisse pas chez certains auteurs.Modèle:Référence nécessaire

Soit X et Y deux variables aléatoires à valeurs dans le même espace. On peut aussi définir la distance en variation totale entre X et Y comme la distance en variation totale entre la loi de X et celle de Y. Autrement dit, on pose

dVT(X,Y):=dVT(X,Y).

Propriétés

Propriétés basiques

  • La distance en variation totale entre deux mesures de probabilité est une distance dont la valeur est toujours incluse dans [0,2].
  • La distance en variation totale entre deux mesures de probabilité vaut 2 si et seulement si les supports des deux mesures sont disjoints.

Définitions équivalentes

On trouve parfois d'autres définitions pour la distance en variation totale.

  • La formule suivante donne une définition équivalente à la première[1]
dVT(μ,ν)=supf:Ω[1,1] mes.{fdμfdν}
où le supremum est pris sur l'ensemble des fonctions mesurables à valeurs dans [-1,1].
De cette formule, on déduit la chose suivante. Si μ et ν sont absolument continues par rapport à une mesure commune sigma-finie σ et si on note h et g leurs dérivées de Radon-Nikodym respectives par rapport à σ, alors
dVT(μ,ν)=|hg|dσ=||hg||L1(σ).
En d'autres termes, la distance en variation totale entre μ et ν correspond à la distance entre h et g pour la norme L1.
  • Lorsque Ω est dénombrable la formule suivante donne aussi une définition équivalente[2]
dVT(μ,ν)=ωΩ|μ(ω)ν(ω)|.

Couplage

Pour tout couple de variables aléatoires (X,Y) tel que X suit la loi μ et Y suit la loi ν, on a l'inégalité

dVT(μ,ν)2(XY).

De plus, il existe un couple (X,Y) tel que Xμ et Yν qui satisfait[3]

dVT(μ,ν)=2(XY).

Autrement dit, on a la caractérisation suivante de la distance en variation totale

dVT(μ,ν)=2minXμ,Yν(XY).

Si (μi)iI est une famille de mesures de probabilité toutes absolument continues par rapport à une mesure commune σ-finie, alors il existe des variables aléatoires (Xi)iI telles que pour tout iI, Xiμi et pour tout ij[4]

(XiXj)4dVT(μi,μj)1+2dVT(μi,μj).

Lien avec la norme en variation totale d'une mesure signée

Pour une mesure signée σ sur (Ω,) on définit sa norme en variation totale comme

||σ||VT:=σ+(Ω)+σ(Ω)

σ=σ+σ est la décomposition de Jordan de la mesure σ.

De manière générale si σ(Ω)=0 alors[5]

||σ||VT=2supA{|σ(A)|}.

En appliquant ce résultat à σ=νμ on obtient que

dVT(ν,μ)=||νμ||VT.

Lien avec d'autres distances

dVT(ν,μ)2DKL(ν||μ).
2H2(μ,ν)dVT(μ,ν)22H(μ,ν).

Convergence en variation totale

La convergence d'une suite de mesures pour la distance en variation totale implique la convergence faible (et les limites sont les mêmes le cas échéant). De manière équivalente, si une suite de variables aléatoires converge pour la distance en variation totale, alors elle converge en loi (et les limites sont les mêmes)[8].

Notes et références

Voir aussi

Modèle:Portail