Distance statistique

De testwiki
Aller à la navigation Aller à la recherche
Représentation de la distance en variation totale (en gris) entre deux fonctions de densité

En mathématiques, et plus précisément en théorie des probabilités et en statistique, la notion de distance statistique sert à mesurer l'écart entre deux lois de probabilité. Les distances statistiques sont notamment utilisées en théorie de l'information, en statistique, en apprentissage automatique, et en cryptologie.

Lorsqu'aucune précision n'est donnée, la « distance statistique » entre deux lois fait généralement référence à la distance en variation totale.

Il existe cependant d'autres notions de distance statistique, plus spécialisées, qui ne sont pas nécessairement équivalentes à la distance en variation totale. Comme il ne s'agit bien souvent pas de distances, au sens des espaces métriques, le terme de divergence est parfois utilisé.

Familles de divergences

Soit P et Q des lois de probabilité, définies sur un espace Ω, avec P absolument continue par rapport à Q. Pour toute fonction convexe f telle que f(1) = 0, on définit la « f-divergence[1]Modèle:,[2]Modèle:,[3] » de P par rapport à Q par :Df(PQ)=Ωf(dPdQ)dQ.Les choix possibles de la fonction f permettent d'obtenir plusieurs constructions classiques[4]Modèle:,[5] :

Une autre construction est la « α-divergence[7]Modèle:,[Note 2] » qui est plus adaptée aux lois discrètes, et est définie pour tout α+{} par Dα(PQ)=limxα1x1log(i=1npixqix1)

Ici encore des choix particuliers de α permettent d'obtenir des mesures de distance classiques :

Il existe encore d'autres familles, notamment les β- et γ-divergences[10] et les divergences de Bregman, qui recoupent en partie les deux familles discutées ci-dessus.

Autres constructions

D'autres distances statistiques n'appartiennent pas aux familles discutées ci-dessus, notamment :

Notes et références

Notes

  1. La « divergence inverse » de Kullback-Leibler est obtenue en prenant f(t)=logt.
  2. Parfois appelée « divergence de Rényi » du fait de sa proximité avec l'entropie de Rényi.

Références

Modèle:Références

Modèle:Palette Modèle:Portail