Divergence de Bregman

De testwiki
Aller à la navigation Aller à la recherche
Illustration de la définition de la divergence de Bregman dans un espace unidimensionnel

En mathématiques, la divergence de Bregman est une mesure de la différence entre deux distributions dérivée d'une fonction potentiel U à valeurs réelles strictement convexe et continûment différentiable.

Le concept a été introduit par Modèle:Lien en 1967[1]. Par l'intermédiaire de la transformation de Legendre, au potentiel U correspond un potentiel dual U* et leur différentiation donne naissance à deux systèmes de coordonnées duaux.

Définition

Soit U(x) une fonction à valeurs réelles, strictement convexe et continûment différentiable définie sur un domaine convexe fermé Ω. La divergence de Bregman d'un point x1 de Ω par rapport à un autre point x0 de Ω est :

DU(x1:x0)=U(x1)U(x0)U(x0),(x1x0)

Propriétés

La divergence de Bregman possède certaines des propriétés d'une distance :

  • Positivité : x,yΩ,DU(x:y)0.
  • Séparation : x,yΩ,DU(x:y)=0x=y.

Par contre, la symétrie et l'inégalité triangulaire ne sont pas vérifiées, ce qui fait qu'elle n'est pas une distance.

Autres propriétés :

  • Convexité : la divergence est convexe par rapport à son premier argument.
  • Linéarité : pour deux fonctions convexes U et V à valeur réelle et un réel λ>0,DU+λV(x:y)=DU(x:y)+λDV(x:y).
  • Dualité : la divergence de Bregman est de nature duale[2] : par transformation de Legendre de U, on obtient une fonction U* dont la divergence associée DU* est symétrique par rapport à DU :
DU(x:y)=DU*(y*:x*).

Les points x et y étant exprimés selon deux systèmes de coordonnées duaux issus de la transformation de Legendre : x*=U(x) et x=U*(x*). La divergence peut être réécrite sous la forme :

DU(x:y)=U(x)+U*(y*)xy*.

Exemples

DU(p:q)=12ijaij(piqi)(pjqj),

avec

U(p)=12ijaijpipj.
  • les α-divergences popularisées par Amari[3] sont un autre exemple.

La divergence entre une distribution p par rapport à une distribution q est définie par :

D(α)(p:q)=41α2i1α2pi+1+α2qipi1α2qi1+α2.

La divergence duale de D(α) est D(α).

Par ailleurs, les α-divergences dérivent des fonctions potentiels :

U(α)(p)=21+αipi

et des coordonnées associées :

ri(α)(p)=21αpi1α2.

On a alors la relation de dualité des transformées de Legendre :

ri(α)=r(α)U(α).

Par ailleurs, avec les notations introduite, la divergence peut être écrite selon sa forme canonique :

D(α)(p:q)=U(α)(p)+U(α)(q)iri(α)(p)ri(α)(q).

Un cas particulier de α-divergence est la divergence de Kullback-Leibler

  • La distance de Itakura-Sato :
DU(p:q)=ipiqilogpiqi1,

avec

U(p)=ilogpi.

Références

Modèle:Traduction/Référence Modèle:Références

Modèle:Portail

  1. L. Bregman, The relaxation method of finding the common point of convex sets and its application to the solution of problems in convex programming, USSR Computational Mathematics and Mathematical Physics, Vol. 7(3): 200--217, 1967.
  2. S. Amari, Information geometry in optimization, machine learning and statistical inference, Front. Electr. Electron. Eng. China, vol. 5(3), pp. 241-260, 2010, DOI 10.1007/s11460-010-0101-3
  3. S. Amari, H. Nagaoka, Methods of information geometry, Translations of mathematical monographs; v. 191, American Mathematical Society, 2000 Modèle:ISBN