Divergence (statistiques)
Modèle:Homonymes Modèle:Sources à lier
En statistiques, une divergence est une fonction ou une fonctionnelle qui mesure la dissimilarité d'une loi de probabilité par rapport à une autre. Selon le contexte, elles peuvent être définies pour des lois, des mesures positives (non-normalisées), des vecteurs (par exemple sur l'espace des paramètres si l'on considère un modèle paramétrique), ou encore des matrices.
Les divergences sont analogues à des distances au carré et permettent de généraliser la notion de distance aux variétés statistiques, mais il s'agit d'une notion plus faible dans la mesure où elles ne sont en général pas symétriques et ne vérifient pas l'inégalité triangulaire.
Exemple
Modèle:Section vide ou incomplète La divergence χ2 de Pearson[1] est définie par .
Définition générale
Soit une variété topologique et une carte locale. Une divergence est une fonction (également définie sur au moyen de l'homéomorphisme associé), différentiable jusqu'à l'ordre 3 et satisfaisant les propriétés suivantes[2] :
- ;
- ;
- Le développement limité de en s'écrit :
- où est définie positive.
Remarques
Les notations ou peuvent également être employées.
Pour une divergence donnée, il est parfois intéressant d'introduire la divergence symétrique associée : .
Exemples
Il existe une grande variété de divergences, dont entre autres :
- La divergence euclidéenne, définie comme la moitié de la racine de la distance euclidéenne ;
- La divergence de Kullback-Leibler, qui est la seule à appartenir à la fois aux classes des f-divergences et des divergences de Bregman ;
- Parmi les autres f-divergences :
- Les -divergences,
- La distance de Hellinger ;
- Autres divergences de Bregman :
- Les -divergences,
- Les -divergences,
- La divergence d'Itakura-Saito.
Pour une bibliographie détaillée, voir Modèle:Harvsp.