Indice de Dunn

De testwiki
Version datée du 29 novembre 2024 à 14:52 par 134.206.20.97 (discussion)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Modèle:Voir homonymes

L'indice de Dunn est une mesure de qualité d'une partition d'un ensemble de données en classification automatique[1].

C'est le rapport entre la distance minimum qui sépare deux éléments classés séparément et la distance maximum qui sépare deux éléments classés ensemble.

C'est un indice qui ne repose pas sur une distance particulière et qui peut donc être utilisée dans une grande variété de situations.

Une alternative à l'indice de Dunn est l'indice de Davies-Bouldin.

Expression

Position du problème

Si l'on note X la matrice des données, dont chaque ligne correspond à un individu (ou observation) et chaque colonne correspond à un prédicteur (ou variable). On note N le nombre d'individus et p le nombre de prédicteurs :

X=(x11...xp1x1N...xpN)

Notons d(xi,xi) la dissimilarité entre les individus xi=(x1i,...,xpi) et xi=(x1i,...,xpi) (respectivement, ligne i et ide X). Notons K2 le nombre de groupes que l'on souhaite former.

Un algorithme de partitionnement donnera une fonction d'attribution C:[[1,N]][[1,K]] dont on cherche à évaluer la pertinence par un score. L'ensemble des points appartenant à un groupe k est alors donné par Ik={i[[1,N]]/ C(i)=k}.

Expression de l'indice de Dunn

L'indice (ou score) de Dunn, SD, se base sur les points moyens de chaque groupe μk=1|Ik|iIkxi et le diamètre du groupe Δk=maxi,iIkd(xi,xi).

Il aura pour expression[2] :

SD=min1k<kKd(μk,μk)max1kKΔkElle peut varier un peu selon les implémentations (définition du diamètre d'un groupe, distance entre centres remplacée par une autre distance entre groupe).

Propriétés

Domaine de variation

L'indice de Dunn varie entre 0 (pire classification) et +(meilleure classification).

Complexité


Notes et références

  1. A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters, Dunn, Joseph C., Journal of Cybernetics, 1973.
  2. Modèle:Lien web

Voir aussi

Modèle:Portail