Indice de Rand

De testwiki
Version datée du 17 mai 2023 à 04:04 par imported>WikiCleanerBot (v2.05b - Correction syntaxique (Ponctuation avant une référence - Orthographe et typographie - Paramètre inutilisé))
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

L'indice de Rand est une mesure de similarité entre deux partitions d'un ensemble[1]. Il est principalement utilisé en catégorisation automatique. Son principe est de mesurer la consistance (le taux d'accord) entre deux partitions.

L'Indice de Rand

Soit π={Ui}I une partition de l'ensemble E. Deux éléments e1 et e2 de E sont dits "groupés" dans π s'ils appartiennent à un même sous-ensemble de π, c'est-à-dire iI:(e1,e2)Ui×Ui. De manière analogue, on dit qu'ils sont séparés dans π s'ils appartiennent à deux sous-ensembles distincts de π.

Soient deux partitions π1 et π2 de E et soient les comptages suivants:

  • a, le nombre de paires d'éléments de E groupés dans π1 et également groupés dans π2.
  • b, le nombre de paires d'éléments de E groupés dans π1 mais séparés dans π2.
  • c, le nombre de paires d'éléments de E groupés dans π2 mais séparés dans π1.
  • d, le nombre de paires d'éléments de E qui sont séparés dans π1 et dans π2.

La somme a+d représente la consistance entre les deux partitions ; la somme b+c représente l’inconsistance / le désaccord entre les deux partitions.

groupés dans π2 séparés π2
groupés dans π1 a b
séparés dans π1 c d

L'Indice de Rand est défini par RI(π1,π2)=a+da+b+c+d,

c'est-à-dire la proportion des paires d'éléments qui sont conjointement groupées ou conjointement séparées.

La Rand distance est défini par 1RI(π1,π2) et donne le taux de doubles paires d'éléments en désaccord. Symmetric Difference Distance (SDD) est la forme non normalisée de Rand distance défini d(π1,π2)=1(b+c)d(,) est le RI. D’après Filkov et Skiena (2004)[2], il a été montré par Bender et al. (1999)[3] que la complexité de RI(π1,π2) peut être de O(n) en considérant de la stochasticité et donc une probabilité d’erreur. Adjusted Rand Index (ARI) est la normalisation de RI qui permet de comparer deux partitions de nombres de classes différentes.

Applications

Transport

L'indice de Rand est utilisé dans le domaine du transport pour grouper les jours présentant des états de trafic similaires[4].

Références

Modèle:Références

Articles connexes

Modèle:Portail