Coefficient de clustering

De testwiki
Aller à la navigation Aller à la recherche
Un graphe de fort coefficient de clustering.

En théorie des graphes et en analyse des réseaux sociaux, le coefficient de clustering d'un graphe (aussi appelé coefficient d'agglomération, de connexion, de regroupement, d'agrégation ou de transitivité), est une mesure du regroupement des nœuds dans un réseau. Plus précisément, ce coefficient est la probabilité que deux nœuds soient connectés sachant qu'ils ont un voisin en commun.

C'est l'un des paramètres étudiés dans les réseaux sociaux : les amis de mes amis sont-ils mes amis ?

Définitions

Il existe deux définitions différentes du coefficient de clustering : une version globale et une version locale[1].

Coefficient global

Graphe de coefficient de clustering C=34: c'est la proportion de paires de voisins connectés dans le graphe.

Le coefficient de clustering global est défini comme :

C=3×|triangles||paires de voisins distincts|

où un triangle est une clique de trois nœuds.

Le nombre de paires de voisins distincts d'un nœud de degré d étant égal à (d2), on obtient :

C=3×|triangles|iV(di2),

di est le degré du nœud i et V l'ensemble des nœuds du graphe.

On a C1, avec égalité si et seulement si le graphe est un ensemble de cliques de taille au moins 3 (un graphe complet si le graphe est connecté).

Coefficient local

Noeud de coefficient de clustering 23 (en rouge). C'est la proportion de ses paires de voisins connectés.

Le coefficient de clustering local d'un nœud i est défini comme :

Ci=|triangles de sommet i||paires de voisins distincts de i|,

soit

Ci=|triangles de sommet i|(di2).

C'est la fraction de ses paires de voisins connectés, égale à 0 si di1 par convention.

On a Ci1, avec égalité si et seulement si le nœud i et son voisinage forment une clique d'au moins 3 nœuds.

En prenant la moyenne des coefficients locaux, on obtient le coefficient local moyen :

C¯=iVCi|V|.

On a également C¯1, avec égalité si et seulement si le graphe est un ensemble de cliques de taille au moins 3.

Propriétés et variantes

Relation entre les deux versions et interprétation

Le coefficient global C s'exprime à partir des coefficients locaux comme  :

C=iV(di2)CiiV(di2).

C'est donc une moyenne pondérée des coefficients locaux, qui diffère du coefficient local moyen C¯, sauf cas particuliers (graphe régulier par exemple). Les nœuds de fort degré ont donc plus de poids que ceux de faible degré[1]. Les poids reviennent à sélectionner un nœud en proportion du nombre de ses paires de voisins distincts, de sorte que le coefficient de clustering global C s'interprète comme la probabilité que deux nœuds distincts soient connectés sachant qu'ils ont un voisin en commun.

Expression à partir de la matrice d'adjacence

En notant A la matrice d'adjacence du graphe, matrice binaire dont l'entrée i,j est égale à 1 si et seulement si les nœuds i,j sont voisins, le coefficient de clustering s'écrit :

C=ijkAijAikAjkijkAijAik.

En effet, le numérateur est égal à 6 fois le nombre de triangles et le dénominateur est égal à iVdi(di1).

En l'absence de boucles (diagonale de A nulle), le numérateur est la somme des éléments diagonaux de la matrice A3 et le dénominateur la somme des éléments non-diagonaux de la matrice A2.

Variantes

Il existe des versions du coefficient adaptées à certains types de graphes, comme les graphes pondérés[2] ou les graphes bipartis[3].

Modèle

Le modèle de Watts-Strogatz permet de générer des graphes aléatoires ayant à la fois un fort coefficient de clustering et la propriété dite de petit monde[4]Modèle:,[5]. Ces deux propriétés sont caractéristiques des grands graphes réels, comme ceux formés par les réseaux sociaux[6].

Historique

Le coefficient global est souvent attribué[7] à Barrat et Weigt pour l'article On the properties of small-world network models publié en 2000[4]. Le coefficient moyen local est attribué à Watts et Strogatz, pour l'article Collective dynamics of ‘small-world’ networks de 1998[5].

Voir aussi

Notes et références

Bibliographie

Liens externes

Modèle:Portail