Théorie des réseaux

De testwiki
Aller à la navigation Aller à la recherche
Graphe partiel de l'internet, basé sur les données de opte.org du 15 janvier 2005 (voir description de l'image pour plus de détails)

La théorie des réseaux est l'étude de graphes en tant que représentation d'une relation symétrique ou asymétrique entre des objets discrets. Elle s'inscrit dans la théorie des graphes : un réseau peut alors être défini comme étant un graphe où les nœuds (sommets) ou les arêtes (ou « arcs », lorsque le graphe est orienté) ont des attributs, comme une étiquette (tag).

La théorie des réseaux trouve des applications dans diverses disciplines incluant la physique statistique, la physique des particules, l'informatique, le génie électrique, la biologie, l'économie, la finance, la recherche opérationnelle, la climatologie ou les sciences sociales.

Il existe de nombreux types de réseaux : réseau logistique, World Wide Web, Internet, réseau de régulation génétique, réseau métabolique, réseau social, réseau sémantique, réseau de neuronesModèle:Etc.

Historicité

Le problème des sept ponts de Königsberg, résolu par Leonhard Euler en 1736, est connu pour être à l'origine de la topologie et de la théorie des graphes.

L'étude des réseaux a émergé dans diverses disciplines afin de permettre l'analyse des données relationnelles complexes. Le plus ancien document connu dans le domaine de l'étude des graphes est celui concernant le problème des sept ponts de Königsberg écrit par Leonhard Euler en 1736. La description mathématique par Euler des sommets et des arêtes fut le fondement de la théorie des graphes, une branche des mathématiques qui étudie les propriétés des relations dyadiques d'une structure en réseau. Le champ de la théorie des graphes a continué à se développer et a trouvé des applications en chimie (Sylvester, 1878).

Dénes Kőnig, un mathématicien et professeur hongrois a écrit en 1936 le premier livre sur la théorie des graphes, intitulé (en version anglophone) : Theory of finite and infinite graph[1].

Sociogramme de Moreno représentant des relations dans une classe de Modèle:1re année du primaire.

Dans les années 1930, Jacob Moreno, un psychologue de l'École de Gestalt immigre aux États-Unis. Il y développe le sociogramme qu'il présente au public en avril 1933 lors d'une convention de médecins. Le sociogramme était alors la représentation de la structure sociale d'un groupe d'écoliers d'une école primaire[2]. Les garçons étaient amis avec d'autres garçons, et les filles étaient amies avec d'autres filles, avec l'exception d'un garçon qui a répondu aimer une fille. Mais ce sentiment n'était pas réciproque, ce qui s'observe sur le sociogramme. La représentation d'un réseau de relations sociales fut jugée si intrigante qu'il fut imprimé dans le New York Times (Modèle:Date-, page 17). Depuis, la sociométrie a trouvé de nombreuses applications et s'est développée au sein du champ de l'analyse des réseaux sociaux.

Les théories probabilistes en analyse de réseaux sont les rejetons de la théorie des graphes, notamment grâce aux 8 articles de Paul Erdős et Alfréd Rényi sur les graphes aléatoires. Pour l'analyse des réseaux sociaux, le modèle probabiliste proposé est le graphe aléatoire exponentiel (ERGMs), où Modèle:Formule* est un cadre de notation utilisé pour représenter l'espace des probabilités d'occurrence d'un lien dans le réseau. Un autre exemple de l'utilisation d'outils probabilistes en structure de réseaux est la matrice de probabilité de réseau, qui modélise la probabilité que des liens apparaissent dans un réseau, en fonction de la présence ou de l'absence historique du lien dans un échantillon de réseaux.

Dans les années 1980 de nombreux sociologues travaillent sur l'analyse des réseaux. Émerge notamment en 1992 le livre Identity and control, de Harrison White, qui introduit de nombreux concepts phares (encastrement, découplage, commutation, netdom, pour n'en nommer que quelques-uns). Puis en 1994 parait le fameux Social Network Analysis : Methods and Applications, de Wasserman et Faust, un ouvrage de référence concernant les mesures et méthodes en analyse des réseaux sociaux.

Plus récemment, d'autres travaux en théorie des réseaux se concentrent sur la description mathématique des différentes topologies que présentent les réseaux. Duncan Watts a unifié d'anciennes données empiriques sur les réseaux sociaux en en faisant une représentation mathématique décrivant le petit monde.

Albert-László Barabási et Réka Albert ont développé le réseau invariant d'échelle, défini comme étant une topologie de réseau contenant des sommets concentrateurs avec de nombreuses connexions, ce qui permet de maintenir un rapport constant entre le nombre de connexions de tous les autres nœuds. Bien que de nombreux réseaux, tels qu'Internet, semblent conserver cet aspect, d'autres réseaux ont depuis longtemps des distributions de nœuds ne faisant qu'approximer les ratios sans échelle.

De nos jours, les études sur les réseaux intéressent de nombreux secteurs autant privés que publics, dont le département de la Défense américaine[3].

Types d'analyses de réseaux

Analyse des réseaux sociaux

Visualisation d'un réseau social[4]

Modèle:Article détailléModèle:Article connexe

L'analyse des réseaux sociaux examine la structure des relations entre entités sociales[5]Modèle:,[6]Modèle:,[7]Modèle:,[8]. Ces entités sont souvent des personnes, mais peuvent aussi être des groupes, des organisations, des États-nations, des sites web ou des publications scientifiques. L'étude des réseaux a joué un rôle central en sciences sociales et la plupart des outils mathématiques et statistiques utilisés pour étudier les réseaux ont d'abord été développés en sociologie, par des sociologues[9].

Parmi de nombreuses autres applications, l’analyse des réseaux sociaux a été utilisée pour comprendre la diffusion d’innovations[10], des nouvelles et des rumeurs. De même, elle a été utilisée pour examiner la propagation des maladies et les comportements liés à la santé. Elle a également été appliquée à l’étude des marchés afin d'examiner le rôle de la confiance dans les échanges et dans le processus de fixation des prix[11]Modèle:,[12].

De même, elle a été utilisée pour étudier le recrutement dans les mouvements sociaux et les institutions sociales. Elle a également été utilisée pour conceptualiser les désaccords scientifiques ainsi que le prestige social dans le milieu académique. Plus récemment, l’analyse de réseaux sociaux a été largement utilisée dans le renseignement militaire pour découvrir des réseaux d’insurgés, à la fois hiérarchiques et sans dirigeants.

Analyse dynamique des réseaux sociaux

L’analyse dynamique des réseaux examine l’évolution de la structure des relations entre différentes classes d’entités ayant des effets sur les systèmes sociotechniques complexes et reflète la stabilité sociale ainsi que des changements tels que l’émergence de nouveaux groupes, sujets et dirigeants[13]Modèle:,[14]Modèle:,[15]Modèle:,[16]. L'analyse dynamique des réseaux se concentre sur les méta-réseaux composés de plusieurs types de nœuds (entités) et de plusieurs types de liens (multiplexité). Ces entités peuvent être très variées[17]. Les exemples incluent des personnes, des organisations, des sujets, des ressources, des tâches, des événements, des emplacements et des croyances.

Les techniques d'analyse dynamique de réseaux sont particulièrement utiles pour évaluer les tendances et les changements dans les réseaux au fil du temps, identifier les leaders émergents et examiner la coévolution des personnes et des idées.

Analyse des réseaux biologiques

Modèle:Article connexe

Réseau métabolique montrant les liens entre les enzymes et les métabolites qui interagissent avec le cycle de Krebs d'Arabidopsis.

Avec le développement des bases de données biologiques accessibles au public, l'analyse des réseaux moléculaires[18] a suscité un intérêt considérable[19]. L'analyse des réseaux biologiques est étroitement liée à l'analyse des réseaux sociaux, et se concentre souvent sur les propriétés locales du réseau. Par exemple, les motifs de réseau sont de petits sous-graphes surreprésentés dans le réseau. De manière similaire, les motifs d'activité sont des motifs dans les attributs des nœuds et des arêtes du réseau qui sont surreprésentés compte tenu de la structure du réseau. L'analyse des réseaux biologiques, en ce qui concerne les maladies, a conduit au développement d'une approche réseau des maladies et traitements (network medecine)[20]. Les exemples récents de l'application de la théorie des réseaux en biologie incluent les applications pour comprendre le cycle cellulaire[21]. Les interactions entre les systèmes physiologiques tels que le cerveau, le cœur, les yeux, etc. peuvent être explorées en tant que réseau physiologique[22].

Analyse de réseaux infectieux

Modèle:Article détailléModèle:Section vide ou incomplète Les modèles compartimentaux en épidémiologie sont ces algorithmes connus pour prédire la propagation de pandémies mondiales au sein d'une population infectieuse, et particulièrement le SIR model.

Au-delà des pandémies, ce modèle peut permettre d'appréhender de nombreux phénomènes sociaux de diffusion/transmission (information, propagande, mode, etc).

Analyse des réseaux textuels

Réseau textuel autour des élections américaines de 2012[23]

Modèle:Article détaillé

Le traitement automatique de corpus a rendu possible l'extraction des acteurs et de leurs réseaux relationnels sur une vaste échelle. Les données relationnelles sont ensuite analysées à l'aide d'outils de la théorie des réseaux afin d'identifier les acteurs clés, les communautés ou les composantes clés, ainsi que des propriétés générales telles que la robustesse, la stabilité structurelle de l'ensemble du réseau, ou de la centralité de certains nœuds dans le réseau[24].

Ceci automatise l'approche introduite par l'analyse de données textuelles quantitative[25] dans lequel les triades (ou triplets) sujet-verbe-objet sont identifiés avec des paires (dyades) d'acteurs liés par une action ou des paires constituées d'acteur-objet[23]. Elle peut être sémantique.

Analyse des réseaux électriques

L’analyse des systèmes électriques peut être réalisée en utilisant la théorie des réseaux[26]Modèle:,[27], selon deux points de vue principaux :

  1. Une perspective abstraite (graphe), quels que soient les aspects liés à l’énergie électrique (par exemple, les impédances des lignes de transmission). La plupart de ces études se concentrent uniquement sur la structure abstraite du réseau électrique à l’aide de la distribution des degrés de sommets et la distribution d'intermédiarité, ce qui permet de mieux aborder l’évaluation de la vulnérabilité du réseau. Grâce à ces types d’études, le type de structure du réseau électrique pourrait être identifié dans la perspective des systèmes complexes. Cette classification peut aider les ingénieurs des réseaux électriques au stade de la planification ou lors de la mise à niveau de l’infrastructure énergétique (par exemple, l’ajout d’une nouvelle ligne de transmission) pour maintenir un niveau de redondance approprié dans le système de transmission[28].
  2. En prenant des graphes valués et combinant une compréhension abstraite des théories sur les réseaux complexes aux propriétés des réseaux électriques[29].

Analyse des liens

Modèle:Article connexe L'analyse des liens (Link analysis) est une branche de l'analyse de réseaux sociaux, qui explore les associations entre objets d'analyse. Par exemple, il est possible d'examiner les interactions d'un suspect et de ses victimes (numéros de téléphones qui ont été composés, adresses, opérations financières effectuées, dans un temps donné), ainsi que leurs relations familiales, lors d'enquêtes policières et en forensique.

L'analyse des liens procure des informations cruciales concernant les relations et associations entre plusieurs objets de différents types, qui ne sont pas apparentes en tant qu'élément isolé d'information.

Les analyses de liens entièrement ou partiellement automatisés sont de plus en plus utilisées par les banques et compagnies d'assurances, notamment pour détecter des fraudes ; par les opérateurs de télécommunication dans les analyses de réseaux de télécommunication ; dans le secteur médical en épidémiologie et pharmacologie ; dans le maintien de l'ordre, par les moteurs de recherche afin de noter la pertinence (et du coup, par les spammeurs pour le référencement abusif et par les entrepreneurs pour optimiser la visite de leur site web), et partout ailleurs où les relations entre divers objets ont été analysées.

Les liens sont également dérivés de la similarité du comportement temporel de deux nœuds. Les exemples incluent notamment les réseaux climatiques en climatologie où les liens entre deux sites (nœuds) sont déterminés, par exemple, par la similarité des précipitations ou des fluctuations de température sur les deux sites[30]Modèle:,[31]Modèle:,[32].

Analyse des liens web

Modèle:Article connexe Plusieurs algorithmes de classement utilisés par les moteurs de recherche Web utilisent des métriques de centralité basées sur les liens, notamment les algorithmes PageRank de Google, l'algorithme HITS, CheiRank et TrustRank. Des analyses de liens sont également menées en sciences de l'information et en sciences de la communication afin de comprendre et d'extraire des informations de réseaux de pages Web. Par exemple, l’analyse pourrait porter sur les liens entre les sites Web ou les blogs de personnalités politiques. Une autre utilisation est de classer les pages en fonction de leur mention dans les autres pages (cooccurrence)[33].

Analyse des réseaux de récurrence

Modèle:Article connexe En statistique descriptive et théorie du chaos, un graphe de récurrence (RP) est un graphe montrant, pour un instant donné, les moments auxquels une trajectoire d’espace de phase visite approximativement la même zone de l’espace de phase. La matrice d'un graphe de récurrence peut être considérée comme la matrice d'adjacence d'un réseau non orienté et non pondéré. Cela permet d'analyser les séries chronologiques à l'aide de mesures de réseau. Les applications vont de la détection des changements de régime à la caractérisation des dynamiques, en passant par l'analyse de synchronisation[34]Modèle:,[35]Modèle:,[36].

Analyse des réseaux interdépendants

Modèle:Article connexe Un réseau interdépendant est un système de réseaux couplé où les nœuds d'un ou de plusieurs réseaux dépendent des nœuds d'autres réseaux. Dans les réseaux réels, ces dépendances sont renforcées par le développement de la technologie moderne. Les dépendances peuvent entraîner des défaillances en cascade entre les réseaux : une défaillance relativement faible peut entraîner une défaillance catastrophique d'un système plus vaste. Les pannes de courant sont une démonstration du rôle important joué par les dépendances entre réseaux. Une étude récente a développé un cadre d'analyse pour étudier les défaillances en cascade dans un système de réseaux interdépendants[37]Modèle:,[38].

Modèles en théorie des réseaux

Modèle:Section vide ou incomplète Les modèles en théorie des réseaux servent de fondement à la compréhension des interactions au sein de réseaux complexes empiriques. Divers modèles de génération de graphes aléatoires produisent des structures en réseaux qui peuvent être utilisées afin de les comparer aux réseaux complexes du monde réel.

Modèle Erdős–Rényi

Ce modèle Erdős–Rényi est généré avec Modèle:Math nœuds. Pour chaque arête du graphe complet formé par tous les Modèle:Mvar, un nombre aléatoire est généré et comparé à une probabilité (Modèle:Formule) donnée. Si le nombre aléatoire est moindre que Modèle:Formule, une arête est formée sur le modèle.

Modèle:Article détailléLe modèle Erdős–Rényi, nommé ainsi en hommage à Paul Erdős et Alfréd Rényi, est utilisé pour générer un graphe aléatoire dans lequel les arêtes sont définies entre les nœuds avec des probabilités égales. Il peut être employé dans une approche probabiliste afin de démontrer l'existence de graphes satisfaisant à différentes propriétés, ou encore à procurer une définition rigoureuse de ce qu'implique une propriété pour presque tous les graphes.

Pour générer un modèle Erdős–Rényi G(n,p) deux paramètres doivent être spécifiés : le nombre total de sommets Modèle:Mvar et la probabilité Modèle:Mvar qu'une paire aléatoire de sommets soit reliée par une arête.

Le modèle étant généré sans biais pour des nœuds particuliers, la distribution des degrés est binomiale : pour un sommet vsélectionné de façon aléatoire,

P(deg(v)=k)=(n1k)pk(1p)n1k.

Dans ce modèle, le coefficient de regroupement est de Modèle:Math a.s. Le comportement de G(n,p)peut être divisé en trois régions :

  • Souscritique np<1: Toutes les composantes sont simples et vraiment petites, la composante la plus large a une taille |C1|=O(logn);
  • Critique np=1: |C1|=O(n23);
  • Supercritique np>1:|C1|yny=y(np) est la solution positive à l'équation epny=1y.

Une plus grande composante connexe a une grande complexité. Toutes les autres composantes sont simples et petites |C2|=O(logn).

Modèle de configuration

Le modèle de configuration (configuration model, en anglais) prend une "séquence de degrés"[39]Modèle:,[40] ou une distribution de degrés[41] (qui est ensuite utilisée pour générer une séquence de degrés) comme entrée, et produit des graphes connexes de manière aléatoire sous tous les aspects autres que la séquence en degrés.

Ce qui signifie que pour une séquence de degrés donnée, le graphe est sélectionné de manière aléatoire parmi l'ensemble possible des graphes conformes à cette séquence de degrés. Le degré k d'un sommet choisi aléatoirement est une variable indépendante et identiquement distribuée à valeur entière. Lorsque 𝔼[k2]2𝔼[k]>0, la configuration du graphe contient une composante connexe dite "géante", ayant une taille infinie[40]. Le reste de ses composantes ont une taille finie, pouvant être quantifiée en usant de la notion de taille de la distribution. La probabilité w(n) qu'un sommet échantillonné aléatoirement soit connecté à une composante de taille nest donnée par le "pouvoir de convolution" (c'est l'itération de la convolution avec elle-même) de la distribution de degrés[42] :w(n)={𝔼[k]n1u1*n(n2),n>1,u(0)n=1,

u(k) indique la distribution de degrés et u1(k)=(k+1)u(k+1)𝔼[k]. La composante géante peut être détruite en supprimant aléatoirement la fraction critique pcde toutes les arêtes. Ce processus est nommé percolation sur réseaux aléatoires.

Lorsque le second moment de la distribution de degrés est fini, 𝔼[k2]<, cette arête critique est donnée par[43] pc=1𝔼[k]𝔼[k2]𝔼[k], et la distance moyenne sommet à sommet l dans une composante connexe géante s'échelonne de façon logarithimique avec la taille totale du réseau, l=O(logN)[41].

Dans une configuration de modèle de graphe orienté, le degré d'un sommet est donné par deux nombres, in-degré kin et out-degré kout, et conséquemment, la distribution de degrés est bi-variée. Le nombre attendu des in-arêtes et des out-arêtes coïncide, donc 𝔼[kin]=𝔼[kout]. Le modèle de configuration comportant un graphe orienté contient une composante géante, si et seulement si[44]2𝔼[kin]𝔼[kinkout]𝔼[kin]𝔼[kout2]𝔼[kin]𝔼[kin2]+𝔼[kin2]𝔼[kout2]𝔼[kinkout]2>0.À noter que 𝔼[kin]et 𝔼[kout]sont égaux et ainsi donc interchangeables dans la dernière inégalité. La probabilité qu'un sommet choisi de façon aléatoire appartienne à une composante de taille nest donnée par[45]:hin(n)=𝔼[kin]n1u~in*n(n2),n>1,u~in=kin+1𝔼[kin]kout0u(kin+1,kout),pour une in-composante, et

hout(n)=𝔼[kout]n1u~out*n(n2),n>1,u~out=kout+1𝔼[kout]kin0u(kin,kout+1),

pour une out-composante.

Modèle du petit monde de Watts–Strogatz

Le modèle de Watts et Strogatz du réseau « petit monde » utilise le concept de reconnexion pour construire sa structure. Le générateur de modèle effectuera une itération sur chaque arête de la structure du réseau d'origine. Une arête peut changer de sommets connectés en fonction d'une probabilité de reconnexion donnée. k=4 dans cet exemple.

Modèle:Article détaillé

Le modèle du petit monde proposé par Watts et Strogatz est un modèle de génération de graphes aléatoires qui produit des graphes ayant les propriétés du petit monde.

Un réseau initial est utilisé pour générer un réseau « petit monde ». Chaque sommet d'un réseau est initialement lié à ces k voisins les plus proches. Un autre paramètre est spécifié comme probabilité de reconnexion; chaque arête a une probabilité p de se retrouver reconnectée au graphe en tant qu'arête aléatoire. Le nombre attendu de reconnexions de liens dans ce modèle est pE=pNk/2.

Lorsque le modèle de Watts et Strogatz commence par une structure de réseau non aléatoire, il présente un coefficient de regroupement très élevé ainsi qu'une longueur de chemin moyenne élevée. Chaque reconnexion est susceptible de créer un raccourci entre des composantes fortement connectées. À mesure que la probabilité de reconnexion augmente, le coefficient de regroupement décroît plus lentement que la longueur de chemin moyenne. Des valeurs plus élevées de Modèle:Formule forcent plus d'arêtes à se reconnecter, ce qui fait du modèle de Watts et Strogatz un réseau aléatoire.

Modèle d'attachement préférentiel de Barabási–Albert (BA)

Modèle:Article détaillé

Trois graphes générés en utilisant le modèle de Barabasi-Albert. Chacun a Modèle:Nobr et le paramètre d'attachement m indiqué. La couleur de chaque nœud est déterminée par son degré (l'échelle est la même pour les trois graphes).

Le modèle de Barabási–Albert est un modèle de réseau aléatoire et sans échelle utilisé pour démontrer l'attachement préférentiel, ou, en d'autres termes, l'effet que « le riche devient plus riche ». Dans ce modèle, une arête a plus de probabilité de se lier à des sommets qui ont un plus haut degré qu'eux, ou encore dit autrement « pourquoi mes amis sont souvent plus populaires que moi ». La modélisation commence par un réseau initial de m0 sommets. m0 ≥ 2 et où le degré de chaque sommet dans le réseau initial devrait être d'au moins 1, sinon il restera toujours déconnecté du reste du réseau (exclu).

Dans le modèle BA, les nouveaux sommets sont ajoutés au réseau un à un. Chaque nouveau sommet est connecté à msommets existants avec une probabilité qui est proportionnelle au nombre de liens que ce sommet a déjà au sein du réseau. Formellement, la probabilité pi que le nouveau sommet soit connecté au sommet i est[46]

pi=kijkj,

ki est le degré du sommet i. Les sommets fortement liés ("hubs") tendent à rapidement accumuler encore plus de liens, tandis que les sommets ayant peu de liens ont peu de probabilités d'être sélectionnés pour former un nouveau lien. Les nouveaux sommets ont une « préférence » pour se lier eux-mêmes à des sommets fortement liés aux autres.

La distribution des degrés du modèle BA suit une loi de puissance. En loglog, la fonction de loi de puissance est une ligne droite[47].

La distribution des degrés résultant du modèle BA est sans échelle, en particulier, il s’agit d’une loi de puissance de la forme :

P(k)k3

Les concentrateurs (hubs) présentent une centralité élevée qui permet à de plus courts chemins d’exister entre les sommets. En conséquence, le modèle BA a tendance à avoir des longueurs moyennes de chemin très courtes. Le coefficient de regroupement de ce modèle tend également à 0. Tandis que le diamètre Modèle:Formule de plusieurs modèles incluant celui d' Erdős et Rényi ainsi que plusieurs des réseaux « petit monde » est proportionnel au Modèle:Formule, le modèle BA présente Modèle:Formule (ultrasmall world)[48]. Il est à noter que la distance moyenne varie en fonction de Modèle:Formule en tant que diamètre.

Modèle d'attachement préférentiel permettant l'émergence de communautés

Si une communauté est définie au sens strict comme un ensemble d'acteurs et d'éléments sémantiques partagés qui sont interreliés, il suffit de moduler l'attachement préférentiel en fonction d'un degré d'homophilie prédéfini de façon à favoriser les liaisons des sommets fortement similaires sans être identiques, il est possible de voir l'émergence et l'évolution d'une communauté[49]Modèle:,[50]Modèle:,[51].

Modèle d'attachement préférentiel basé sur la médiation (MDA)

Dans le modèle d'attachement préférentiel basé sur la médiation (mediation-driven attachment (MDA) model ) un nouveau sommet arrive avec marêtes, choisit ensuite aléatoirement un sommet déjà connecté au réseau et se connecte, non pas à ce sommet, mais avec mde ses voisins, eux aussi choisis aléatoirement. La probabilité Π(i) que le sommet i d'un sommet existant soit choisi est :

Π(i)=kiNj=1ki1kjki.

Le facteur j=1ki1kjki est l'inverse de la moyenne harmonique (IHM) des degrés des kivoisins d'un sommet i. Des recherches suggèrent que, pour approximativement m>14 la valeur moyenne de l'inverse de la moyenne harmonique dans la grande limite Ndevient une constante qui signifie Π(i)ki, ce qui implique que plus le sommet a de liens (degré élevé), plus il a de chances d’obtenir encore plus de liens, car ils peuvent être rejoints de multiples façons par le biais de médiateurs qui incarnent essentiellement l’idée d'attachement du modèle Barabasi-Albert (BA). Par conséquent, on peut voir que le réseau MDA suit la règle de l’attachement préférentielle, mais de façon déguisée[52].

Toutefois, m=1 décrit que le gagnant prend tout car il s'avère que près de 99%du total des sommets n'ont qu'un degré tandis qu'un sommet est super riche en degré. Alors que la valeur maugmente, la disparité entre le super riche et les pauvres décroît et lorsque m>14, il se produit une transition de « le plus riche devient plus riche » à « le riche obtient des liens plus riches ».

Modèle d'adaptabilité (fitness model)

Modèle:Article connexe Le fitness model est un modèle de l'évolution d'un réseau, c'est-à-dire qu'il exprime la façon dont les liens entre les sommets évoluent dans le temps et dépendent de la forme des sommets. Les nœuds les mieux adaptés attirent plus de liens aux dépens des moins adaptés, ce qui a été introduit par Caldarelli et al[53].

Dans ce modèle, un lien est créé entre deux sommets i,j avec une probabilité donnée par une fonction relationnelle f(ηi,ηj)de l'adaptabilité des sommets impliqués. Le degré d'un sommet est donné par[54] :

k(ηi)=N0f(ηi,ηj)ρ(ηj)dηj

Si k(ηi)est une fonction inversible et croissante de ηi, alors la distribution probabiliste P(k)est donné par :

P(k)=ρ(η(k))η(k)

En conséquence, si le fitness η est distribué tel une loi de puissance, alors les degrés des sommets le seront aussi.

Moins intuitivement, avec une distribution de probabilité décroissante conjointe rapide avρ(η)=eηet une fonction de liaison f(ηi,ηj)=Θ(ηi+ηjZ)

avec Z une constante et Θ comme fonction Heavyside, nous obtenons également des réseaux sans échelle.

Un tel modèle a été appliqué avec succès afin de décrire les relations commerciales entre pays en utilisant le PIB comme moyen d’adaptation aux divers sommets i,j et une fonction de liaison de ce genre[55]Modèle:,[56].

δηiηj1+δηiηj.

Modèle SIR en épidémiologie

Modèle:Article détaillé En 1927, W. O. Kermack and A. G. McKendrick ont créé un modèle épidémiologique dans lequel ils considèrent une population donnée avec seulement trois compartiments (catégories) : sain S(t), infecté, I(t), et remis R(t). Les catégories utilisées dans ce modèle consistent en trois classes :

  • S(t) est utilisé pour représenter le nombre de cas qui ne sont pas encore infectés par une maladie infectieuse donnée au temps Modèle:Formule, ou encore ceux susceptibles de la contracter.
  • I(t) décrit le nombre de cas ayant été infectés par la maladie (au temps Modèle:Formule) et étant aptes à transmettre la maladie à ceux dans la catégorie susceptible de la contracter.
  • R(t)est la catégorie utilisée pour les cas de rémission (au temps Modèle:Formule). Ceux qui sont dans cette catégorie ne peuvent pas être infectés à nouveau, ni transmettre la maladie à d'autres.

Le flux de ce modèle peut être vu ainsi :

𝒮

Utilisant une population donnée N=S(t)+I(t)+R(t), Kermack et McKendrick en ont dérivé l'équation suivante :

dSdt=βSIdIdt=βSIγIdRdt=γI

Plusieurs hypothèses ont découlé de cette formulation : premièrement, un individu dans une population doit être considéré comme ayant une probabilité égale aux autres individus de contracter la maladie avec un taux de β, ce qui est considéré comme étant le taux d'infection de la maladie. Ainsi, un individu infecté interagit et est capable de transmettre la maladie avec βNautres par unité de temps et la fraction des contacts par un infecté envers un susceptible de l'être est S/N. Le nombre de nouvelles infections dans une unité de temps donnée est : βN(S/N), selon le taux de nouvelles infections (ou de ceux qui restent dans la catégorie des susceptibles d'être infectés) en tant que βN(S/N)I=βSI (Brauer & Castillo-Chavez, 2001). Pour ce qui est des seconde et troisième équations, on considère la population quittant la catégorie susceptible comme étant égal à la fraction (γqui représente le taux moyen de rémission, et 1/γla période moyenne de l'affection) le taux d’infectieux qui quittent cette classe par unité de temps, pour entrer dans la classe des guéris. Ces processus qui occurrent simultanément font référence à la loi d'action de masse, une idée largement acceptée selon laquelle le taux de contact entre deux groupes d'une population est proportionnel à la taille de chacun de ces groupes (Daley & Gani, 2005). Finalement, il est tenu pour acquis que le taux d'infection et de rémission est plus rapide que l'échelle de temps des naissances et morts, et qu'ainsi, ces facteurs sont ignorés par ce modèle.

Susceptible d'infecter

S=β(1N)

La formule ci-dessus décrit la « force » d'infection pour chaque unité susceptible dans une population infectieuse, où Modèle:Math est équivalent au taux de transmission de ladite maladie.

Pour monitorer le changement des personnes vulnérables au sein d'une population infectieuse :

ΔS=β×S1NΔt

Infecté à remis

ΔI=μIΔt

Au cours du temps, le nombre des infectés fluctue par : le taux spécifié de rémission, représenté par μ mais déduit à un sur la période infectieuse moyenne 1τ, le nombre d'individus infectieux : I, et le changement dans le temps : Δt.

Période infectieuse

À savoir si une pandémie vaincra une population, en ce qui concerne le SIR model, dépend de la valeur de R0 ou de la « moyenne des gens infectés par un individu infecté »

R0=βτ=βμ

Approche via l'équation maîtresse

Modèle:Article détaillé Une équation maîtresse peut décrire l'évolution d'un réseau non orienté où, à chaque période donnée, un nouveau sommet est ajouté au réseau, lié à un ancien sommet (choisi aléatoirement sans aucune préférence). Le réseau initial est formé par deux sommets et deux liens entre eux au temps t=2, cette configuration est nécessaire seulement pour simplifier de plus amples calculs, alors au temps t=n le réseau a n sommets et n liens.

L'équation maîtresse pour ce type de réseau est :

p(k,s,t+1)=1tp(k1,s,t)+(11t)p(k,s,t),

p(k,s,t) est la probabilité d'avoir le sommet s avec un degré k au temps t+1, et s est l’intervalle de temps pendant lequel ce sommet a été ajouté au réseau. Il est à noter qu'il n'existe que deux façons pour un ancien sommet s d'avoir k liens au temps t+1 :

  • Le sommet s a un degré k1 au temps t et sera lié au nouveau lien avec une probabilité 1/t
  • Il a déjà le degré k au temps t et ne sera pas lié avec un nouveau sommet

Après simplification, la distribution des degrés est : P(k)=2k.[57]

Sur la base de ce réseau en expansion, un modèle épidémique est développé selon une règle simple : chaque fois que le nouveau sommet est ajouté et après avoir choisi l’ancien sommet à lier, une décision est prise : déterminer si ce nouveau sommet sera infecté. L'équation maîtresse de ce modèle épidémiologique est la suivante :

pr(k,s,t)=rt1tpr(k1,s,t)+(11t)pr(k,s,t),

rt représente la décision d'infecter (rt=1) ou pas (rt=0). En résolvant cette équation maîtresse, la solution suivante est obtenue: P~r(k)=(r2)k.[58]

Mesures et propriétés

Modèle:Article détaillé Les réseaux ont généralement des attributs qui peuvent être mesurés afin d'analyser leurs propriétés et caractéristiques. Le comportement de ces propriétés de réseau définit souvent des modèles de réseau et peut être utilisé pour analyser le contraste de certains modèles. Le lexique de la théorie des graphes contient de nombreuses définitions d'autres termes utilisés en science des réseaux.

Taille

La taille d'un réseau peut faire référence au nombre Nde nœuds ou, moins souvent, à la somme des arêtes E qui (pour les graphes connectés sans multi-arêtes) peut aller de N1 (un arbre) à Emax (un graphe complet). Dans le cas d'un graphe simple où au plus une arête existe entre chaque paire de sommets, et où aucun sommet n'est connecté à lui-même, cela donne : Emax=(N2)=N(N1)/2; pour un graphe orienté (sans nœud connecté à lui-même) : Emax=N(N1); pour un graphe orienté permettant l'auto-connexion : Emax=N2. Dans le cas d'un graphe où plusieurs arêtes peuvent exister entre les dyades : Emax=.

Diamètre

Le diamètre du réseau est la distance la plus courte entre les deux nœuds les plus distants du réseau. En d'autres termes, une fois que la longueur de chemin la plus courte de chaque nœud à tous les autres nœuds est calculée, le diamètre est la plus grande de toutes les longueurs de chemin calculées. Le diamètre est représentatif de la taille linéaire d'un réseau.

Longueur de chemin

Modèle:Article détaillé La distance moyenne du chemin le plus court est calculée en recherchant le chemin le plus court entre toutes les paires de nœuds et en prenant la moyenne de tous les chemins de la longueur (la longueur correspond au nombre d'arêtes intermédiaires contenues dans le chemin : la distance du,v entre les deux arêtes u,v d'un graphe). Ce qui montre, en moyenne, le nombre d’étapes à franchir pour passer d’un membre du réseau à un autre. Le comportement de la longueur de chemin le plus court moyen attendu (c'est-à-dire la moyenne d'ensemble de la longueur de chemin le plus court moyen) en fonction du nombre de sommets N d'un modèle de réseau aléatoire détermine si ce modèle présente l’effet du petit monde ; si elle définit O(lnN), le modèle génère des réseaux de petit monde. Pour une croissance plus rapide que logarithmique, le modèle ne produit pas de petits mondes. Le cas particulier de O(lnlnN) est connu sous le nom d'effet d'ultra petit monde.

Densité

Modèle:Article détaillé La densité D d'un réseau, définie en tant que ratio du nombre d'arêtes E sur le nombre Nde liens possibles vers les nœuds dans le réseau, est fournie (dans le cas de graphes simples) par le binomial coefficient (N2), donnant D=E(N1)Emax(N1)=2(EN+1)N(N3)+2. Une autre équation possible est D=T2N+2N(N3)+2,lorsque les liens T sont unidirectionnels (Wasserman & Faust 1994)[59].

Densité de réseau planaire

La densité D d'un réseau, lorsqu'il n'y a pas d'intersection entre les arêtes, définie comme étant le ratio du nombre d'arêtes E sur le nombre Emax possible d'arêtes entre les nœuds dans un réseau, est fournie par un graphe planaire (Emax=3N6), donnant D=EN+12N5.

Degré moyen

Modèle:Article détaillé Le degré k d'un nœud correspond au nombre d'arêtes qui lui sont connectées. Le degré moyen est étroitement lié à la densité d’un réseau : k=2EN (ou, dans le cas d'un graphe orienté : k=EN; Le facteur de 2 résultant de chaque arête dans un graphe non orienté contribuant au degré de deux sommets distincts). Dans le ER random graph model (G(N,p)), il est possible de calculer la valeur attendue de k (égale à la valeur attendue de k d'un nœud arbitraire) : une arête aléatoire a N1 autres arêtes dans le réseau disponible, avec une probabilité p d'être connectée à chacun. Ainsi : 𝔼[k]=𝔼[k]=p(N1).

Coefficient de clustering

Modèle:Article détaillé Le coefficient de regroupement est une mesure de transitivité. Ceci est parfois décrit sous la règle : « les amis de mes amis sont mes amis ». Plus précisément, le coefficient de regroupement d'un nœud est le rapport des liens existants reliant les voisins d'un nœud au nombre maximal possible de tels liens. Le coefficient de regroupement pour l'ensemble du réseau est la moyenne des coefficients de regroupement de tous les nœuds. Un coefficient de clustering élevé pour un réseau est une autre indication d'un petit monde et de cohésion sociale.

Le coefficient de regroupement du i'ième sommet est :

Ci=2eiki(ki1),

quand ki est le nombre de voisins du i'ième sommet, et ei est le nombre de connexions entre ses voisins. Le nombre maximum possible de connexions entre voisins est alors :

(k2)=k(k1)2.

D'un point de vue probabiliste, le coefficient de clustering local attendu est la probabilité qu'un lien existe entre deux voisins arbitraires du même nœud.

Connectivité

La façon dont un réseau est connecté joue un rôle important dans la manière dont les réseaux sont analysés et interprétés. Les réseaux sont classés en quatre catégories différentes:

  • Clique
  • Composante massive
  • Composante faiblement connectée
  • Composante fortement connectée

Centralité

Modèle:Article connexe Des informations sur l’importance relative des nœuds et/ou des arêtes d'un graphe peuvent être obtenues au moyen de mesures de centralité, largement utilisées dans des disciplines telles que la sociologie.

Par exemple, la centralité de vecteurs propres utilise les vecteurs propres de la matrice d'adjacence correspondant à un réseau pour déterminer les nœuds qui ont tendance à être fréquemment visités. Les mesures de centralité formellement établies sont le degré de centralité, la centralité de proximité, la centralité d'intermédiarité, la centralité de vecteur propre, la centralité de sous-graphe et la centralité de Katz. La visée de l'analyse détermine généralement le type de mesure de centralité à utiliser. Par exemple, si l’on s’intéresse à la dynamique des réseaux ou à la robustesse d’un réseau, l’importance dynamique d’un nœud est souvent la mesure la plus pertinente en matière de centralité[60]. Il existe aussi une mesure de centralité basée sur la non-densité du graphe (k-core number)[61].

Les indices de centralité ne sont précis que pour identifier les nœuds les plus centraux. Les mesures sont rarement, voire jamais, utiles pour le reste des nœuds du réseau[62]Modèle:,[63]. En outre, leurs indications ne sont exactes que dans le contexte d'importance supposée et ont tendance à ne pas être fiables dans d'autres contextes[64]. Les limitations aux mesures de centralité ont conduit à l'élaboration de mesures plus générales. L'accessibilité, qui utilise la diversité des marches aléatoires pour mesurer le degré d'accessibilité du reste du réseau à partir d'un nœud de démarrage donné, en est un exemple[65] et la force attendue, dérivée de la valeur attendue de la force d'infection générée par un nœud[62].

Le concept de centralité dans le contexte de réseaux statiques a été étendu, fondé sur des recherches empiriques et théoriques, à la centralité dynamique[17] dans le contexte des réseaux temporels[13]Modèle:,[14]Modèle:,[15].

Assortativité

Modèle:Article connexe Ces concepts sont utilisés pour caractériser les préférences de liaison des concentrateurs (hubs) d'un réseau. Les hubs sont des nœuds comportant un grand nombre de liens : des célébrités, des portiers, des grandes institutions, etc. Certains concentrateurs ont tendance à se connecter à d'autres concentrateurs, tandis que d'autres évitent de se connecter à des concentrateurs et préfèrent se connecter à des nœuds peu connectés. Un hub est assortatif lorsqu'il a tendance à se connecter à d'autres hubs. Un hub désassortatif évite de se connecter à d'autres hubs. Si les concentrateurs ont des connexions avec les probabilités aléatoires attendues, ils sont dits neutres. La notion d'assortativité est utilisée en analyse des réseaux sociaux[66] et est similaire à celle d'homophilie. La désassortativité est rare dans le monde social et peut relever d'une stratégie d'optimisation du capital social par la production de trous structuraux.

Contagion/propagation/diffusion

Le contenu d'un réseau complexe peut se répandre via deux méthodes principales : la propagation conservée et la propagation non conservée[67]. En propagation conservée, la quantité totale de contenu entrant dans un réseau complexe reste constante lors de son passage. Le modèle de propagation conservée peut être mieux représenté par un pichet contenant une quantité fixe d’eau versée dans une série d’entonnoirs reliés par des tubes. Ici, le pichet représente la source d’origine et l’eau le contenu à répandre. Les entonnoirs et les tubes de connexion représentent respectivement les nœuds et les connexions entre les nœuds. Lorsque l'eau passe d'un entonnoir à un autre, elle disparaît instantanément de l'entonnoir précédemment exposé à l'eau. Lorsque la propagation est non conservée, la quantité de contenu change à mesure qu’il entre et passe à travers le réseau complexe. Le modèle de propagation non conservée peut être représenté au mieux par un robinet fonctionnant en continu traversant une série d’entonnoirs reliés par des tubes. Ici, la quantité d'eau de la source d'origine est infinie. En outre, tous les entonnoirs qui ont été exposés à l'eau continuent de faire l'expérience de l'eau même lorsqu'elle passe par des entonnoirs successifs. Le modèle non conservé est le plus approprié pour expliquer la transmission de la plupart des maladies infectieuses, l'excitation neuronale, la diffusion de l'information et des rumeurs, etc.

Robustesse d'un réseau

La robustesse structurelle des réseaux est étudiée via la théorie de la percolation[68]. Lorsqu'une fraction critique de nœuds (ou de liens) est supprimée d'un réseau, celui-ci se fragmente en composantes distinctes[69]. Ce processus de percolation représente une transition de phase de type ordre-désordre avec des exposants critiques. La théorie de la percolation permet de prévoir la taille de la composante la plus grande (appelée composante géante), du seuil critique et des exposants critiques.

Optimisation réseau

Network Optimization
Décomposition d'une tâche d'optimisation de réseau NP-difficile en sous-tâches, en supprimant les interactions les moins importantes du réseau[70].

Les problèmes réseaux qui impliquent de chercher une façon optimale de remplir une tâche donnée sont étudiés sous l'appellation d'optimisation combinatoire. Les cas à résoudre comprennent notamment ceux concernant les réseaux de flot, les problèmes de plus court chemin, ceux en théorie du transport, les problèmes de l'emplacement d'installations, les problèmes de couplage, les problèmes d'affectation, les problèmes de compactage, d'empilement, de routage, de chemin critique, et le PERT (Program Evaluation & Review Technique).

Afin de décomposer une tâche d'optimisation du réseau NP-difficile en sous-tâches, le réseau est décomposé en sous-réseaux relativement indépendants[70].

Implémentations

Voir aussi

Modèle:Div col

Modèle:Div col end

Liens externes

Bibliographie complémentaire

  • Degenne, Alain, and Michel Forsé. "Les réseaux sociaux." (2004).
  • Lazega, Emmanuel. Réseaux sociaux et structures relationnelles:«Que sais-je?» n° 3399. Presses universitaires de France, 2014.
  • Harrison C. White, Frédéric Godart, Victor Corona, Produire en contexte d'incertitude : La construction des identités et des liens sociaux dans les marchés. Sciences de la société, Nº. 73, 2008. Modèle:P.
  • Modèle:En Ahuja, Ravindra K. Network flows: theory, algorithms, and applications. Pearson Education, 2017.
  • Modèle:En Granovetter, Mark. "The strength of weak ties: A network theory revisited." Sociological theory (1983): 201-233.
  • Modèle:En Borgatti, Stephen P., and Daniel S. Halgin. "On network theory." Organization science 22, no. 5 (2011): 1168-1181.
  • Modèle:En Lin, Nan. "Building a network theory of social capital." In Social capital, Modèle:P.. Routledge, 2017.
  • Modèle:En Borgatti, Stephen P. "Centrality and network flow." Social networks 27, no. 1 (2005): 55-71.
  • Modèle:En Girvan, Michelle, and Mark EJ Newman. "Community structure in social and biological networks." Proceedings of the national academy of sciences 99, no. 12 (2002): 7821-7826.

Références

Modèle:Traduction/Référence Modèle:Références

Modèle:Portail

  1. Modèle:Ouvrage
  2. Modèle:Lien web
  3. Modèle:Ouvrage
  4. Modèle:Article
  5. Wasserman, Stanley and Katherine Faust. 1994. Social Network Analysis: Methods and Applications. Cambridge: Cambridge University Press. Rainie, Lee and Barry Wellman, Networked: The New Social Operating System. Cambridge, MA: MIT Press, 2012.
  6. Modèle:Article
  7. Paradowski, Michał B.; Jarynowski, Andrzej; Czopek, Karolina; Jelińska, Magdalena (2021). Peer interactions and second language learning: The contributions of Social Network Analysis in Study Abroad vs At-Home environments. Mitchell, Rosamond & Tyne, Henry (Eds.), Language, Mobility and Study Abroad in the Contemporary European Context (pp. 99–116). Routledge. https://doi.org/10.4324/9781003087953-8
  8. Modèle:Article
  9. Newman, M.E.J. Networks: An Introduction. Oxford University Press. 2010
  10. Modèle:Article
  11. Modèle:Article
  12. Modèle:Ouvrage
  13. 13,0 et 13,1 Modèle:Article
  14. 14,0 et 14,1 Gross, T. and Sayama, H. (Eds.). 2009. Adaptive Networks: Theory, Models and Applications. Springer.
  15. 15,0 et 15,1 Holme, P. and Saramäki, J. 2013. Temporal Networks. Springer.
  16. Xanthos, Aris, Pante, Isaac, Rochat, Yannick, Grandjean, Martin (2016). Visualising the Dynamics of Character Networks. In Digital Humanities 2016: Jagiellonian University & Pedagogical University, Kraków, Modèle:P..
  17. 17,0 et 17,1 Modèle:Article
  18. Modèle:Article
  19. Modèle:Article
  20. Modèle:Article
  21. Modèle:Article
  22. Modèle:Article
  23. 23,0 et 23,1 Automated analysis of the US presidential elections using Big Data and network analysis; S Sudhahar, GA Veltri, N Cristianini; Big Data & Society 2 (1), 1–28, 2015
  24. Network analysis of narrative content in large corpora; S Sudhahar, G De Fazio, R Franzosi, N Cristianini; Natural Language Engineering, 1–32, 2013
  25. Quantitative Narrative Analysis; Roberto Franzosi; Emory University © 2010
  26. Modèle:Article
  27. Modèle:Lien web
  28. Modèle:Article
  29. Modèle:Lien web
  30. Modèle:Article
  31. Modèle:Article
  32. Modèle:Article
  33. Modèle:Article
  34. Modèle:Article
  35. Modèle:Article
  36. Modèle:Article
  37. Modèle:Article
  38. Modèle:Article
  39. Modèle:Article
  40. 40,0 et 40,1 Modèle:Article
  41. 41,0 et 41,1 Modèle:Article
  42. Modèle:Article
  43. Modèle:Article
  44. Modèle:Article
  45. Modèle:Article
  46. Modèle:Article
  47. Modèle:Article
  48. Modèle:Article
  49. Modèle:Article
  50. Modèle:Article
  51. Modèle:Article
  52. Modèle:Article
  53. Caldarelli G., A. Capocci, P. De Los Rios, M.A. Muñoz, Physical Review Letters 89, 258702 (2002)
  54. Servedio V.D.P., G. Caldarelli, P. Buttà, Physical Review E 70, 056126 (2004)
  55. Garlaschelli D., M I Loffredo Physical Review Letters 93, 188701 (2004)
  56. Cimini G., T. Squartini, D. Garlaschelli and A. Gabrielli, Scientific Reports 5, 15758 (2015)
  57. Modèle:Ouvrage
  58. Modèle:Article
  59. http://psycnet.apa.org/journals/prs/9/4/172/
  60. Modèle:Article
  61. Modèle:Article
  62. 62,0 et 62,1 Modèle:Article
  63. Modèle:Article
  64. Modèle:Article
  65. Modèle:Article
  66. Modèle:Article
  67. Newman, M., Barabási, A.-L., Watts, D.J. [eds.] (2006) The Structure and Dynamics of Networks. Princeton, N.J.: Princeton University Press.
  68. Modèle:Ouvrage
  69. Modèle:Ouvrage
  70. 70,0 et 70,1 Modèle:Article