Graphe aléatoire

Un graphe aléatoire est un graphe généré par un processus aléatoire.
Les modèles de base d'Erdős et Rényi
Le premier modèle de graphes aléatoires a été popularisé par Paul Erdős et Alfréd Rényi dans une série d'articles publiés entre 1959 et 1968[1]Modèle:Référence insuffisante.
Il y a deux modèles d'Erdős et Rényi, étroitement liés : le graphe aléatoire binomial et le graphe aléatoire uniforme. Dans les deux modèles, il s'agit d'un graphe aléatoire non orienté, qui n'a ni boucles, ni arêtes multiples. On utilise les notations suivantes :
- l'ensemble des sommets est Modèle:Math noté par la suite ;
- les arêtes potentiellement présentes sont les Modèle:Math parties à deux éléments de ; l'ensemble de ces arêtes est parfois noté Il sera noté toutefois Modèle:Mvar pour des raisons de commodité typographique, et de cohérence avec l'article sur l'inégalité de Harris.
Le graphe aléatoire binomial
Dans ce modèle, souvent noté chacune des Modèle:Math arêtes potentielles est présente avec probabilité Modèle:Mvar, et absente avec probabilité Modèle:Math, cela indépendamment du statut des autres arêtes. Le cas Modèle:Math a été étudié par Erdős dès 1947[2]. Le nombre Modèle:Mvar d'arêtes de suit la loi binomiale de paramètres Modèle:Math et Modèle:Mvar.
Le graphe aléatoire uniforme
Dans ce modèle, souvent noté on choisit uniformément un sous-ensemble de M arêtes parmi les Modèle:Math arêtes possibles. Si on considère un graphe G à n sommets et M arêtes, la probabilité d'obtenir G par ce modèle est donnée par :
C'est le modèle qui est principalement étudié dans la série d'articles fondateurs publiés par Erdős et Rényi entre 1959 et 1968[3].
Les deux processus aléatoires à valeurs graphe
On peut partir d'un graphe sans arêtes, donc totalement déconnecté, et ajouter une arête tirée au hasard uniformément dans Modèle:Mvar, puis une autreModèle:Etc., sans remise.
On obtient ainsi une suite finie de Modèle:Math graphes aléatoires uniformes (comme défini à la section précédente). Cette suite est croissante au sens de l'inclusion de l'ensemble des arêtes et forme un processus à temps discret à valeurs dans l'ensemble des graphes.
Un avantage de cette construction est de voir coexister différents graphes aléatoires de paramètres Modèle:Mvar différents, sur le même espace probabilisé, et de pouvoir ainsi comparer leurs caractéristiques, non pas en moyenne ou en loi, mais pour chaque élément ω de l'espace probabilisé considéré. Cela permet de raisonner par couplage.
On peut aussi associer à chaque arête Modèle:Mvar de Modèle:Mvar une variable aléatoire Modèle:Math, le poids de l'arête, de sorte que la famille Modèle:Math soit une famille de variables aléatoires i.i.d., par exemple de loi uniforme sur l'intervalle [0, 1]. On note alors le graphe formé des arêtes dont le poids est inférieur à p. Pour chaque arête, cela se produit avec probabilité
On obtient ainsi une famille
de graphes aléatoires binomiaux (comme défini précédemment). Cette famille est croissante au sens de l'inclusion de l'ensemble des arêtes ; en effet une arête Modèle:Mvar présente dans
est aussi présente dans
dès que
puisque
. De plus, cette famille forme un processus à temps continue à valeurs dans l'ensemble des graphes.
Métaphore : on peut voir les sommets du graphe comme n îles sur un lac, communicant à l'aide de passerelles (les arêtes e), submergées à des profondeurs respectives Modèle:Mvar sous la surface de l'eau. Si le lac se vide de son eau graduellement, on va voir émerger progressivement les passerelles, et des composantes connexes regroupant de plus en plus d'îles vont se former.
Liens entre les deux modèles
En vertu du théorème central limite, ou de l'inégalité de Hoeffding, la loi binomiale est très concentrée autour de son espérance. Plus précisément, le nombre d'arêtes Modèle:Mvar d'un graphe aléatoire de loi est donc très proche de surtout si cette dernière quantité est grande devant n : en effet[4],
De plus, la loi conditionnelle de sachant que Modèle:Mvar est précisément Pour cette raison, si Modèle:Mvar est proche de , ou, de manière équivalente, si
il est généralement admis (et souvent démontré[5]) que les deux modèles et ont des propriétés très proches.
En poussant plus loin, notons Modèle:Math la k-ième valeur de la suite une fois que cette dernière suite est rangée dans l'ordre croissant : la suite est appelée la suite des statistiques d'ordre de la suite Lorsque p prend la valeur aléatoire Modèle:Math, alors est exactement Pour corroborer les observations précédentes, notons que Modèle:Math est très proche de au sens où, en conséquence de résultats célèbres de Donsker et de Kolmogorov[6], la probabilité
satisfait
les Modèle:1er et Modèle:4e membres étant les queues de distribution des lois de Rayleigh et de Kolmogorov, respectivement : en résumé, le supremum (lorsque M varie) des erreurs est de l'ordre de 1/n.
Ordre et croissance
Un graphe peut être vu comme une partie de l'ensemble J des arêtes, donc l'espace probabilisé est ici l'ensemble Ω des parties de J, qu'on peut parfois identifier à Modèle:Math. Cette identification est en particulier utile lorsqu'on veut appliquer l'inégalité de Harris.
- L'inclusion est une relation d'ordre partielle sur Ω.
- Comme d'ordinaire, une application X définie sur Ω, à valeurs réelles, est dite croissante si
- Une partie A de Ω est dite croissante si
- De manière équivalente, une partie A de Ω est dite croissante si sa fonction indicatrice est croissante.
- La propriété de décroissance d'une application ou d'une partie a une définition analogue.
Modèle:Exemple On a l'inégalité suivante : Modèle:Théorème Modèle:Exemple
La connexité
Le seuil de connexité
Modèle:Théorème On dit que Modèle:Math est un seuil étroit pour la propriété de connexité, l'étroitesse faisant référence au fait que la propriété est vérifiée même si tend vers l'infini strictement moins vite que
Énumération des points isolés
Il est plus facile (plus probable) de réussir à couper les n – 1 connexions entre un point et son complémentaire, que les k(n – k) connexions entre un groupe de k points et son complémentaire, car la fonction Modèle:Math augmente très rapidement au voisinage de 1, d'où, lorsque k augmente, beaucoup plus d'arêtes à couper, et une probabilité bien plus faible de réussir à les couper toutes. En corollaire, avec le choix du paramètre p fait plus haut, le graphe G(n, p) sera non connexe « presque uniquement » s'il a des points isolés, au sens où la probabilité d'être connexe est très proche de la probabilité de ne pas avoir de points isolés, qui vaut approximativement Modèle:Math En effet, on a le résultat suivant : Modèle:Théorème Modèle:Démonstration Ce théorème est une illustration frappante du paradigme de Poisson, selon lequel, lorsque se présente un grand nombre d'opportunités d'observer un événement rare (Modèle:C.-à-d. peu probable), alors le nombre total d'événements rares effectivement observés suit une loi de Poisson.
Le théorème double-exponentiel
Erdős et Rényi en déduisent un résultat plus précis que la propriété de seuil étroit : Modèle:Théorème Modèle:Démonstration Notons Modèle:Mvar le premier instant t où le graphe est connexe :
de sorte que
On peut alors voir le théorème double-exponentiel comme un résultat sur le développement asymptotique de Modèle:Mvar : si Modèle:Mvar est défini par la relation suivante :
alors le théorème double-exponentiel stipule que Modèle:Mvar converge en loi vers la distribution de Gumbel, ce qui pourrait se traduire, dans une version probabiliste de la notation de Landau, par :
Le graphe aléatoire infini
Modèle:Article détaillé Erdős et Rényi ont généralisé le modèle binomial au cas d'un graphe infini dénombrableModèle:Refsou, montrant qu'on obtenait alors (presque sûrement) un graphe possédant des propriétés d'universalité (contenant en particulier tout graphe fini ou dénombrable comme sous-graphe) ; ce graphe a été redécouvert à plusieurs reprises et est le plus souvent connu sous le nom de graphe de Rado.
Voir aussi
Notes
Bibliographie
Article connexe
Introduction de probabilités en théorie des graphes
Lien externe
- Laurent Massoulié, Réseaux: contrôle distribué et phénomènes émergents, 2015
- ↑ Le premier article, publié en 1959, est "On Random Graphs I", Publ. Math. Debrecen 6, 290.
- ↑ Modèle:Article. On considère souvent cet article comme marquant la naissance de la « méthode probabiliste » pour l'étude des graphes non aléatoires, en particulier pour la théorie de Ramsey.
- ↑ Pour un historique, voir Modèle:Chapitre.
- ↑ Pour plus de détails, voir Modèle:Harvsp.
- ↑ Voir Modèle:Harvsp.
- ↑ Voir Modèle:Ouvrage, section 3.8, « Limiting distributions under the null hypothesis », p. 142, et chap. 18, « The Standardized Quantile Process », p. 637.