Processus de Galton-Watson

De testwiki
Aller à la navigation Aller à la recherche

Le processus de Galton-Watson (ou processus de Bienaymé-Galton-Watson) est un processus stochastique permettant de décrire des dynamiques de populations. C'est un cas particulier de processus de branchements.

Historique

graphique représentant le processus de Galton-Watson

À l'origine, ce modèle a été introduit par Bienaymé en 1845 et indépendamment par Galton en 1873 en vue d'étudier la disparition des patronymes[1].

Supposons que chaque adulte mâle transmette son patronyme à chacun de ses enfants. Supposons également que le nombre d'enfants de chaque homme soit une variable aléatoire entière (et que la distribution de probabilité soit la même pour tous les hommes dans une lignée). Alors, un patronyme dont les porteurs ont un nombre d'enfant strictement inférieur à 1 en moyenne est amené à disparaître. Inversement, si le nombre moyen d'enfants est supérieur à 1, alors la probabilité de survie de ce nom est non nulle et en cas de survie, le nombre de porteurs du patronyme connaît une croissance exponentielle.

Formulation générale

On suppose l'existence d'une population d'individus qui se reproduisent de manière indépendante. Chaque individu i donne naissance à Xi individus et meurt. On suppose que les Xi sont des variables aléatoires indépendantes à valeurs entières suivant la distribution p=(pk)k. Par exemple,

  • si, avec probabilité p0=(Xi=0), Xi=0, alors l'individu i meurt sans se reproduire ;
  • si, avec probabilité p1=(Xi=1), Xi=1, alors il y a un remplacement un-pour-un de l'individu i ;
  • etc.

Modèle:Théorème

Paramètre critique et classification des processus de Galton-Watson

Notons Zn la taille de la population à la n-ème génération. On suppose souvent que la population possède un seul ancêtre, ce qui se traduit par

Z0=1.

Le nombre

m = kkpk = φ(1)

désigne le nombre moyen d'enfants d'un individu typique de la population considérée. L'évolution de la taille moyenne de la population est gouvernée par la formule de récurrence suivante, conséquence de la formule de Wald :

𝔼[Zn+1] = m 𝔼[Zn],

d'où il résulte que

𝔼[Zn] = mn.

Modèle:Théorème

Modèle:Théorème

Notation de Neveu

Modèle:Article détaillé La notation de Neveu[2] permet de décrire rigoureusement l'évolution de la population à l'aide d'un arbre planaire enraciné, qui est en fait l'arbre généalogique de cette population. Cet arbre planaire enraciné peut être décrit de manière non ambigüe par la liste de ses sommets, chacun désigné par une suite finie d'entiers, qui sont les positions, au sein de leur fratrie, des ancêtres (ou ascendants) de ce sommet : le sommet 2|4|3 désigne le Modèle:3e du Modèle:4e du Modèle:2e de l'ancêtre (l'ancêtre étant lui-même désigné par la suite vide, notée ). Par convention, l'ancêtre est le sommet initial de l'arête racine, et le sommet final de l'arête racine est le fils ainé de l'ancêtre : en tant que tel, il est donc noté 1. La longueur de la suite associée à un sommet est la hauteur (ou la profondeur) du sommet, i.e. la distance entre ce sommet et le début de la racine, qui représente l'ancêtre : en filant la métaphore, un sommet de hauteur n représente un individu appartenant à la n-ème génération de la population fondée par l'ancêtre. Les 5 arbres à 3 arêtes :



sont ainsi décrits par les 5 ensembles de mots

{,1,2,3}, {,1,11,2}, {,1,2,21}, {,1,11,12}, {,1,11,111}.

Avec cette notation, un arbre planaire encode commodément une réalisation de processus de Galton-Watson avec extinction : cet arbre est alors appelé arbre de Galton-Watson. Rien ne s'oppose à définir un arbre planaire infini à l'aide de la notation de Neveu, ce qui permet d'encoder les réalisations de processus de Galton-Watson où la population ne s'éteint pas.

Notation de Neveu pour les sommets d'un arbre planaire.

Modèle:Exemple


Ainsi, un processus de Galton-Watson peut-être vu comme une fonctionnelle déterministe d'une famille (Xi)i de variables aléatoires indépendantes et de même loi p=(pk)k, la variable Xi désignant la progéniture de l'individu i (le nombre d'enfants auxquels il donne naissance en mourant). Ici désigne l'ensemble (dénombrable) des suites d'entiers de longueurs finies (éventuellement de longueur nulle dans le cas de ) :

={}23


Modèle:Exemple

Étude fine de la taille des générations

Notons φn la fonction génératrice de la variable aléatoire Zn, définie par

φn(s) = k0(Zn=k)sk = 𝔼[sZn].

Posons

pk = [s]φk(s) = (X1++Xk=),

où les Xi sont des variables aléatoires indépendantes, toutes de loi p ; pk=(pk)0 est la k ème puissance de convolution de la loi p.

En vertu de la propriété de composition des fonctions génératrices, on a la relation suivante : Modèle:Théorème Modèle:Démonstration Modèle:Exemple

Cas sur-critique

Dans le cas sur-critique, la taille de la population croît à vitesse exponentielle sur un ensemble assez large. Modèle:Théorème Des résultats plus précis peuvent être obtenus grâce au théorème de Kesten-Stigum[3]Modèle:,[4]. Modèle:Démonstration Ainsi, presque sûrement, mnM(ω) est une bonne approximation, au premier ordre, du nombre Zn(ω) d'individus de la génération n, du moins sur l'ensemble {ωΩ|M(ω) > 0}, ensemble qui a une probabilité non nulle.

Un calcul explicite

Il y a assez peu d'exemples où la formule de récurrence fondamentale conduit à un calcul explicite de φn. L'exemple le plus connu est celui où la loi de reproduction est un mélange de masse de Dirac en 0 et de loi géométrique,

(Xi=k) = α11k=0+(1α)(1p)k1p11k1,(α,p)[0,1]×]0,1],

d'espérance

m = 𝔼[Xi] = 1αp.

Cela correspond exactement aux fonctions génératrices φ qui sont des homographies :

φ(s) = α + (1α) ps1(1p)s.

D'après la classification des homographies en fonction du nombre de points fixes, l'homographie φ est conjuguée à des applications dont les itérées se calculent simplement, à savoir à x  x/m dans les cas non critiques (deux points fixes, 1 et α1p) et à x  x+c dans le cas critique (un point fixe double, 1).

Cas non critique

Dès que α1p, on trouve, par diagonalisation d'une application linéaire associée à l'homographie φ,

φ(s)α1pφ(s)1 = p1α sα1ps1 = 1m sα1ps1,

ce qui entraine

φn(s)α1pφn(s)1 = 1mn sα1ps1,

et conduit à un calcul explicite de φn.

Cas critique

Le cas α=1p est le cas critique m=1. On trouve, toujours en raisonnant sur une application linéaire (non diagonalisable) associée à l'homographie φ,

φ(s)+1φ(s)1 = s+1s1 + 2 p1p = s+1s1 + c,

donc

φn(s)+1φn(s)1 = s+1s1 + nc.

Finalement φn est une homographie :

φn(s) = (nc+2)sncncs+2nc,

ce qui correspond au choix de paramètres (αn,pn) suivant :

pn=pp+n(1p)=(Zn>0)=(T>n),αn=1pn.

Ici T désigne la date d'extinction, i.e. le numéro de la première génération vide.

Probabilité d'extinction

Modèle:Théorème Modèle:Démonstration

Comme φ est une série entière de rayon de convergence au moins égal à 1, à coefficients positifs ou nuls, φ est convexe (et même strictement convexe si p0+p1<1), et indéfiniment dérivable sur l'intervalle ]0,1[, et possède donc au plus 2 points fixes dans l'intervalle [0;1], sauf si φ(s)s. Un théorème analogue concernant les cartes planaires aléatoires (une généralisation naturelle des arbres aléatoires) a été démontré en 2007[5].

Probabilité d'extinction (respectivement 0.25, 1 et 1) pour p0(=1p2) successivement égal à 0,2 (cas surcritique), 0,5 (cas critique), 0,7 (cas sous-critique).

Modèle:Exemple Plus généralement Modèle:Théorème Modèle:Démonstration Le comportement du processus de Galton-Watson dans les cas sous-critique et surcritique correspond à l'intuition. Par contre, le comportement du processus de Galton-Watson dans le cas critique aléatoire (l'extinction est certaine) est radicalement différent du comportement du processus de Galton-Watson dans le cas critique déterministe (chaque individu a exactement un enfant et l'extinction est impossible).

À voir aussi

Notes

Modèle:Références

Bibliographie

Liens utiles

Modèle:Portail