Récurrence et transience d'une chaîne de Markov

De testwiki
Aller à la navigation Aller à la recherche

Modèle:À sourcer

Un état i d'une chaîne de Markov X=(Xn)n0 est dit récurrent (ou persistant) si une trajectoire « typique » de la chaîne de Markov passe par i une infinité de fois, sinon l'état i est dit transitoire (ou transient par calque de l'anglais). Ces propriétés de transience ou de récurrence sont souvent partagées par tous les états de la chaîne X, par exemple quand la chaîne X est irréductible : en ce cas, si tous ses états sont récurrents, la chaîne de Markov est dite récurrente.

Temps de séjour et temps de premier retour

Pour chaque état i d'une chaîne de Markov, on a les définitions suivantes : Modèle:Théorème

Récurrence et transience (définition informelle)

Informellement, pour une chaîne de Markov irréductible, un état i du système modélisé par la chaîne de Markov est dit récurrent si une trajectoire typique du système passe infiniment souvent par cet état. Il y a en fait dichotomie :

  • soit la probabilité que la trajectoire du système passe infiniment souvent par i vaut 1, et l'état i est dit récurrent,
  • soit cette probabilité vaut 0, auquel cas i est dit transient.
  • les états récurrents (ceux pour lesquels limnSn(i)=+) se subdivisent en états récurrents positifs et récurrents nuls :
  • un état est dit récurrent positif si le système y passe une fraction non négligeable de son temps : bien sûr Sn(i)n, mais Sn(i) ne doit pas être trop petit devant n:
limnSn(i)n=πi>0;
en notation de Landau, Sn(i)Θ(n). Cela entraîne que les instants de passage en i sont, en un certain sens, régulièrement espacés, à une distance 1/πi les uns des autres en moyenne,
  • un état est dit récurrent nul si le système y passe une fraction négligeable de son temps :
limnSn(i)n=0;
i.e. Sn(i)+, mais Sn(i)o(n). Le système passe infiniment souvent par l'état i, mais les instants de passage en i sont alors de plus en plus espacés au cours du temps.

Toujours dans le cas d'une chaîne de Markov irréductible, si un état est récurrent positif, tous les états le sont et la suite (πi)iE est appelée probabilité stationnaire de la chaîne de Markov. La probabilité stationnaire joue un rôle très important dans l'étude de la chaîne de Markov. Modèle:Article détaillé

Modèle:Exemple Modèle:Exemple

Critères de récurrence et de transience

Notations. Lorsqu'on étudie une chaîne de Markov particulière, sa matrice de transition est en général bien définie et fixée tout au long de l'étude, mais la loi initiale peut changer lors de l'étude et les notations doivent refléter la loi initiale considérée sur le moment :

  • si à un moment de l'étude on considère une chaîne de Markov de loi initiale définie par iE,(X0=i)=μi, alors les probabilités sont notées μ(), et les espérances sont notées 𝔼μ[] ;
  • en particulier, si (X0=j)=1, on dit que la chaîne de Markov part de j, les probabilités sont notées j(), et les espérances sont notées 𝔼j[].

Modèle:Théorème

Exemples

Marche aléatoire sur un groupe fini

Graphe de 2 marches aléatoires élémentaires, respectivement sur le groupe cyclique  8 et sur le groupe diédral  D4.

Modèle:Exemple Modèle:Exemple Plus généralement, tous les états d'une marche aléatoire sur un groupe fini  G sont récurrents positifs, car la loi uniforme discrète sur  G est une probabilité stationnaire, indépendamment du pas de la marche : en effet, la matrice de transition  P d'une marche aléatoire sur un groupe discret est bistochastique (i.e. non seulement la somme des termes d'une ligne vaut 1, quelle que soit la ligne, mais la somme des termes d'une colonne de  P vaut 1, quelle que soit la colonne). Si tous les coefficients du vecteur ligne  x valent 1, on vérifie alors sans peine que  xP=x. Ainsi la mesure uniforme, qui est proportionnelle à  x, est stationnaire.

Marche aléatoire simple sur les entiers relatifs

Dans cet exemple, E= et pi,i+1=p=1pi,i1. Si 0<p<1, la chaîne X=(Xn)n0 est irréductible, donc tous les états ont même nature. Par exemple on a

k0,p0,0(2k)=(2kk)pk(1p)k(4p(1p))kkπ,

alors que p0,0(2k+1)=0.

Marche aléatoire biaisée

  • Si on observe la forme de la fraction ci-dessus, comme {4p(1p)<1}{p0.5}, la marche est transiente si et seulement si p0.5, en vertu du quatrième critère de transience exprimé dans la partie « Critères de récurrence et de transience ».
  • On peut aussi voir que p0.5 entraîne la transience de la chaîne de Markov X=(Xn)n0 en construisant cette chaîne à l'aide d'une suite de variables aléatoires i.i.d. Y=(Yn)n1, de la manière suivante : posons
S0=0,Sn=Sn1+Ynn1=Y1+Y2++Yn.
Alors S=(Sn)n0 a même loi que X=(Xn)n0, mais la loi forte des grands nombres pour les suites de v.a. i.i.d. entraîne que, presque sûrement en ωΩ,
limSn(ω)n=𝔼[Yn]=(1p)×(1)+p×1=2p10.
donc, avec probabilité 1, la suite de nombres réels (Sn(ω))n0 converge vers sgn(2p1)×+, et visite la valeur 0, au plus, un nombre fini de fois : 0 est donc transient, et tous les entiers de sa classe (, en l'occurrence) avec lui.
  • Dans le cas où p=0.5, la méthode précédente ne permet pas de démontrer la récurrence de 0, puisque la loi forte des grands nombres stipule alors la convergence de la suite (n1Sn(ω))n0 vers 0, ce qui n'entraîne pas nécessairement que la suite (Sn(ω))n0 prenne la valeur 0 une infinité de fois : pour aboutir à la conclusion d'une infinité de visites en 0, il faut invoquer un résultat plus précis que la loi forte des grands nombres, à savoir la loi du logarithme itéré.
  • Pour décider de la récurrence ou de la transience aussi bien dans le cas p=0.5 que dans le cas p0.5, on peut aussi calculer explicitement la loi du premier temps T de retour en 0, partant de 0, pour la marche aléatoire simple, et trancher ainsi l'alternative :
i(Ti<+)=1oui(Ti=+)>0.
En effet
k1,(T=2k)=2Ck1(p(1p))k,
Cn désigne le n-ème nombre de Catalan. On trouve alors que la série génératrice de T, GT(s)=𝔼[sT], satisfait
GT(s)=114p(1p)s2.
Ainsi
(T<+)=k2(T=k)=GT(1)=114p(1p)=1|2p1|
est strictement inférieur à 1 si et seulement si p0.5.

Marche aléatoire symétrique

  • Par ailleurs, pour p=0.5, la mesure de probabilité π est solution du système πP=π si et seulement si
k,2πk=πk1+πk+1,
i.e. si et seulement si les πk forment une progression arithmétique :
k,πk=ak+b.
La contrainte de positivité sur les πk impose a=0, b0, i.e. πk est une suite constante. Ainsi kπk est infinie ou nulle, suivant la valeur de b, strictement positive ou bien nulle, donc une mesure invariante ne peut en aucun cas être une mesure de probabilité, ce qui fait qu'il n'existe pas de probabilité stationnaire : tous les états sont récurrents nuls.
Cn4nn3/2π,
on peut aussi voir directement, grace la formule explicite de la loi du temps T de retour en 0, donnée à la section précédente, que
2k(T=2k)12πk
n'est pas le terme général d'une série convergente, et que, par conséquent, 𝔼[T]=+.

Modèle:Portail