Loi de Markov-Pólya
Modèle:Confusion Modèle:Infobox Distribution statistiques En mathématiques et plus particulièrement en théorie des probabilités, la loi de Markov-Pólya[1] (ou loi de Pólya-Eggenberger[2] ou loi de Pólya[3]) est une loi de probabilité discrète. Elle doit son nom au mathématicien George Pólya (ainsi qu'aux mathématiciens F Eggenberger et Andreï Markov) qui a publié un article[4], conjointement avec Eggenberger, en 1923 sur cette loi ainsi que sur le problème d'urne sous-jacent. Cependant Markov serait le premier à avoir étudié cette loi en 1917[5].
Définition
Considérons une urne contenant Modèle:Formule boules blanches et Modèle:Formule boules noires (pour un total de Modèle:Formule boules). Nous répétons l'expérience suivante Modèle:Formule fois : on pioche uniformément au hasard une boule dans l'urne, puis, on replace la boule piochée ainsi que Modèle:Formule autres boules de la même couleur dans l'urne. La loi de Markov-Pólya de paramètres Modèle:Formule, Modèle:Formule, Modèle:Formule et Modèle:Formule est alors la loi de la variable aléatoire Modèle:Formule qui compte le nombre total de boules blanches piochées au bout de ces Modèle:Formule tirages.
La fonction de masse de la variable Modèle:Formule peut se calculer et on a[6]Modèle:,[7]
où on a utilisé la notation[3] suivante .
Les paramètres Modèle:Formule, Modèle:Formule et Modèle:Formule sont des entiers naturels tandis que Modèle:Formule est un entier relatif, il peut donc être négatif[8]. Lorsque Modèle:Formule est négatif on rajoute la condition pour éviter tout problème de définition.
Propriétés
Soit Modèle:Formule une variable aléatoire ayant la loi de Markov-Pólya de paramètres Modèle:Formule, Modèle:Formule, Modèle:Formule et Modèle:Formule.
- Si Modèle:Formule, alors Modèle:Formule suit une loi binomiale de paramètres Modèle:Formule et Modèle:Formule.
- Si Modèle:Formule, alors Modèle:Formule suit une loi hypergéométrique de paramètres Modèle:Formule, Modèle:Formule et Modèle:Formule.
- Si Modèle:Formule, alors Modèle:Formule suit une loi bêta-binomiale de paramètres Modèle:Formule, Modèle:Formule et Modèle:Formule.
- Lorsque Modèle:Formule on peut réécrire la fonction de masse de Modèle:Formule des manières suivantes :
où désigne la factorielle croissante et désigne un coefficient binomial généralisé[9].
- L'espérance de Modèle:Formule est donnée par .
Il est intéressant de noter que l'espérance ne dépend pas du paramètre Modèle:Formule.
- La variance de Modèle:Formule est donnée par .
- Plus généralement, si Modèle:Formule alors le Modèle:Formule-ième moment factoriel de Modèle:Formule est donnée par[7]
où désigne la factorielle décroissante.
- La fonction génératrice des probabilités de Modèle:Formule vérifie[7]
où désigne la fonction hypergéométrique.
Limites
- Soit Modèle:Formulen une variable aléatoire ayant la loi de Markov-Pólya de paramètres Modèle:Formule, Modèle:Formule, Modèle:Formule (fixés) et Modèle:Formule. On a la convergence en loi suivante[10] :
où Modèle:Formule désigne la loi bêta. En fait la convergence a lieu pour la distance de Wasserstein à tous les ordres avec pour vitesse de convergence Modèle:Formule. Cela implique en particulier la convergence de tous les moments vers ceux de la loi bêta.
- Soit Modèle:Formule une variable aléatoire ayant la loi de Markov-Pólya de paramètres Modèle:Formule, Modèle:Formule, Modèle:Formule (dépendant de Modèle:Formule) et Modèle:Formule. Supposons que et que quand Modèle:Formule tend vers l'infini. Alors Modèle:Formule converge en loi[11] vers une loi binomiale négative[12] de paramètres Modèle:Formule et Modèle:Formule.
- D'autres limites sont possibles (par exemple vers une loi gaussienne lorsque Modèle:Formule) en changeant la manière dont évoluent les paramètres en fonction de Modèle:Formule[13].
Généralisation
On peut généraliser la loi de Markov-Pólya en considérant non plus 2 mais Modèle:Formule couleurs de boules différentes dans l'urne avec Modèle:Formule boules blanches, Modèle:Formule boules noires, Modèle:Formule boules rouges, etc. Dans ce cas si X représente le vecteur du nombre de boules tirées par couleur après Modèle:Formule tirages alors on a[6]:
- .
Il est toujours possible de calculer la fonction génératrice multivariée de X en utilisant les fonctions hypergéométriques.
Pour Modèle:Formule, Modèle:Formule (fixés) et Modèle:Formule qui tend vers l'infini, on a convergence en loi[10] du vecteur vers une loi de Dirichlet de paramètres Modèle:Formule.
Notes et références
- ↑ Modèle:Article
- ↑ Modèle:Article
- ↑ 3,0 et 3,1 Modèle:Article
- ↑ Modèle:Article
- ↑ Modèle:Article
- ↑ 6,0 et 6,1 Modèle:Article
- ↑ 7,0 7,1 et 7,2 Modèle:Lien web
- ↑ Si Modèle:Formule on retire la boule piochée et on retire aussi Modèle:Formule boules de la même couleur que la boule piochée.
- ↑ Plus précisément, pour Modèle:Formule entier positif et Modèle:Formule réel, on définit le coefficient binomial de la manière suivante : . La généralisation peut encore être poussée en utilisant la fonction gamma mais ce n'est pas nécessaire dans notre cas.
- ↑ 10,0 et 10,1 Modèle:Article
- ↑ Modèle:Article
- ↑ On entend ici une loi binomiale négative généralisée à une paramétrisation réelle. Plus précisément, Modèle:Formule suit une loi binomiale négative de paramètres Modèle:Formule (réel positif) et Modèle:Formule (réel entre 0 et 1) si et seulement si Cette loi binomiale négative généralisée est aussi parfois appelée loi de Polya (ou loi de Polya-Eggenberger) ce qui peut créer des confusions avec la loi de Markov-Polya.
- ↑ Modèle:Article