Loi bêta-binomiale
Modèle:Infobox Distribution statistiquesModèle:À sourcer En théorie des probabilités, la loi bêta-binomiale est une loi de probabilité discrète à support fini, correspondant à un processus de tirages Bernoulli dont la probabilité de succès est aléatoire (suivant une loi bêta). Elle est fréquemment utilisée en inférence bayésienne.
La loi de Bernoulli en est un cas particulier pour le paramètre Modèle:Math. Pour Modèle:Math, elle correspond à la loi uniforme discrète sur Modèle:Math. Elle approche également la loi binomiale lorsque les paramètres Modèle:Mvar et Modèle:Mvar sont arbitrairement grands. La loi bêta-binomiale est une version unidimensionnelle de la loi de Pólya multivariée, similairement aux lois binomiale et bêta qui sont respectivement des cas spéciaux des lois multinomiale et de Dirichlet.
Obtention de la loi bêta-binomiale

Soit une variable aléatoire qui compte le nombre de succès de épreuves de Bernoulli, chacune ayant une probabilité de succès . La variable suit donc une loi binomiale dont la fonction de masse est donnée par :
.
Ici, la probabilité de succès est également une variable aléatoire, qui suit une loi bêta de paramètres Modèle:Mvar et Modèle:Mvar. Sa fonction de densité est donnée par :
La loi bêta-binomiale s'obtient en considérant le couple comme une nouvelle variable aléatoire puis en calculant la densité marginale de (cette densité marginale est une fonction de masse, puisque est une variable aléatoire suivant une loi discrète).
Par définition, la densité marginale de s'obtient en intégrant la densité conjointe de sur l'espace de probabilité occupé par . Ainsi, leur densité conjointe peut être décomposée, telle que :
En intégrant cette densité conjointe selon sur (l'espace sur lequel est définie la densité de la loi bêta), il advient finalement :
En remplaçant la fonction bêta par sa définition où Modèle:Math est la fonction gamma, on obtient :
Dans ce contexte, la loi bêta-binomiale apparaît souvent en inférence bayésienne : la loi bêta-binomiale est la loi prédictive d'une variable aléatoire binomiale avec une probabilité de succès donnée par une loi bêta.
Utilisation de la loi bêta-binomiale dans un modèle d'urnes
La loi bêta-binomiale peut également être représentée par un modèle d'urnes, pour des paramètres Modèle:Mvar et Modèle:Mvar entiers positifs. Plus précisément, on considère une urne contenant Modèle:Mvar boules rouges et β boules noires, on effectue alors des tirages aléatoires. Si une boule rouge est tirée, alors deux boules rouges sont replacées dans l'urne (elle-même plus une autre). De la même manière, si une boule noire est tirée, elle est remise avec une autre boule noire dans l'urne. Si on répète cette opération Modèle:Mvar fois, alors la probabilité de tirer Modèle:Mvar boules rouges suit une loi bêta-binomiale de paramètres Modèle:Mvar, Modèle:Mvar et Modèle:Mvar.
Il est à noter que si après les tirages on replace une unique boule, alors la loi est binomiale, et si les tirages sont effectués sans remise, alors la loi est hypergéométrique.
Moments et propriétés
Les trois premiers moments sont
et le kurtosis est
Si on pose , on remarque que la moyenne peut être écrite sous la forme et la variance par
où est la corrélation deux à deux entre les Modèle:Mvar tirages de Bernoulli et est appelé le paramètre de surdispersion.
Estimations ponctuelles
Méthode des moments
L'estimation par la méthode des moments peut être obtenue par l'utilisation des premier et deuxième moments de la loi bêta-binomiale, c'est-à-dire
et en les considérant égaux aux moments empiriques
En résolvant en Modèle:Mvar et en Modèle:Mvar, on obtient
Maximum de vraisemblance
Alors que la méthode du maximum de vraisemblance est inutilisable, sachant que la densité de probabilité est la densité d'un couple de fonction (fonction gamma et/ou fonction bêta), elles peuvent être facilement calculée via une optimisation numérique directe. Les estimées du maximum de vraisemblance à partir des données empiriques peuvent être calculées en utilisant des méthodes générales adaptées aux lois de Pólya multinomiales décrites dans (Minka 2003).
Exemple
Les données suivantes donnent le nombre de garçons parmi les 12 premiers enfants de familles de 13 enfants, pour 6115 familles prises dans des données d’hôpital en Saxe au Modèle:S- (Sokal et Rohlf, Modèle:P. de Lindsey). Le Modèle:13e est ignoré pour considérer le fait non aléatoire que des familles s'arrêtent quand elles obtiennent le genre attendu.
| Garçons | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
| Familles | 3 | 24 | 104 | 286 | 670 | Modèle:Unité | Modèle:Unité | Modèle:Unité | 829 | 478 | 181 | 45 | 7 |
Les deux premiers moments empiriques sont
et ainsi les estimées par la méthode des moments sont
Les estimées par le maximum de vraisemblance peuvent être trouvées numériquement
et le maximum de log-vraisemblance est
Références
* Minka, Thomas P. (2003). Estimating a Dirichlet distribution. Rapport technique de Microsoft.