Loi binomiale

De testwiki
Aller à la navigation Aller à la recherche

Modèle:En-tête label Modèle:Infobox Distribution statistiques

En théorie des probabilités et en statistique, la loi binomiale modélise la fréquence du nombre de succès obtenus lors de la réalisation de plusieurs expériences aléatoires identiques et indépendantes.

Plus mathématiquement, la loi binomiale est une loi de probabilité discrète décrite par deux paramètres : Modèle:Math le nombre d'expériences réalisées, et Modèle:Math la probabilité de succès. Pour chaque expérience appelée épreuve de Bernoulli, on utilise une variable aléatoire qui prend la valeur Modèle:Math lors d'un succès et la valeur Modèle:Math sinon. La variable aléatoire, somme de toutes ces variables aléatoires, compte le nombre de succès et suit une loi binomiale. Il est alors possible d'obtenir la probabilité de Modèle:Math succès dans une répétition de Modèle:Math expériences :

(X=k)=(nk)pk(1p)nk.

Cette formule fait intervenir le coefficient binomial (nk) duquel provient le nom de la loi.

L'importance de cette loi est d'abord historique puisqu'elle a été l'objet d'étude du théorème de Moivre-Laplace, résultat du Modèle:S- fondateur des théorèmes de convergence. Une loi binomiale peut également être utilisée pour modéliser des situations simples de succès ou échec, un jeu de pile ou face par exemple. Le calcul de sa fonction de masse devient rapidement fastidieux lorsque Modèle:Math est grand, il est alors possible d'utiliser des approximations par d'autres lois de probabilité telles que la loi de Poisson ou la loi normale et d'utiliser des tables de valeurs.

La loi binomiale est utilisée dans divers domaines d'étude, notamment à travers des tests statistiques qui permettent d'interpréter des données et de prendre des décisions dans des situations dépendant de l'aléa. De par la simplicité de sa définition, c'est l'une des lois de probabilité étudiées dans les cours d'introduction à la théorie des probabilités.

Explication intuitive

Pile ou face.

Premiers exemples

Pile ou face

Considérons n lancers successifs d'une pièce de monnaie. Alors le nombre de fois où la pièce apparaît du côté pile suit la loi binomiale où le nombre d'expériences réalisées est n et où la probabilité de succès est p=12.

Lancer de dé

Considérons n lancers successifs d'un dé à 6 faces. Alors le nombre de fois où l'on obtient un 1, suit la loi binomiale où le nombre d'expériences réalisées est n et où la probabilité de succès est p=16.

Définition intuitive

Une loi de Bernoulli décrit le comportement d'une expérience aléatoire qui possède deux résultats possibles traditionnellement appelés succès et échec[1]. Une telle expérience s'appelle une épreuve de Bernoulli. Par exemple, lors d'un lancer de pile ou face, on peut considérer qu'obtenir face est un succès et obtenir pile est un échec. Dans ce modèle, la probabilité de succès est une valeur fixe, c'est-à-dire qui reste constante à chaque renouvellement de l'expérience aléatoire. Cette probabilité de succès est notée p. Nous pouvons noter sa loi de probabilité :

x{0;1},(X=x)=px(1p)1x

On considère la situation où une telle expérience aléatoire (deux résultats possibles et une probabilité fixe) est répétée un certain nombre de fois de manière indépendante ; notons Modèle:Math ce nombre de fois. Cette répétition indépendante d'épreuves de Bernoulli s'appelle un schéma de Bernoulli ou simplement des épreuves de Bernoulli[2]. Une loi binomiale décrit le nombre de fois où le succès apparaît sur les Modèle:Math expériences effectuées. Le nombre de succès obtenus étant une valeur aléatoire, une loi binomiale est décrite grâce à la donnée des probabilités que le succès apparaisse précisément Modèle:Math fois sur les Modèle:Math essais.

Arbre de probabilité

arbre de probabilité
Arbre de probabilité pour une loi binomiale associée à 3 épreuves de Bernoulli.

Une manière visuelle de représenter une suite d'expériences est d'utiliser un arbre de probabilité. Chaque épreuve est représentée par deux branches : l'une pour le succès, l'autre l'échec. À chaque extrémité, on rajoute deux branches (succès et échec) pour l'épreuve suivante. On recommence jusqu'au nombre total d'épreuves. À chaque extrémité finale, on peut compter le nombre de succès obtenus. Il suffit de multiplier le nombre de fois où il y a Modèle:Math succès par la probabilité d'obtenir Modèle:Math succès pour obtenir la probabilité correspondante de la loi binomiale.

Par exemple, on lance 3 fois de suite un dé équilibré à six faces et on s'intéresse au nombre de fois que le Modèle:Math apparaît. Il apparaît 0, 1, 2 ou 3 fois. Chaque lancer est indépendant des autres et la probabilité d'obtenir le Modèle:Math est de Modèle:Math sur chacun d'entre eux, autrement dit la probabilité qu'il n'apparaisse pas est de Modèle:Math à chaque lancer. Ainsi, pour chaque lancer, on considère une loi de Bernoulli de paramètre Modèle:Math. Il y a trois configurations pour obtenir une seule fois le Modèle:Math : il apparaît au premier lancer ou au deuxième ou au troisième. Chacune de ces issues a la même probabilité d'apparaître : 16×56×56. La probabilité pour avoir une fois le Modèle:Math est alors : 3×16×56×56. On retrouve bien (X=1)=(31)(1/6)1(5/6)31 pour une loi binomiale Modèle:Math. Il est possible de retrouver les autres probabilités de la même façon.

Définition mathématique

La loi binomiale est une loi de probabilité discrète[3] à deux paramètres : n* et p[0;1]. Il est fréquent d'utiliser également le paramètre Modèle:Math pour avoir des expressions plus concises. Elle possède plusieurs définitions équivalentes :

fonctions de masse d'unela loi binomiale
Diagrammes en bâtons de trois fonctions de masse de lois binomiales. Les paramètres sont Modèle:Math et Modèle:Math (en bleu), Modèle:Math (en vert) et Modèle:Math (en rouge).

Modèle:Théorème

Modèle:Théorème

Modèle:Théorème

On rappelle que des variables aléatoires Y1 et Y2 de loi discrète sont indépendantes si (Y1=k,Y2=h)=(Y1=k)(Y2=h).

La fonction de masse donnée dans la définition 3 a bien un sens puisque la formule du binôme de Newton donne[4] : k=0n(X=k)=k=0n(nk)pkqnk=(p+1p)n=1. La définition 2 est l'écriture mathématique de la définition 1[5].

La définition 3 est équivalente aux deux autres : on calcule explicitement la probabilité que Modèle:Math succès apparaissent dans Modèle:Math essais. Puisque les Modèle:Math répétitions sont indépendantes, la probabilité d'obtenir Modèle:Math succès et donc Modèle:Math échecs est : pk(1p)nk, dans le cas où on ne tient pas compte de la place des résultats[6]Modèle:,[7]. Il suffit alors de s'intéresser à la place des Modèle:Math succès et Modèle:Math échecs. C'est-à-dire, combien y a-t-il de manière de placer Modèle:Math succès parmi Modèle:Math résultats (sans s'occuper de l'ordre entre les succès) ? C'est le nombre de combinaisons de Modèle:Math éléments parmi Modèle:Math éléments[8] donné par le coefficient binomial (nk). On retrouve alors la fonction de masse de la définition 3.

Notation

Le fait qu'une variable aléatoire Modèle:Math suive une loi binomiale de paramètres Modèle:Math et Modèle:Math est noté[3]Modèle:,[6] : Xb(n,p) ; XB(n,p) ou XBi(n,p).

Mesure de probabilité

Puisque la loi binomiale Modèle:Math est une loi discrète, il est possible de la définir grâce à sa mesure de probabilité[9] :

=k=0n(nk)pkqnkδk , où δk est la mesure de Dirac au point Modèle:Math.

Historique

Schéma constitué de formes géométriques
La planche de Galton : les billes rouges (les points rouges sur la figure) empilées dans le bas de l'appareil correspondent à la fonction de masse de la loi binomiale, la courbe bleue correspond à la densité de la loi normale.

La loi binomiale fait partie des plus anciennes lois de probabilités étudiées[3]. Elle a été introduite par Jacques Bernoulli qui y fait référence en 1713 dans son ouvrage Ars Conjectandi. Entre 1708 et 1718, on découvre aussi la loi multinomiale (généralisation multi-dimensionnelle de la loi binomiale), la loi binomiale négative ainsi que l'approximation de la loi binomiale par la loi de Poisson, la loi des grands nombres pour la loi binomiale et une approximation de la queue de la loi binomiale[10].

Grâce à l'expression de sa fonction de masse, la loi binomiale a été utilisée par plusieurs scientifiques pour réaliser des calculs dans des situations concrètes. C'est le cas d'Abraham de Moivre[a 1] qui réussit à trouver une approximation de la loi binomiale par la loi normale, il publie d'abord ses résultats en 1733 en latin[11] : Modèle:Langue, puis les traduit pour les publier en 1738 dans Modèle:Langue[11]. En 1812, Pierre-Simon de Laplace reprend ces travaux. Francis Galton crée la planche de Galton qui permet d'avoir une représentation physique de cette convergence[a 1]. En 1909, Émile Borel énonce et prouve, dans le cas de la loi binomiale, la première version de la loi forte des grands nombres[12].

Plus récemment, en 1914, McKendrick démontre que la loi binomiale est la solution d'un processus simple de naissance et d'émigration[13]. D'après les travaux de William Feller en 1957, elle peut aussi être vue comme la loi stationnaire pour le modèle des urnes d'Ehrenfest. Cette même année, Haight montre que la loi binomiale est liée à un problème de file d'attente[13].

La loi binomiale apparaît dans de nombreuses applications au Modèle:S-[14] : en génétique, en biologie animale, en écologie végétale, pour les tests statistiques, dans différents modèles physiques tels que des réseaux téléphoniques[15] ou le modèle des urnes d'Ehrenfest, etc.

Le nom « binomiale » de cette loi provient[5]Modèle:,[a 1] de l'écriture de sa fonction de masse (voir ci-dessous) qui contient un coefficient binomial issu du développement du binôme : Modèle:Math.

Représentation sous la forme d'un arbre

Modèle:Article détaillé

Représentation de la loi binomiale sous forme d'un arbre.

Puisque la loi binomiale est une suite d'épreuves de Bernoulli, il est possible de la représenter grâce à un arbre de probabilité : chaque nœud représente le résultat d'une épreuve, les probabilités de succès et d'échecs sont représentés par deux branches distinctes rattachées à un nœud. Le graphique est donc un arbre binaire équilibré. Un arbre contenant Modèle:Math générations correspond à une loi binomiale Modèle:Math.

Si on indique les résultats de chaque épreuve sur les arêtes de l'arbre, il est possible de visualiser les différentes issues de la loi binomiale[16]. Si ce sont les valeurs des probabilités qui sont indiquées sur les arêtes, alors les probabilités de la loi binomiale apparaissent au bout des branches[17] (voir le graphique ci-contre).

Le graphique est un arbre de probabilité pour une loi binomiale de paramètre Modèle:Math. Sur chaque branche sont indiquées les probabilités des différentes issues : par exemple branches droite, gauche puis droite ; c'est-à-dire échec, succès puis échec. Au bout des branches de l'arbre, apparaissent les probabilités de chaque issue de la loi binomiale Modèle:Math. C'est-à-dire pour les valeurs Modèle:Math ou Modèle:Math, on obtient (X=0)=q3, (X=1)=3pq2, (X=2)=3qp2 et (X=3)=p3. On retrouve ainsi les différents coefficients binomiaux : (30)=1 ; (31)=3 ; (32)=3 ; (33)=1.

Propriétés

Moments

Les plus connus sont l'espérance et la variance, que l'on déduit classiquement[a 2] de la définition 2 ci-dessus :

𝔼(X)=npetVar(X)=npq.

Les moments factoriels de la loi binomiale de paramètres Modèle:Math et Modèle:Math sont[a 3]Modèle:,[a 4] :

Modèle:Retrait

Par conséquent[18], ses moments ordinaires sont[19] :

Modèle:Retrait avec comme premières valeurs[20] :

μ'1=𝔼(X)= np (espérance)
μ'2=𝔼(X2)= np+n(n1)p2
μ'3=𝔼(X3)= np+3n(n1)p2+n(n1)(n2)p3

On peut aussi les obtenir par la formule de récurrence

Modèle:Retrait

où le terme ddp désigne la dérivée par rapport à la variable Modèle:Math.

Les moments inverses, c'est-à-dire 𝔼(Xr) avec r*, sont infinis[21].

Moments centrés

Les moments centrés sont les moments de la différence entre la variable et sa moyenne[22]Modèle:,[20].

μ2=Var(X)=𝔼((Xnp)2)= npq  ; (variance)
μ3=𝔼((Xnp)3)= np(1p)(12p)=npq(qp)
μr=𝔼((Xnp)r)= npqk=0r2(r1k)μkpk=0r2(r1k)μk+1

L'expression de la variance donne l'écart type[23] : σ(X)=npq.

Les moments centrés se calculent aussi par cette autre relation de récurrence[a 5]Modèle:,[20] :

Modèle:Retrait

Écart moyen

L'Écart moyen (ou déviation moyenne) est la moyenne des écarts à la moyenne ; il est donné par[21] :

Modèle:Retrait

np est la partie entière de Modèle:Math.

Par exemple, si XB(2n,1/2), 𝔼(|Xn|)=n(2nn)22nnπ, valeur à comparer avec l'écart-type : 𝔼((Xn)2)=n2.

Fréquence de succès

Grâce aux formules précédentes, on obtient les moments de la fréquence des succès[23] : Xn :

moment d'ordre Modèle:Math (ou espérance) de la fréquence de succès 𝔼[Xn]= p
moment centré d'ordre Modèle:Math (ou variance) de la fréquence de succès 𝔼[(Xnp)2]= p(1p)n=pqn
moment centré d'ordre Modèle:Math de la fréquence de succès 𝔼[(Xnp)4]= pq(16pq)n3+3p2q2n2

L'expression de la variance de la fréquence donne l'écart type de la fréquence des succès : σX/n=p(1p)n=pqn.

Covariance

On considère deux variables aléatoires X1 et X2, pas forcément indépendantes, de lois binomiales respectives b(n,p1) et b(n,p2). La covariance permet d'évaluer la dépendance entre les deux variables :

Cov(X1,X2)=n(X1=1 et X2=1)np1p2.

Propriétés et caractérisations

Valeurs descriptives de la loi

Si Modèle:Math est un entier, alors le mode, la moyenne et la médiane valent tous trois Modèle:Math.

Propriétés de stabilité
  • Si Modèle:Math suit une loi binomiale Modèle:Math, alors[6] Modèle:Math suit une loi Modèle:Math. Cette symétrie donne les relations suivantes pour la fonction de répartition et pour la fonction de masse[26]Modèle:,[27] : (Xk)=(Ynk) et (X=k)=(Y=nk).
  • Si les variables aléatoires indépendantes X1 et X2 sont de lois binomiales respectives b(n1,p) et b(n2,p), alors la variable aléatoire X1+X2 est de loi binomiale b(n1+n2,p). Cette propriété peut s'obtenir grâce à l'expression des fonctions caractéristiques ou grâce à l'écriture sous forme de somme de variables de Bernoulli[28].
Inégalités
Caractérisations

Fonction de répartition

Graphique de 3 fonctions de répartition de lois binomiales avec paramètres : Modèle:Math et Modèle:Math (en bleu), Modèle:Math (en vert) et Modèle:Math (en rouge).

La fonction de répartition d'une variable aléatoire Modèle:Math suivant la loi binomiale Modèle:Math est donnée par[22] :

F(x)=(Xx)={1sixnk=0x(nk)pk(1p)nksi0x<n0six<0

x est la partie entière de Modèle:Math.

Même s'il existe une expression de la fonction de répartition, son calcul n'est pas facile[32] à cause des coefficients binomiaux (nk), notamment lorsque Modèle:Math est grand. Il existe alors des tables de valeurs (voir ci-dessous). Des théorèmes d'approximation ont été développés[32] pour approcher de manière théorique et calculatoire cette fonction de répartition (voir ci-dessous). L'expression suivante provient du lien entre la loi binomiale et la loi bêta[22] (voir ci-dessous) : pour 0x<n

F(x)=1B(x+1,nx)p1tx(1t)nx1dt

Modèle:Math est la fonction bêta. il est alors possible d'écrire la fonction de répartition grâce à la fonction bêta incomplète[33] :

F(x)=I1p(nx,1+x).

Fonctions caractéristique et génératrice

La fonction caractéristique d'une variable aléatoire Modèle:Math suivant la loi binomiale Modèle:Math est donnée par[23] :

ϕ(t)=𝔼(eitX)=(q+peit)n,t.

La fonction génératrice des moments d'une variable aléatoire Modèle:Math suivant la loi binomiale Modèle:Math est donnée par[22] :

M(t)=𝔼(etX)=(q+pet)n,t.

On déduit directement la fonction génératrice des cumulants[13] :

ln(M(t))=nln(q+pet),t,

et la fonction génératrice des cumulants factoriels[13] :

ln(𝔼[(1+t)X])=nln(1+pt),t+.

Lien avec d'autres lois

Loi de Bernoulli

Rappelons que la loi binomiale de paramètres n* et p[0,1] est la loi de la somme de Modèle:Math variables aléatoires indépendantes de loi de Bernoulli de même paramètre Modèle:Math.

Ainsi, la loi binomiale Modèle:Math est une loi de Bernoulli de paramètre Modèle:Math.

C'est par cette représentation du nombre de succès et d'échecs dans une suite d'épreuves que la loi binomiale est source de nombreuses applications[34].

Lois réciproques

Les lois suivantes ont un lien avec la loi binomiale grâce à leur fonction de répartition. Lorsque le nombre de succès Modèle:Math est fixé, elles donnent la loi du nombre d'épreuves nécessaires (loi binomiale négative) ou la loi du paramètre Modèle:Math (lois bêta ou de Fisher). En ce sens, elles peuvent servir de lois réciproques.

(Yk)=1Ip(k+1,nk)=(Xp)Modèle:Math suit une loi bêta de paramètres Modèle:Math et Modèle:Math suit une loi binomiale Modèle:Math.
(Yk)=(F>ν2ν1p1p)Modèle:Math suit une loi de Fischer de paramètres ν1=2(k+1),ν2=2(nk).
La relation précédente permet de trouver les quantiles de la loi binomiale[38].

Autres lois

  • La loi binomiale (doublement) tronquée de paramètres n,p,r1 et r2 est la loi binomiale Modèle:Math avec r1<nr2 telle que les valeurs dans [0,r1[ et dans ]nr2,n] sont enlevées[39]. La fonction de masse de cette loi est donnée par l'expression : pour k=r1,,nr2
(X=k)=(nk)pkqnk/i=r1nr2(ni)piqni.
De la même manière, il est possible de définir la loi binomiale (simplement) tronquée[39] en omettant uniquement les valeurs entre Modèle:Math et r1 ou entre nr2 et n.
  • La loi binomiale positive ou loi binomiale tronquée en 0 est la loi binomiale Modèle:Math dont on retire la valeur 0. Sa fonction de masse est : (X=k)=(nk)pkqnk1qn. De la même manière il est possible de définir la loi binomiale négative.
  • La loi multinomiale est la généralisation multi-dimensionnelle de la loi binomiale[22] dans le sens où la loi multinomiale modélise une succession d'épreuves dont chacune possède plusieurs issues, pas uniquement succès ou échec. Cette loi multidimensionnelle donne les probabilités du nombre d'apparition des différentes issues dans une succession d'épreuves indépendantes[a 7].
  • La loi bêta-binomiale est construite grâce à un mélange de loi[40] : une variable aléatoire qui suit une loi binomiale b(n,π) dont le paramètre π est une variable aléatoire qui suit une loi bêta B(α,β), est de loi bêta-binomiale de paramètres n,α,β. Cette loi binomiale est similaire à la Modèle:Lien, il suffit de changer les paramètres[41].
  • La fonction de masse d'une variable Modèle:Math de loi hypergéométrique de paramètres A,p=1q,n est donnée par : (Y=k)=(kpA)(nAqA)(nA). Elle correspond au nombre tirages gagnants dans une expérience de Modèle:Math tirages simultanés dans une urne contenant Modèle:Math boules et une proportion de Modèle:Math boules gagnantes.
Si le nombre de boules augmente, c'est-à-dire Modèle:Math tend vers l'infini, et si Modèle:Math tend vers une valeur p[0,1], alors la loi hypergéométrique converge vers une loi binomiale[42] Modèle:Math.
Autrement dit, si la taille de la population (Modèle:Math) est grande par rapport à la taille de l'échantillon (Modèle:Math), alors les tirages peuvent être convenablement représentés par une loi binomiale de paramètre Modèle:Math égal au pourcentage (Modèle:Math) d'éléments ayant le caractère étudié.
De plus, si X1 et X2 sont deux variables aléatoires indépendantes de loi binomiale respectives b(n1,p) et b(n2,p), alors la loi de X1 sachant que X1+X2=k est la loi hypergéométrique de paramètres[28] : k,n1n1+n2 et n1+n2.

Convergences et approximations

Pour de grandes valeurs de Modèle:Math, le calcul des fonctions de masse et de répartition deviennent vite fastidieux. Une méthode est d'approcher ces valeurs grâce aux théorèmes limites. La loi (faible ou forte) des grands nombres permet d'approcher la moyenne de la loi binomiale. Pour obtenir des valeurs approchées de la fonction de répartition, il est possible d'utiliser l'approximation normale ou l'approximation par la loi de Poisson. L'approximation normale est plus performante lorsque le paramètre Modèle:Math n'est pas trop proche de Modèle:Math ou de Modèle:Math, sinon l'approximation par la loi de Poisson donne de meilleurs résultats[43].

Loi des grands nombres

Modèle:Article détaillé La loi faible des grands nombres, appliquée à un processus de Bernoulli de paramètre Modèle:Math, garantit que pour toute suite Modèle:Math de variables aléatoires, définies sur un même espace probabilisé, et de lois respectives Modèle:Math (cf. définition 2 ci-dessus), on a, pour tout ε>0 : Modèle:Retrait Plus précisément, puisque l'[[#Moments|espérance et la variance de Modèle:Math]] sont respectivement égales à Modèle:Math et Modèle:Math, l'inégalité de Bienaymé-Tchebychev montre que[23] : Modèle:Retrait Cela peut s'interpréter grossièrement de la manière suivante. Si l'on sait que lors d'une expérience aléatoire (tirage d'un individu dans une population de grande taille, lancer d'une pièce…) la probabilité d'apparition de la propriété Modèle:Math est Modèle:Math, alors la fréquence d'apparition de la propriété Modèle:Math au cours de Modèle:Math expériences de ce type (tirages de Modèle:Math individus dans une population de taille très supérieure à Modèle:Math, Modèle:Math lancers de pièce…) est souvent voisine de Modèle:Math, avec une probabilité d'autant meilleure que Modèle:Math est grand et que Modèle:Math est proche de Modèle:Math ou Modèle:Math.

Il existe de meilleures majorations de cette probabilité, l'inégalité de Hoeffding donne[a 8] : Modèle:Retrait

Convergence vers la loi de Poisson

Convergence

Considérons une loi binomiale Modèle:Math telle que les paramètres Modèle:Math et Modèle:Math sont liés par la formule : np=λ>0λ est fixé. Lorsque Modèle:Math tend vers l'infini, et donc Modèle:Math tend vers 0, alors[44] : limn+(nk)pkqnk=eλλkk!. Autrement dit, la probabilité qu'une variable de loi binomiale prenne la valeur Modèle:Math converge (lorsque Modèle:Math devient grand) vers la probabilité qu'une variable de loi de Poisson prenne la valeur Modèle:Math. Le paramètre Modèle:Math converge alors vers 0, il correspond donc à un évènement de probabilité très faible, la loi de Poisson est alors appelée loi des évènements rares[44]. Par sommation, on obtient alors le résultat[45] :

limn+(Xx)=limn+k=0x(nk)pkqnk=eλk=0xλkk!=(Yx)

est la partie entière, Modèle:Math est une variable de loi binomiale et Modèle:Math de loi de Poisson 𝒫(λ). Cette limite montre la convergence en loi de la loi binomiale (avec les conditions précédentes) vers la loi de Poisson. Une expression plus détaillée de la convergence peut être donnée par la formule[46]Modèle:,[22] : (Xx)=eλk=0xλkk!+𝒪(1n2) avec λ=(2nx)p2p lorsque Modèle:Math tend vers l'infini et 𝒪() est le comparateur asymptotique.

Fonctions de masse d'une loi binomiale b(24;0,5) (en violet), b(60;0,2) (en rouge) et d'une loi de poisson 𝒫(12) (en bleu).

En 1953, Iouri Prokhorov donne une majoration de l'erreur totale d'approximation entre la fonction de répartition d'une loi binomiale Modèle:Math et une loi de Poisson 𝒫(np)[47] : k=0+|(nk)pkqnkenp(np)kk!|min(2np2,3p). Il est également possible de borner le ratio entre les deux fonctions de répartition[47] : enp(1kn)kqn(nk)pkqnkenp(np)k/k!enpqnk.

Approximation

Grâce à la convergence ci-dessus, il est possible d'approcher les probabilités de la loi binomiale par la loi de Poisson. En pratique, le cas s'applique lorsque Modèle:Math est grand et donc Modèle:Math petit. Différentes valeurs sont proposées[46]Modèle:,[44]Modèle:,[48]Modèle:,[49] :

  • p<0,4, lorsque n=3 (ce qui fait np<1,2) ;
  • p<0,3, lorsque n=30 (ce qui fait np<9) ;
  • p<0,2, lorsque n=300 (ce qui fait np<60) ;
  • 0<np<10 ;
  • p<0,1, lorsque n30 ;
  • np10 et n1500p.

L'idée commune de toutes ces propositions est d'avoir la valeur Modèle:Math stable lorsque Modèle:Math est grand et Modèle:Math petit.

Convergence vers la loi normale

Modèle:Article détaillé

convergence de la loi binomiale
Illustration de la convergence de la fonction de masse de la loi binomiale vers la loi normale lorsque Modèle:Math grandit.
Convergence

Le théorème de Moivre-Laplace, énoncé en 1733, montre qu'une variable aléatoire de loi binomiale, convenablement renormalisée, converge en loi vers une variable aléatoire de loi normale. Ce résultat peut s'énoncer grâce aux fonctions de répartition des deux lois. Considérons une variable aléatoire Modèle:Math de loi binomiale Modèle:Math, la variable aléatoire Modèle:Math renormalisée est la variable aléatoire centrée et réduite, c'est-à-dire : X𝔼(X)σX=Xnpnpq. Si l'on note Φ la fonction de répartition de la loi normale, alors :

Théorème de Moivre-Laplace : pour tout x , limn+(Xnpnpqx)=12πxet22dt=Φ(x).

Bien qu'Abraham de Moivre n'ait énoncé ce résultat que dans le cas d'une loi binomiale[50], cette convergence est généralisée dans le cas d'autres lois, c'est le théorème central limite. Ce théorème permet d'approcher une loi discrète par une loi continue, il est alors utile d'ajouter un coefficient, dit correction de continuité, afin d'améliorer les approximations futures (voir ci-dessous). La convergence précédente peut alors s'écrire sous forme d'équivalence lorsque Modèle:Math tend vers l'infini[51] : pour tout a,b

(aXb)(a12npnpqXnpnpqb+12npnpq)n+Φ(b+12npnpq)Φ(a12npnpq).

L'erreur commise par l'approximation est estimée par l'inégalité de Berry-Esseen dont la constante est régulièrement améliorée, elle fournit une borne de la différence entre les deux fonctions de répartition lorsque Modèle:Math est grand[52]Modèle:,[a 9], pour Modèle:Math une variable aléatoire de loi binomiale Modèle:Math et Modèle:Math de loi normale 𝒩(0,1) de fonction de répartition notée Φ : supx|(Xnpnpqx)Φ(x)|0,4748npq. Une expression plus détaillée de la convergence peut être donnée par la formule avec correction de continuité[22] : (Xx)=Φ(xnp+1/2npq)+𝒪(1n) uniformément pour toute variable Modèle:Math, lorsque Modèle:Math tend vers l'infini et où 𝒪() est le comparateur asymptotique. D'autres approximations plus fines ont été étudiées[53], par exemple par Laplace (1820), Prokhorov (1953) ou Peizer et Modèle:Lien (1968).

Approximation

Grâce aux théorèmes de convergence ci-dessus, lorsque Modèle:Math est grand, les probabilités de la binomiale renormalisée peuvent être approchées par les valeurs des probabilités de la loi normale. Il existe plusieurs règles sur les paramètres Modèle:Math et Modèle:Math pour que l'approximation soit valable[54]Modèle:,[49]Modèle:,[55]Modèle:,[56] :

  • n>30, np>5 et nq>5 ;
  • npq>9 ou npq>18 ;
  • np>9 et p<1/2.

L'influence de ces paramètres sur l'approximation a été finement étudiée dans les années 1990, par exemple[54] : pour Modèle:Math fixé, l'erreur absolue minimale est atteinte pour Modèle:Math ; l'erreur absolue est inférieure à 0,0212/npq.

Tables de la loi binomiale

Des tables de la fonction de masse et de la fonction de répartition de la loi binomiale ont été publiées en 1950 par le National Bureau of Standards puis en 1955 dans National of the Computation Laboratory et par Rao Modèle:Et al. en 1985[57].

Grâce aux relations de symétrie (voir ci-dessus), il suffit[26]Modèle:,[27] de donner des tables de valeurs pour p0,5.

Valeurs de la fonction de masse

Les tables de valeurs suivantes[48] donnent les valeurs de la fonction de masse de la loi binomiale Modèle:Math pour différentes valeurs de Modèle:Math.

Exemples : Si Modèle:Math suit une loi b(10;0,15), alors (X=4)0,0401. Si Modèle:Math suit une loi b(10;0,85), alors (Y=4)=(X=6)0,0012.

Modèle:Boîte déroulante/début

k/p 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,50
0 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0312
1 0,2036 0,3281 0,3915 0,4096 0,3955 0,3601 0,3124 0,2592 0,1562
2 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456 0,3125
3 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,3105
4 0,0000 0,0005 0,0022 0,0064 0,0146 0,0283 0,0488 0,0768 0,1562
5 0,0000 0,0000 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0312

Modèle:Boîte déroulante/fin

Modèle:Boîte déroulante/début

k/p 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,50
0 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0010
1 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,0403 0,0098
2 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1757 0,1209 0,0439
3 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2522 0,2150 0,1172
4 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2377 0,2508 0,2051
5 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1536 0,2007 0,2461
6 0,0000 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0,1115 0,2051
7 0,0000 0,0000 0,0001 0,0008 0,0031 0,0090 0,0212 0,0425 0,1172
8 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0043 0,0106 0,0439
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0016 0,0098
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0010

Modèle:Boîte déroulante/fin

Modèle:Boîte déroulante/début

k/p 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,50
0 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002 0,0000 0,0000
1 0,3774 0,2702 0,1368 0,0576 0,0211 0,0068 0,0020 0,0005 0,0000
2 0,1887 0,2852 0,2293 0,1369 0,0669 0,0278 0,0100 0,0031 0,0002
3 0,0596 0,1901 0,2428 0,2054 0,1339 0,0716 0,0323 0,0123 0,0011
4 0,0133 0,0898 0,1821 0,2182 0,1897 0,1304 0,0738 0,0350 0,0046
5 0,0022 0,0319 0,1028 0,1746 0,2023 0,1789 0,1272 0,0746 0,0148
6 0,0003 0,0089 0,0454 0,1091 0,1686 0,1916 0,1712 0,1244 0,0370
7 0,0000 0,0020 0,0160 0,0545 0,1124 0,1643 0,1844 0,1659 0,0739
8 0,0000 0,0004 0,0046 0,0222 0,0609 0,1144 0,1614 0,1797 0,1201
9 0,0000 0,0001 0,0011 0,0074 0,0271 0,0654 0,1158 0,1597 0,1602
10 0,0000 0,0000 0,0002 0,0020 0,0099 0,0308 0,0686 0,1171 0,1762
11 0,0000 0,0000 0,0000 0,0005 0,0030 0,0120 0,0336 0,0710 0,1602
12 0,0000 0,0000 0,0000 0,0001 0,0008 0,0039 0,0136 0,0355 0,1201
13 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0045 0,0146 0,0739
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0049 0,0370
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0148
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0046
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0011
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002

Modèle:Boîte déroulante/fin

Valeurs de la fonction de répartition

Les tables de valeurs suivantes[58] donnent les valeurs de la fonction de répartition de la loi binomiale Modèle:Math pour différentes valeurs de Modèle:Math.

Exemples : Si Modèle:Math suit une loi b(10;0,15), alors (X4)0,9901. Si Modèle:Math suit une loi b(10;0,85), alors (Y4)=(X6)=1(X5)10,9986=0,0014.

Modèle:Boîte déroulante/début

k/p 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,50
0 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0312
1 0,9774 0,9185 0,8352 0,7373 0,6328 0,5282 0,4284 0,3370 0,1875
2 0,9988 0,9914 0,9734 0,9421 0,8965 0,8369 0,7648 0,6826 0,5000
3 1,0000 0,9995 0,9978 0,9933 0,9844 0,9692 0,9460 0,9130 0,8125
4 1,0000 1,0000 0,9999 0,9997 0,9990 0,9976 0,9947 0,9898 0,9688
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Modèle:Boîte déroulante/fin

Modèle:Boîte déroulante/début

k/p 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,50
0 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0010
1 0,9139 0,7361 0,5443 0,3758 0,2440 0,1493 0,0860 0,0464 0,0107
2 0,9885 0,9298 0,8202 0,6778 0,5256 0,3828 0,2616 0,1673 0,0547
3 0,9990 0,9872 0,9500 0,8791 0,7759 0,6496 0,5138 0,3823 0,1719
4 0,9999 0,9984 0,9901 0,9672 0,9219 0,8497 0,7515 0,6331 0,3770
5 1,0000 0,9999 0,9986 0,9936 0,9803 0,9527 0,9051 0,8338 0,6230
6 1,0000 1,0000 0,9999 0,9991 0,9965 0,9894 0,9740 0,9452 0,8281
7 1,0000 1,0000 1,0000 0,9999 0,9996 0,9984 0,9952 0,9877 0,9453
8 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 0,9983 0,9893
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9990
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Modèle:Boîte déroulante/fin

Modèle:Boîte déroulante/début

k/p 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,50
0 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002 0,0000 0,0000
1 0,7358 0,3817 0,1756 0,0692 0,0243 0,0076 0,0021 0,0005 0,0000
2 0,9245 0,6769 0,4049 0,2061 0,0913 0,0355 0,0121 0,0036 0,0002
3 0,9841 0,8670 0,6477 0,4114 0,2252 0,1071 0,0444 0,0160 0,0013
4 0,9974 0,9568 0,8298 0,6296 0,4148 0,2375 0,1182 0,0510 0,0059
5 0,9997 0,9887 0,9327 0,8042 0,6172 0,4164 0,2454 0,1256 0,0207
6 1,0000 0,9976 0,9781 0,9133 0,7858 0,6080 0,4166 0,2500 0,0577
7 1,0000 0,9996 0,9941 0,9679 0,8982 0,7723 0,6010 0,4159 0,1316
8 1,0000 0,9999 0,9987 0,9900 0,9591 0,8867 0,7624 0,5956 0,2517
9 1,0000 1,0000 0,9998 0,9974 0,9861 0,9520 0,8782 0,7553 0,4119
10 1,0000 1,0000 1,0000 0,9994 0,9961 0,9829 0,9468 0,8725 0,5881
11 1,0000 1,0000 1,0000 0,9999 0,9991 0,9949 0,9804 0,9435 0,7483
12 1,0000 1,0000 1,0000 1,0000 0,998 0,9987 0,9940 0,9790 0,8684
13 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9985 0,9935 0,9423
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9984 0,9793
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9941
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9987
17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998
18 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Modèle:Boîte déroulante/fin

Tests et applications

Tests

D'une manière générale, un test statistique permet de rejeter, ou non, une hypothèse dite hypothèse nulle. L'idée principale est de prendre un échantillon et de vérifier si l'hypothèse est vraie pour chaque élément de l'échantillon. Si on considère que les éléments sont indépendants, on compte donc le nombre d'éléments vérifiant une propriété, il y a donc présence de la loi binomiale. On compare si la proportion observée est significativement éloignée de la probabilité théorique de la loi binomiale[59]. Ce test est appelé un test binomial. On peut utiliser aussi la loi normale lorsque la taille de l'échantillon est grand.

Il est possible d'effectuer un test statistique sur la conformité des valeurs des paramètres d'une loi de probabilité, notamment d'une loi binomiale, par rapport aux paramètres théoriques attendus pour la population étudiée[60]. Le test de conformité de l'indice de dispersion s'applique dans ce cas[61]. Cet indice de dispersion est le quotient de la somme des carrés des écarts et de la moyenne. Si xk,k=1n sont les valeurs étudiées de moyenne notée x¯ alors l'indice est : 1x¯k=1n(xkx¯)2. Grâce à une Loi du χ² ou une loi normale, le test rejette l'hypothèse de la valeur que prend le paramètre Modèle:Math de la loi binomiale[61].

Il est également possible de tester l'égalité de deux variables aléatoires de lois binomiales. Soient X1 et X2 deux variables aléatoires de lois respectives b(n1,p1) et b(n2,p2). On souhaite tester si p1=p2=p, c'est l'hypothèse H0 du test. Par le théorème central limite, l'estimateur p^1=X1/n1 suit une loi normale 𝒩(p1,p1(1p1)/n1) lorsque n1 est grand. Il en est de même avec p^2. En considérant l'hypothèse H0 vraie, on peut montrer que Z=p^1p^2p(1p)(1/n1+1/n2) suit une loi normale centrée réduite[62]. On rejette alors l'hypothèse H0 au niveau de confiance 0,95 si |Z|>1,96.

Autres applications

Par définition la somme de variables aléatoires indépendantes de loi de Bernoulli suit une loi binomiale. Un exemple typique de phénomène suivant une loi de Bernoulli est le lancer d'une pièce pour un pile ou face[34]. Le nombre de succès, par exemple le nombre de fois où l'on obtient pile, suit donc une loi binomiale. De nombreuses situations peuvent être modélisées par cet exemple ce qui donne son importance à la loi[34].

En génétique, lors de la reproduction, chaque gène est composée de deux allèles qui sont issus des deux parents. Soit les deux allèles proviennent du même parent, soit chaque parent transmet un allèle. Il est alors possible de faire une liste de différents allèles et de noter ces deux cas. Le nombre d'allèles issus du même parent peut être modélisé par une variable aléatoire de loi binomiale[63]. Pour savoir s'il y a égale probabilité d'allèle de même provenance ou de provenance différente, on peut étudier un test statistique[63]. Inversement, pour simuler les allèles d'un individu, il est possible de simuler les fréquences des allèles par des variables aléatoires binomiales[64].

marche aléatoire
Exemple de marche aléatoire (renormalisée). La position de la marche suit une loi binomiale.

En linguistique, la loi binomiale est utilisée pour étudier la richesse du vocabulaire d'un texte[a 10]. C'est un outil quantitatif qui permet de mesurer la fréquence d'un mot dans un texte indépendamment de la longueur du texte. Plus précisément la méthode de Müller permet d'évaluer la richesse théorique du vocabulaire d'un texte grâce au vocabulaire d'un texte plus long, et ainsi comparer avec la richesse du vocabulaire du texte court en question. Techniquement, si Na est le nombre de mots d'un texte et Nb celui d'un autre texte. Alors p=NaNa+Nb est la probabilité d'apparition d'un mot tiré au hasard dans le premier texte ; de même pour q=NbNa+Nb dans le deuxième texte[a 11]. Le nombre de mots ayant la même fréquence d'apparition dans le premier texte suit alors une loi binomiale de paramètres n=Na+Nb et Modèle:Math. Il est possible d'effectuer des tests statistiques pour conclure si la richesse du vocabulaire est grande ou non.

En 1908, Émile Borel étudie la fréquence des différents chiffres dans le développement décimal d'un nombre réel. Il considère les Modèle:Math premières valeurs de la décomposition décimale et estime la probabilité d'obtention du nombre de fois où apparaît chaque entier dans cette décomposition grâce à l'approximation par la loi normale. Il démontre ainsi le théorème des nombres normaux[a 12].

Une marche aléatoire sur est un processus stochastique (Sn,n*) à temps entier[65]. C'est-à-dire que la marche part d'une valeur initiale Modèle:Math par exemple et à chaque unité de temps, le marcheur se déplace (indépendamment du chemin parcouru avant) d'un pas vers le haut avec une probabilité Modèle:Math ou d'un pas vers le bas avec une probabilité Modèle:Math, ainsi Modèle:Math ou Modèle:Math. Modèle:Math donne la position du marcheur au bout d'un temps Modèle:Math. Si Modèle:Math, la marche est dite symétrique et le marcheur a autant de chance d'aller vers le haut que vers le bas. Dans ce cas, au bout du temps Modèle:Math, la variable aléatoire 12(Sn+n) peut prendre comme valeurs 0,1n et elle est de loi binomiale Modèle:Math. Cette considération ainsi que la convergence vers la loi normale (voir ci-dessus) permet de démontrer qu'une marche aléatoire renormalisée converge vers le mouvement brownien (voir Théorème de Donsker)[66].

Notes et références

Modèle:Références

Articles et autres sources

Modèle:Références

Voir aussi

Modèle:Autres projets

Bibliographie

Modèle:Légende plume

Articles connexes

Modèle:Colonnes

Liens externes

Modèle:Liens

Modèle:Palette Modèle:Portail Modèle:Bon article

  1. Modèle:Harvsp.
  2. Modèle:Harvsp.
  3. 3,0 3,1 et 3,2 Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées dodge287
  4. Modèle:Harvsp.
  5. 5,0 et 5,1 Modèle:Harvsp.
  6. 6,0 6,1 et 6,2 Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées bogaert50
  7. Modèle:Harvsp.
  8. Modèle:Harvsp.
  9. Modèle:Harvsp.
  10. Modèle:Harvsp.
  11. 11,0 et 11,1 Modèle:Harvsp.
  12. Modèle:Harvsp.
  13. 13,0 13,1 13,2 et 13,3 Modèle:Harvsp.
  14. Modèle:Harvsp.
  15. Modèle:Harvsp.
  16. Modèle:Harvsp.
  17. Modèle:Harvsp.
  18. Modèle:Harvsp.
  19. Modèle:Harvsp.
  20. 20,0 20,1 et 20,2 Modèle:Harvsp.
  21. 21,0 et 21,1 Modèle:Harvsp.
  22. 22,0 22,1 22,2 22,3 22,4 22,5 et 22,6 Modèle:Harvsp.
  23. 23,0 23,1 23,2 23,3 et 23,4 Modèle:Harvsp.
  24. Modèle:Harvsp.
  25. Modèle:Harvsp.
  26. 26,0 et 26,1 Modèle:Harvsp.
  27. 27,0 27,1 et 27,2 Modèle:Harvsp.
  28. 28,0 et 28,1 Modèle:Harvsp.
  29. Modèle:Harvsp.
  30. Modèle:Harvsp.
  31. 31,0 31,1 et 31,2 Modèle:Harvsp.
  32. 32,0 et 32,1 Modèle:Harvsp.
  33. Modèle:Harvsp.
  34. 34,0 34,1 et 34,2 Modèle:Harvsp
  35. Modèle:Harvsp.
  36. Modèle:Harvsp.
  37. Modèle:Harvsp.
  38. 38,0 et 38,1 Modèle:Harvsp.
  39. 39,0 et 39,1 Modèle:Harvsp.
  40. Modèle:Harvsp.
  41. Modèle:Harvsp.
  42. Modèle:Harvsp.
  43. Modèle:Harvsp.
  44. 44,0 44,1 et 44,2 Modèle:Harvsp.
  45. Modèle:Harvsp.
  46. 46,0 et 46,1 Modèle:Harvsp.
  47. 47,0 et 47,1 Modèle:Harvsp.
  48. 48,0 et 48,1 Modèle:Harvsp.
  49. 49,0 et 49,1 Modèle:Harvsp.
  50. Modèle:Harvsp.
  51. Modèle:Harvsp.
  52. Modèle:Harvsp.
  53. Modèle:Harvsp.
  54. 54,0 et 54,1 Modèle:Harvsp.
  55. Modèle:Harvsp.
  56. Modèle:Harvsp.
  57. Modèle:Harvsp.
  58. Modèle:Harvsp.
  59. Modèle:Harvsp.
  60. Modèle:Harvsp.
  61. 61,0 et 61,1 Modèle:Harvsp.
  62. Modèle:Harvsp.
  63. 63,0 et 63,1 Modèle:Harvsp.
  64. Modèle:Harvsp.
  65. Modèle:Harvsp.
  66. Modèle:Harvsp.


Erreur de référence : Des balises <ref> existent pour un groupe nommé « a », mais aucune balise <references group="a"/> correspondante n’a été trouvée