Loi de Poisson

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Voir homonymes Modèle:Confusion

Modèle:Infobox Distribution statistiques

En théorie des probabilités et en statistiques, la loi de Poisson est une loi de probabilité discrète qui associe une probabilité à un nombre d'événements se produisant dans un intervalle de temps fixé, si ces événements se produisent avec une fréquence moyenne ou espérance connue, et indépendamment du temps écoulé depuis l'événement précédent.

La loi de Poisson est également pertinente pour décrire le nombre d'événements dans d'autres types d'intervalles, spatiaux plutôt que temporels, comme des segments, surfaces ou volumes.

Gravure d'un homme en costume et posé.
Siméon Denis Poisson.

Histoire

La loi de Poisson a été introduite en 1837 par le mathématicien français Siméon Denis Poisson[1], dans son ouvrage Recherches sur la probabilité des jugements en matière criminelle et en matière civile[2]. Le sujet principal de cet ouvrage consiste en certaines variables aléatoires qui dénombrent, entre autres choses, le nombre d'occurrences (parfois appelées « arrivées ») qui prennent place pendant un laps de temps donné[3].

Le nombre de voitures qui passent sur le Golden Gate dans un laps de temps donné peut être modélisé par une loi de Poisson.

Définition

Si le nombre moyen d'occurrences dans un intervalle de temps fixé est Modèle:Math, alors la probabilité qu'il existe exactement Modèle:Mvar occurrences (Modèle:Mvar étant un entier naturel, Modèle:Math) est[1] : Modèle:Retrait où :

On dit alors que Modèle:Mvar suit la loi de Poisson de paramètre Modèle:Math, noté X𝒫(λ)[4].

Par exemple, si un certain type d'événements se produit en moyenne 2,1 fois par an, pour étudier le nombre d'événements se produisant l'an prochain, on choisit comme modèle une loi de Poisson de paramètre Modèle:Math[1].

Exemple de cas d'application

La loi de Poisson s'applique à un décompte d'évènements par intervalle de temps (ou parfois par intervalle de longeur, etc.). À titre d'exemple, on peut considérer le nombre de voitures franchissant un point donné sur une route par période de T = dix minutes. La paramètre λ est le nombre moyen attendu. Pour que la loi soit applicable, on considère que les évènements (les passages des voitures) sont indépendants. La loi ne s'appliquera donc plus si des voitures roulent ensemble, en convoi, ou s'il y a un embouteillage : à ce moment les voitures interagissent et leur passage n'est plus indépendant[5].

Calcul de p(k)

Par la loi binomiale

On peut trouver l'écriture de la loi de Poisson à partir de la loi binomiale. En reprenant les mêmes notations (la période de temps est notée T, l'espérance λ), on divise la période T en n « petites » périodes égales (n>λ). En première approximation la probabilité pn d'avoir une occurrence de l'évènement pendant la période T/n vaut λ/n. On peut alors approximer p(k) par une loi binomiale : c'est la probabilité d'obtenir k succès sur les n essais :

Bn(k)=(nk)×pnk×(1pn)nk=n!k!(nk)!×(λn)k×(1λn)nk

Ce n'est cependant qu'une approximation : en effet, il existe une probabilité non nulle que deux occurrences de l'évènement surviennent pendant la même période T/n, ce qui en l'état n'est pas pris en compte par le calcul. Néanmoins, si on fait tendre n vers l'infini, cette probabilité tend vers 0. La loi de Poisson se retrouve donc comme étant la limite du calcul ci-dessus pour n très grand[6].

Pour n très grand, n!(nk)! devient équivalent à nk. On a donc, en plaçant en facteur n!k!(nk)!×(λn)kn+nkk!×λknk=λkk! :

Bn(k)n+λkk!×(1λn)nk=λkk!×(1λn)n×(1λn)k

On fait appel à l'une des définitions possibles de la fonction exponentielle :

limn(1λn)n=eλ

Par ailleurs, k étant constant :

limn(1λn)k=1

On retrouve donc l'expression de la loi de Poisson[6] :

limnBn(k)=λkk!eλ

Raisonnement par récurrence

Il peut aussi se faire de manière inductive en étudiant sur l'intervalle Modèle:Math les fonctions Modèle:Math, qui donnent la probabilité que l'événement se produise Modèle:Mvar fois sur l'intervalle de temps Modèle:Math. En utilisant la récurrence et du calcul différentiel, on parvient à retrouver les formules précédentes[7].

Propriétés

Dans toute cette section Modèle:Mvar est une variable aléatoire suivant une loi de Poisson de paramètre Modèle:Math.

Moments et fonctions génératrices

Moments ordinaires

Le premier moment ordinaire, ou espérance, d'une loi de Poisson se calcule par la série entière de l'exponentielle[8]Modèle:,[9] :

𝔼[X]=k=0+kP(X=k)=eλk=1+λk(k1)!=λeλk=1+λk1(k1)!=λeλeλ=λ

Les trois moments ordinaires suivants de la loi de Poisson sont donnés par[10] :

𝔼[X2]=λ(1+λ)𝔼[X3]=λ(1+3λ+λ2)𝔼[X4]=λ(1+7λ+6λ2+λ3)

On en déduit la variance et l'écart type[10] :

V(X)=λσ(X)=λ

Plus généralement, le Modèle:Mvar-ième moment ordinaire d'une loi de Poisson de paramètre Modèle:Math estModèle:Retraitoù Modèle:Math est le nombre de Stirling de seconde espèce de paramètres Modèle:Mvar et Modèle:Mvar.

En particulier lorsque Modèle:Math, le Modèle:Mvar-ième moment de Modèle:Mvar correspond au Modèle:Mvar-ième nombre de Bell. En effet cela est une conséquence de la formule de Dobiński.

La borne suivante majore les moments d'une loi de Poisson[11] : Modèle:Retrait Ils sont aussi reliés par la relation de récurrence[12] :Modèle:Retrait

Moments centrés

Les quatre premiers moments centrés d'une loi de Poisson sont donnés par[10]Modèle:,[12] :

𝔼[(Xλ)2]=λ𝔼[(Xλ)3]=λ𝔼[(Xλ)4]=λ(1+3λ)𝔼[(Xλ)5]=λ(1+10λ)

On en déduit l'asymétrie et le kurtosis normalisé :

γ1(X)=1/λγ2(X)=1/λ

On a la relation de récurrence[12] :Modèle:Retrait

Moments factoriels

Le Modèle:Mvar-ième moment factoriel d'une loi de Poisson est

Modèle:Retrait

(x)r=x(x1)(xr+1) désigne la factorielle décroissante.

Fonction génératrice des probabilités

La fonction génératrice des probabilités d'une loi de Poisson est[8] :

Modèle:Retrait

Fonction génératrice des moments

La fonction génératrice des moments d'une loi de Poisson est[13] :

Modèle:Retrait

Modèle:Démonstration

Diagramme en bâton

Comme toute loi de probabilité discrète, la fonction de masse d'une loi de Poisson peut être représentée par un diagramme en bâtons. Ci-dessous sont représentés les fonctions de masse (bleu) et les fonctions de répartition (rouge) des lois de Poisson de paramètres Modèle:Math = 1 ; 2 ; 3,4 et 6.

Lorsque le paramètre Modèle:Math de la loi de Poisson devient grand, (pratiquement lorsqu'il est supérieur à 5), son diagramme en bâton est correctement approché par l'histogramme d'une loi normale d'espérance et de variance égales à Modèle:Math (l'intervalle de classe étant égal à l'unité). Cette convergence était mise à profit, avant que les moyens informatiques ne se généralisent, pour utiliser la loi normale (pour lesquelles des tables de valeurs étaient largement disponibles) en lieu et place de la loi de Poisson dans certains tests[14].

Stabilité de la loi de Poisson par la somme

Si les variables Modèle:Math sont indépendantes et suivent une loi de Poisson de paramètres respectifs Modèle:Math, alors leur somme Modèle:Mvar suit une loi de Poisson de paramètre la somme des Modèle:Math[8] :

Y=(i=1nXi)𝒫(i=1nλi)

Modèle:Démonstration

Bornes de queue

Un argument de type borne de Chernoff permet de déduire des bornes de queue suivantes, c'est-à-dire de valeurs majorant la probabilité que Modèle:Mvar s'éloigne de l'espérence au delà d'un Modèle:Mvar fixé[15] :

(Xx)eλ(eλ)xxx pour tout Modèle:Math et
(Xx)eλ(eλ)xxx pour tout Modèle:Math.

Ces bornes peuvent se réécrire de la manière suivante[16]

(Xx+λ)ex22λh(xλ) pour tout Modèle:Math et
(Xx+λ)ex22λh(xλ) pour tout Modèle:Math

h(u):=2(1+u)ln(1+u)uu2 pour tout u1. Ces dernières bornes impliquent en particulier la borne suivante[16] (qui est plus faible mais plus agréable à manipuler)

(|Xλ|x)2ex22(λ+x).

La borne supérieure donnée par Chernoff peut être améliorée d'un facteur 2 au moins[17]

(Xx+λ)ex22λh(xλ)max{2,2πx2λh(xλ)} pour tout Modèle:Math.

Il est à noter que la fonction Modèle:Mvar est liée à la divergence de Kullback-Leibler entre une loi de Poisson de paramètre Modèle:Math et une loi de Poisson de paramètre Modèle:Math. En effet on a la relation

DKL(x+λ||λ)=(x+λ)ln(xλ+1)x=x22λh(xλ).

Estimation du paramètre Modèle:Math

L'estimateur par maximum de vraisemblance du paramètre Modèle:Math d'un échantillon issu d'une loi de Poisson est la moyenne empirique. C'est un estimateur convergent, sans biais, efficace, complet, exhaustif.

Simulation

Un algorithme simple pour simuler la loi de Poisson consiste à utiliser le résultat suivant :

Modèle:Théorème

La méthode de la transformée inverse permet de donner une façon simple de générer un tirage aléatoire suivant une loi exponentielle :

Si Modèle:Mvar suit une loi uniforme sur Modèle:Math, alors Modèle:Math suit une loi exponentielle de paramètre Modèle:Math.

En générant les Ei par l'intermédiaire de variables aléatoires Ui𝒰[0,1], On a ainsi Sn=1λln(inUi) et, en notant Pn:=i=1nUi,n1 : Sn1<Sn+1Pneλ>Pn+1n*

L'algorithme peut ainsi se simplifier en :

Lien avec d'autres lois de probabilités

Lien avec la loi de Bernoulli

Le décompte des événements rares se fait souvent au travers d'une somme de variables de Bernoulli, la rareté des événements se traduisant par le fait que les paramètres de ces variables de Bernoulli sont petits (ainsi, la probabilité que chaque événement survienne est faible). Le lien entre la loi de Poisson et les événements rares peut alors s'énoncer ainsi : Modèle:Théorème

L'inégalité de Le Cam précise le paradigme de Poisson : soit X1,n,X2,n,,Xan,n  un tableau de variables aléatoires de Bernoulli indépendantes, avec paramètres respectifs Modèle:Math. On note

Modèle:Retrait Modèle:Théorème Dans l'énoncé du paradigme de Poisson, on fait deux hypothèses (vagues) sur les termes d'une somme Modèle:Mvar de variables de Bernoulli :

  • les paramètres des variables de Bernoulli sont petits ; or les deux conditions ci-dessus entraînent que

Modèle:Retrait Modèle:Retrait

  • il y a un grand nombre de termes ; or les deux conditions ci-dessus entrainent que le nombre de termes tend vers l'infini :

Modèle:Retrait Modèle:Exemple

Domaines d'application

Le domaine d'application de la loi de Poisson a été longtemps limité à celui des événements rares comme les suicides d'enfants, les arrivées de bateaux dans un port ou les accidents dus aux coups de pied de cheval dans les armées (étude de Ladislaus Bortkiewicz[18]).

Mais, depuis la fin du Modèle:S-, son champ d'application s'est considérablement élargi. On l'utilise beaucoup dans les télécommunications (pour compter le nombre de communications dans un intervalle de temps donné)[19], le contrôle de qualité statistique (nombre de défauts en maîtrise statistique des procédés), la description de certains phénomènes liés à la décroissance radioactive (la désintégration des noyaux radioactifs suivant, par ailleurs, une loi exponentielle de paramètre noté aussi lambda)[20], la biologie (mutations génétiques dans l'expérience de Luria et Delbrück[21], nombre de potentiels d'actions émis par un neurone en neurosciences), la météorologie, la finance pour modéliser la probabilité de défaut d'un crédit, le Yield Management[22] (American Airlines, Lufthansa et SAS pour estimer la demande de passagers)Modèle:Etc.

La loi de Poisson est également utilisable dans le cadre sportif. Elle peut être utilisée afin d'effectuer des prédictions statistiques sur le nombre de buts inscrits lors d'un match. Les probabilités issues de ce modèle permettent aux bookmakers de définir leurs cotes[23].

En littérature

Dans le roman de Thomas Pynchon, L'Arc-en-ciel de la gravité, un des personnages, le statisticien Roger Mexico, utilise la loi de Poisson pour cartographier les zones d'impact des fusées allemandes V2 sur la ville de Londres durant la Seconde Guerre mondiale.

Dans le roman Jurassic Park de Michael Crichton, le mathématicien Ian Malcolm utilise la loi de Poisson pour modéliser la démographie d'une groupe de dinosaures et ainsi démontrer qu'il y a une anomalie dans le contrôle des naissances dans le parc.

Notes et références

Notes

Modèle:Références

Références

Modèle:Références

Voir aussi

Articles connexes

Liens externes

Modèle:Liens

Modèle:Palette Modèle:Portail


Erreur de référence : Des balises <ref> existent pour un groupe nommé « note », mais aucune balise <references group="note"/> correspondante n’a été trouvée