Loi tronquée

De testwiki
Aller à la navigation Aller à la recherche

En probabilité et en statistique, une loi tronquée est une loi conditionnelle, dérivée d'une autre loi de probabilité, où l'on ne garde que les tirages sur un intervalle défini. Plus clairement, pour une variable aléatoire X de support réel, dont la fonction de répartition est F, la loi tronquée à l'intervalle réel Modèle:Math est simplement la loi conditionnelle de Modèle:Math. Ce type de situation survient dans la censure statistique. Par exemple, pour l'étude de la durée passée au chômage, durant le temps d'observation, certaines personnes étaient déjà au chômage au début de l'étude mais retrouvent du travail dans ce laps de temps (troncature à gauche) et d'autres perdent leur emploi et restent au chômage au-delà de la fin de l'étude (troncature à droite). L'étude de la loi tronquée permet alors d'évaluer la fonction de vraisemblance.

Densité

Pour une variable aléatoire X, de support réel, et dont la fonction de répartition est F et la densité f, on peut montrer que le conditionnement de X à l'intervalle réel Modèle:Math donne :

(Xx|aXb)=(aXx)(aXb)=F(x)F(a)F(b)F(a)

avec x[a;b] et F(x)=xf(u)du. La densité g associée est

g(x)=f(x|aXb)=f(x)F(b)F(a)

pour x[a;b], 0 sinon. g est une densité, puisque

abg(x)dx=1F(b)F(a)abf(x)dx=1.


Il existe d'autres troncatures ; pour une troncature du type Modèle:Math, la densité devient

g(x)=f(x|X>y)=f(x)1F(y),

pour x>y et Modèle:Math partout ailleurs.

Pour une troncature du type Xy, la densité est :

g(x)=f(x|Xy)=f(x)F(y)

pour xy et 0 sinon.

Espérance d'une variable aléatoire tronquée

L'espérance de X conditionnellement à l'événement Modèle:Math est 𝔼(X|X>y)=11F(y)yxf(x)dx.

Soit alors a et b le support de la variable initiale, pour une fonction xu(x) de classe C1, la fonction y𝔼(u(X)|X>y) présente quelques propriétés :

  1. limya𝔼(u(X)|X>y)=𝔼(u(X)) ;
  2. limyb𝔼(u(X)|X>y)=u(b) ;
  3. y[𝔼(u(X)|X>y)]=f(y)1F(y)[𝔼(u(X)|X>y)u(y)] ;
  4. limyay[𝔼(u(X)|X>y)]=f(a)[𝔼(u(X))u(a)] ;
  5. limyby[𝔼(u(X)|X>y)]=12u(b).

On suppose bien sûr que les limites suivantes existent : limycu(y)=u(c), limycu(y)=u(c) et limycf(y)=f(c)Modèle:Mvar représente soit Modèle:Mvar ou Modèle:Mvar.

Loi normale tronquée

Loi normale centrée réduite tronquée en 2.
Comparaison de deux lois normales centrées réduites tronquées l'une en 1,5 (rouge) l'autre en 2,5 (bleue).

La loi tronquée la plus utilisée est la loi normale tronquée, obtenue à partir d'une loi normale. Elle est utilisée en économétrie dans le modèle tobit et le modèle probit, afin de modéliser respectivement les données censurées et les probabilités de choix binaire.

Si X𝒩(μ,σ2), et qu'on contraint X à appartenir à l'intervalle Modèle:Math avec a<b. Alors la densité tronquée est

f(x;μ,σ,a,b)=1σΦ(bμσ)Φ(aμσ)φ(xμσ),

φ()  est la densité de la loi normale standard et Φ()  sa fonction de répartition. On impose la convention que si b= , alors Φ(bμσ)=1 et de même, si a= , alors Φ(aμσ)=0.

Les moments pour une double troncature sont

𝔼(X|a<X<b)=μ+φ(aμσ)φ(bμσ)Φ(bμσ)Φ(aμσ)σ,
Var(X|a<X<b)=σ2[1+aμσφ(aμσ)bμσφ(bμσ)Φ(bμσ)Φ(aμσ)(φ(aμσ)φ(bμσ)Φ(bμσ)Φ(aμσ))2].

Pour une simple troncature, ces moments deviennent

𝔼(X|a<X)=μ+σλ(α)

et

Var(X|X>a)=σ2[1δ(α)]

avec α=(aμ)/σ,λ(α)=φ(α)/[1Φ(α)]etδ(α)=λ(α)[λ(α)α].

Troncature aléatoire

Considérons la configuration suivante : une valeur de troncature, disons t, est tirée au hasard, depuis une densité de probabilité Modèle:Math, non-observable. On observe alors une valeur Modèle:Mvar tirée dans la densité tronquée Modèle:Math. On souhaite, à partir de l'observation de Modèle:Mvar, mieux connaître la densité de Modèle:Mvar.

Par définition, on a déjà :

f(x)=xf(x|t)g(t)dt

et

F(a)=a[xf(x|t)g(t)dt]dx

Modèle:Mvar doit être plus grand que Modèle:Mvar, et par conséquent, lorsqu'on intègre sur Modèle:Mvar, il faut poser Modèle:Mvar comme borne inférieure.

Par le théorème de Bayes :

g(t|x)=f(x|t)g(t)f(x)

qui devient

g(t|x)=f(x|t)g(t)xf(x|t)g(t)dt

Exemple : deux variables uniformes

En supposant que t est uniformément distribuée sur [0;T] et que X|t est aussi uniformément distribuée, cette fois-ci sur [0;t]. Soit Modèle:Math et Modèle:Math les densités décrivant respectivement t et x. On suppose observer une valeur de x, et la distribution de t sachant x est

g(t|x)=f(x|t)g(t)f(x)=1t(ln(t)ln(x)) pour t>x.

Voir aussi

Références

  • Greene, William H. (2003). Econometric Analysis (5th ed.). Prentice Hall. Modèle:ISBN
  • Norman L. Johnson and Samuel Kotz (1970). Continuous univariate distributions-1, chap. 13. John Wiley & Sons.

Modèle:Palette

Modèle:Portail