Identités de Bartlett

De testwiki
Version datée du 14 novembre 2022 à 01:00 par imported>Pohoua (Première identité de Bartlett : ajout de liens)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Les identités de Bartlett sont en statistique des relations concernant les moments des dérivées de la log-vraisemblance d'un modèle. Elles sont nommées en l'honneur du statisticien anglais Maurice Bartlett.

Idée générale

Considérons un modèle statistique générant des données réelles suivant une distribution de probabilité dépendant d'un paramètre θ sur lequel on souhaite faire de l'inférence. Notons Θ l'espace des paramètres et {fθθΘ} la famille des densités de probabilités associée au modèle. Puisque fθ est une densité de probabilité, son intégrale sur doit être égale à 1: fθ(x)dx=1.

Différencier cette égalité par rapport à θ permet d'obtenir de nouvelles relations. Le terme de droite étant égal à 1, ses différentielles sont toutes nulles. Le terme de gauche est une intégrale paramétrique et il est souvent possible (sous certaines hypothèses qui doivent être soigneusement vérifiées) d'intervertir intégral et dérivée, de sorte que kθkfθ(x)dx=kθkfθ(x)dx. On obtient alors que pour tout k*, kθkfθ(x)dx=0.

Ces relations donnent les identités de Bartlett lorsqu'on développe la dérivée k-ième. Elles sont généralement exprimées en utilisant la log-vraisemblance log(fθ) et ses dérivées[1].

Première identité de Bartlett

Reprenons les notations précédentes et supposons qu'il est possible d'intervertir dérivée et intégrale pour différencier l'égalité fθ(x)dx=1. Pour raccourcir les notations, notons lθ(x)=log(fθ(x)) la log-vraisemblance du modèle.

On obtient alors queθfθ(x)dx=0. En remarquant que 1fθ(x)fθθ=lθθ(x), cette égalité peut se réécrire lθθ(x)fθ(x)dx=0.

Comme cette dernière intégrale correspond à l'espérance de

lθθ(X)

lorsque

X

est distribuées selon

fθ

, la première identité de Bartlett s'écrit

𝔼[lθθ(X)]=0

où l'espérance est prise sur une variable aléatoire dont la loi a pour densité

fθ

.

La fonction lθθ(x), souvent appelée fonction score, joue un rôle crucial dans l'estimation et les tests statistiques. La première identité de Bartlett indique que le score est d'espérance nulle. Cela garantie entre autres que l'estimateur du maximum de vraisemblance associé est convergent au sens de Fisher.

Seconde identité de Bartlett

Reprenons la première identité de Bartlett sous sa forme intégrale : lθθ(x)fθ(x)dx=0 et différencions la par rapport à θ en supposant, encore une fois, qu'il est possible d'intervertir dérivée et intégrale. Supposons que θ est réel, on obtient alors

(2lθθ2(x)fθ(x)+lθθ(x)θfθ(x))dx=0.

Séparons l'intégrale en deux et en réutilisons le fait que 1fθ(x)fθθ=lθθ(x) pour arriver à l'égalité suivante:

2lθθ2(x)fθ(x)dx=(lθθ(x))2fθ(x)dx.

Les deux termes de cette égalités correspondent à des espérances. Le terme de gauche est l'espérance de 2lθθ2(X) lorsque X a pour densité fθ, et le terme de droite est l'espérance de (lθθ(X))2. Cette espérance correspond à la variance du score lθθ(X) puisque, d'après la première identité de Bartlett, ce dernier est d'espérance nulle. La deuxième identité de Bartlett peut donc s'écrire :

var[lθθ(X)]=𝔼[lθ2θ2(X)]

Où l'espérance et la variance sont prises sur une variable aléatoire X ayant pour densité fθ.

Cette identité reste vraie lorsque θ est un vecteur. La variance est simplement remplacée par la matrice de variance-covariance, et la dérivée partielle seconde par rapport à θ de log(fθ(x)) par sa matrice hessienne.

La quantité var[θlθ(X)] (ou la matrice dans le cas multivarié), généralement notée I(θ), est l'information de Fisher du modèle et joue un rôle important en statistique. Elle permet, entre autres, de calculer la borne de Cramér-Rao ou la loi a Modèle:Lien en statistiques Bayésiennes. La seconde identité de Bartlett donne un moyen alternatif de calculer cette information de Fisher en utilisant la dérivée seconde de la log-vraisemblance, ce qui est parfois plus simple que de calculer la variance du score θlθ(X).

Identités d'ordre supérieur

Troisième identité

En dérivant la seconde identité de Bartlett par rapport à θ, on obtient, après quelques simplifications, la troisième identité de Bartlett:

𝔼[(θlog(fθ(X)))3]=3Iθ(θ)+2𝔼[3θ3log(fθ(X))]

I(θ)=var[θlog(fθ(X))]=𝔼[2θ2log(fθ(X))]est l'information de Fisher.

Quatrième identité

Une différentiation supplémentaire donne la quatrième identité de Bartlett:

𝔼[(lθθ(X))4]3I(θ)2=62Iθ2(θ)+8θ𝔼[3lθθ3(X)]3𝔼[4lθθ4(X)]+3var[2lθθ2(X)].

Exemple

Considérons des données issues d'une loi normale d'espérance μ et d'écart-type σ. Notons θ=(μ,σ) le vecteur formé par ces deux paramètres. La log-vraisemblance associée à une observation x générée par ce modèle est donnée par :

l(x;θ)=log(2π)log(σ)12(xμσ)2.

Commençons par calculer le score, c'est-à-dire la dérivée de la log-vraisemblance :

lθ(x;θ)=(xμσ2;1σ+(xμ)2σ3)T.

Calculons l’espérance du score :

𝔼[lθ(X;θ)]=(𝔼[X]μσ2;1σ+𝔼[(Xμ)2]σ3)T

En utilisant que 𝔼[X]=μ et 𝔼[(Xμ)2]=σ2, on obtient que E[lθ(X,θ)]=0. La première identité de Bartlett est bien vérifiée.

Si l'on dérive une seconde fois la log-vraisemblance, on obtient la matrice Hessienne suivante :

2lθ2(x;θ)=(1σ22xμσ32xμσ31σ23(xμ)2σ4).

On obtient donc que

𝔼[2lθ2(x;θ)]=(1σ2002σ2)

La seconde identité de Bartlett, var[lθ(X,θ)]=𝔼[2lθ2(X,θ)], indique donc que

var[lθ(X,θ)]=(1σ2002σ2).

Il est possible de calculer directement la variance du score, mais ce calcul peut se révéler plus fastidieux et utilise des résultats non triviaux tels que cov(Xμ;(Xμ)2)=0 ou var((Xμ)2)=2σ4.

Utilisation

La seconde identité de Bartlett est communément utilisée pour trouver la borne de Cramér-Rao associée à un estimateur ou pour calculer sa variance asymptotique.

Les identités de Bartlett jouent aussi un rôle dans la réduction de biais[2] d'estimateurs paramétriques. Cette réduction de biais se fonde sur un développement limité des équations d'estimation et fait intervenir les espérances des dérivées de la log-vraisemblance.

Notes et références

Modèle:Références

Modèle:Portail