Théorème de Sanov

De testwiki
Aller à la navigation Aller à la recherche

Le théorème de Sanov est un résultat de probabilités et statistique fondamentales démontré en 1957[1]. Il établit un principe de grandes déviations pour la mesure empirique d'une suite de variables aléatoires i.i.d. dont la fonction de taux est la divergence de Kullback-Leibler.

Énoncé

Soient X1,,Xn des variables indépendantes et identiquement distribuées à valeurs dans un espace mesurable (𝒳,𝒯) distribuées selon une loi PX𝒫, où 𝒫 désigne l'ensemble des mesures de probabilités sur (𝒳,𝒯). On munit l'espace 𝒫 de la τ-topologie, i.e. la topologie engendrée par les ensembles

U(P,𝒜,ε)={P𝒫:|P(Ai)P(Ai)|<ε,i=1,,k}

avec 𝒜=(A1,,Ak) une partition de 𝒳,P𝒫 et ε>0.

On note n la mesure empirique de l'échantillon X1,,Xn, i.e. la mesure de probabilité discrète définie par

n(A)=1ni=1n𝟏A(Xi)=1ni=1nδXi(A).

La mesure empirique

n

vérifie le principe des grandes déviations dans

𝒫

équipé de la

τ

-topologie avec la fonction de Kullback-Leibler

dKL

. Autrement dit pour

Γ𝒫

,

lim infn+1nlogPX(nΓ)infPIntτΓdKL(P||PX)lim supn+1nlogPX(nΓ)infPAdhτΓdKL(P||PX)

IntτΓ

et

AdhτΓ

désignent respectivement l'intérieur et l'adhérence de

Γ

par rapport à la

τ

-topologie.

L'intérêt de ce théorème réside dans le fait que si l'on choisit un ensemble Γ𝒫 qui ne contient pas PX, on pourra affirmer que la probabilité que la mesure empirique appartienne à cet ensemble est exponentiellement décroissante.

Démonstration

Plusieurs démonstrations de ce résultat ont été établies. Dembo et Zeitouni[2] proposent dans un premier temps la démonstration du théorème de Sanov dans le cas d'un alphabet fini (théorème 2.1.10), i.e. quand |𝒳|<+ puis généralisent dans le cas des espaces polonais (théorème 6.2.10). En 2006[3], Csiszár publie une preuve simple et autonome de ce résultat. Cet article s'appuie notamment sur les outils utilisés pour la démonstration dans le cas d'un alphabet fini et réussit à l'étendre à n'importe quel espace en utilisant l'équivalence de la définition de la distance de Kullback-Leibler, à savoir

dKL(P||Q)=sup(A1,,Ak)Πi=1kP(Ai)log(P(Ai)Q(Ai)),

Π est l'ensemble des partitions finies de 𝒳. Cette équivalence est citée par Csiszár[4] qui renvoie au livre de Pinsker[5].

Notes et références

Modèle:Références

Modèle:Portail