Stratification (Monte-Carlo)

De testwiki
Version datée du 25 février 2025 à 12:41 par imported>AstroJR (liens)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Modèle:Ébauche

Modèle:Article à sourcer Modèle:Voir homonymes En analyse, la stratification est une méthode de réduction de la variance qui peut être utilisée dans la méthode de Monte-Carlo. L'idée sous-jacente à la stratification est de décomposer le domaine d'intégration en sous-domaines, auxquels on associe une probabilité selon la fonction qu'on souhaite estimer.

Théorie

En Monte-Carlo

Modèle:Article détaillé

On souhaite estimer une quantité G, qui s'exprime sous la forme d'une intégrale :

G=abg(x)dx

On considère ici une intégration en dimension 1, mais on peut généraliser à une dimension quelconque.

Le principe de base des méthodes de Monte-Carlo est de voir l'intégrale précédente comme

G=(ba)abg(x)fX(x)dx=(ba)𝔼(g(X))

X est une variable aléatoire uniformément distribuée sur [a ; b] et fX()=1ba sa densité.

Si on dispose d'un échantillon (x1,x2,,xN), indépendant et identiquement distribué (i.i.d.) selon 𝒰([a;b]), on peut estimer G par :

g^N=(ba)Ni=1Ng(xi)

Il s'agit d'un estimateur de G non-biaisé (c'est-à-dire que 𝔼(g^N)=G) et consistant (d'après la loi des grands nombres). Sa variance est :

σg^N2=(ba)2σg2N

avec σg2 la variance de la variable aléatoire g(X)

σg2=1(ba)abg2(x)dx(1baabg(x)dx)2

L'erreur commise est alors une valeur aléatoire, suivant approximativement une loi normale centrée et de variance Var(g(X))=σg2N.

Principe de la stratification

L'idée principale de la stratification est de calculer l'intégrale sur une partition de l'intervalle [a ; b], qu'on précisera plus tard :

G=abg(x)dx=k=0makak+1g(x)dx,a=a0<a1<<am<am+1=b.

Ainsi, l'intégrale se réécrit comme une somme de probabilités conditionnelles :

G=(ba)𝔼(g(X))=(ba)k=0m𝔼(g(XX[ak,ak+1]))(X[ak,ak+1]).

En supposant que chaque loi conditionnelle de X soit simulable, et que chaque valeur pk=(X[ak,ak+1]) soit connue, on peut donc calculer chaque sous-intégrale par une méthode de Monte-Carlo à NModèle:Ind tirages, soit :

k{0;m},Gk=𝔼(g(XX[ak,ak+1]))Gk^=1Nkj=0Nkg(Xj(i)).

Estimation de l'erreur

On a ainsi une erreur égale à

e=Gk=0mpkGk^=k=0mpk(GkGk^).

Pour de grands tirages, chaque terme de l'erreur peut être approchée par une loi normale centrée. En observant que :

Var(g(X)X[ak,ak+1])=𝔼([g(X)𝔼(g(X)X[ak,ak+1])]2X[ak,ak+1])=1pk𝔼([g(X)𝔼(g(X)X[ak,ak+1])]211[ak,ak+1](X))=1pk𝔼[g(X)211[ak,ak+1](X)]1pk2𝔼[g(X)11[ak,ak+1](X)]2,

on peut en déduire que la variance de l'erreur approche k=0mpk2σk2Nk.

Il suffit de vérifier qu'on a bien l'inégalité Var(g(X))Var(G^) pour conclure à l'efficacité de la technique de réduction de la variance.

Méthodes de stratification

L'objectif est de réduire le nombre de tirages N=N0++Nm.

Une méthode simple est la stratification uniforme, réalisée en s'assurant que p0=p1==pm.

On peut également chercher à optimiser la stratification en minimisant la variance conditionnelle. Une étude de la variance montre qu'elle atteint son minimum pour

k{0;m},Nk=Npkσkl=0mplσl

soit un minimum égal à σ2=k=0mpk2σk2l=0mplσlnpkσk=1n(k=0mpkσk)2

Voir aussi

Liens internes

Références

Modèle:Références Modèle:Vide

Modèle:Portail