Géostatistique intrinsèque

De testwiki
Version datée du 14 juin 2020 à 16:06 par imported>WikiCleanerBot (v2.02 - Correction syntaxique (Modèle finissant par }}}))
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

La géostatistique intrinsèque est la branche de la géostatistique qui étudie une variable régionalisée en la considération comme réalisation d'une fonction aléatoire. Ce passage est nommé modèle topo-probabiliste.

Ce passage n'est pas trivial. En effet, le phénomène physique étudié est le plus généralement unique. La géostatistique intrinsèque nécessite de déduire un modèle probabiliste à partir d'une seule de ses réalisations. On parle de randomisation ou d'immersion probabiliste.

Notations

Les notations usuelles sont :

On notera, pour une fonction aléatoire Modèle:Formule, sa moyenne sur un domaine Modèle:Formule (sous-ensemble de Modèle:Formule) : Modèle:Retrait

Concepts et propriétés utilisés

Stationnarité du modèle

Modèle:Article détaillé Stricto sensu, une variable régionalisée n'est pas sujette à des propriétés de stationnarité ; cette notion n'est pertinente que pour la fonction aléatoire dont le géostatisticien propose un modèle. Ces notions sont donc empiriques et approximatives, dépendantes du domaine et de l'échelle de travail : elles sont souvent supposées a priori, et parfois contrôlées a posteriori.

La stationnarité d'une loi est son invariance par translation. Soit un multiplet quelconque de points (de dimensions et orientation fixées), sa loi spatiale ne dépend pas du lieu de son implantation. On peut également exiger la stationnarité locale, c'est-à-dire que la fonction doit, en tout point, être stationnaire sur un voisinage de ce point (voisinage glissant Modèle:Pourquoi).

Cette hypothèse est extrêmement forte, on lui préfère en pratique la stationnarité d'ordre 2, qui requiert que les espérances des valeurs ponctuelles et des doublets de points de processus existent et soient invariantes par translation. Par rapport à la définition stricte, celle-ci ne concerne que les lois au plus bivariables, cependant elle exige l'existence des moments d'ordre 1 et 2 sur les valeurs ponctuelles. Par abus de langage, cette propriété est souvent appelée « stationnarité », et la précédente « stationnarité stricte ».

Enfin, on peut évoluer dans un modèle intrinsèque, si les accroissements Modèle:Formule sont stationnaires d'ordre 2. Il en découle l'existence de deux fonctions:

  • une dérive, fonction linéaire x,m(h)=𝐄[Z(x+h)Z(x)]; le cas sans dérive est tel que m(h)=0 ;
  • un demi-variogramme, ou variogramme x,γ(h)=12𝐕𝐚𝐫[Z(x+h)Z(x)], et dans le cas sans dérive γ(h)=12𝐄[(Z(x+h)Z(x))2].

Une fonction aléatoire intrinsèque non stationnaire d'ordre 2 est dite strictement intrinsèque.

Problèmes globaux et locaux

Un problème est dit global s'il met en jeu la totalité du champ de la variable régionalisée étudiée. Il dépend à la fois de la structure intrinsèque de la variable régionalisée et de la géométrie du champ d'étude. Un tel problème se traite par la géostatistique transitive. Il est alors demandé l'homogénéité spatiale de l'implantation des données. Dans ce cas, on pourra distinguer le problème d'estimation (qui ne nécessite pas la stationnarité de la variable régionalisée, et se résout à l'aide du comportement à l'origine du covariogramme transitif), et le problème d'interprétation structurale sur la variable régionalisée (où les effets de la variable régionalisée et du champ d'étude doivent être séparés).

Un problème est dit local s'il se pose dans le voisinage d'un point d'étude. Sous la même contrainte d'homogénéité de la répartition de l'information, on construira alors des estimateurs linéaires invariants par translations; la stationnarité est celle de l'estimateur, non celle du phénomène physique.

Ergodicité

On demande généralement au processus stationnaire Modèle:Formule de satisfaire l'hypothèse d'ergodicité. On définit : Modèle:Retrait L'hypothèse d'ergodicité suppose que : Modèle:Retrait On a alors: Modèle:Retrait Modèle:Retrait

La stationnarité n'entraîne pas l'ergodicité. En pratique Modèle:Formule ne peut tendre vers l'infini. On dira que plus Modèle:Formule est faible, plus Modèle:Formule présente de signification objective. Asymptotiquement, on aura : 𝐕𝐚𝐫[M*]ASσ(0)A=1σ(0)σ(h)dh est la portée intégrale, qui a la dimension de l'espace (aire dans Modèle:Formule).

Tout se passe comme si l'estimateur Modèle:Formule était obtenu en prenant la moyenne de Modèle:Formule variables indépendantes de variance Modèle:Formule. Plus Modèle:Formule est grand, plus le paramètre présente de signification objective. Par conséquent, on peut supposer l'hypothèse d'ergodicité si Modèle:Formule est grand par rapport à Modèle:Formule. De plus, soit un support Modèle:Formule suffisamment grand par rapport à Modèle:Formule. On peut écrire σ¯(v,v)=Av. On peut contrôler si le modèle est correct en estimant la validité de la relation s2(s|S)=A(1s1S). Il existe également des modèles théoriques de portée intégrale infinie, à éviter.

Échelle de travail

L'échelle de travail est totalement absente du formalisme probabiliste, néanmoins elle détermine la manière dont le géostatisticien contrôlera a posteriori les hypothèses de stationnarité et d'ergodicité.

Support

Modèle:Article détaillé Le Modèle:Terme défini est la taille physique, caractérisée par une géométrie et une orientation, du volume sur lequel est mesurée la variable régionalisée.

Géostatistique linéaire (cas stationnaire ou intrinsèque)

La géostatistique linéaire est la partie de la géostatistique intrinsèque qui étudie des combinaisons linéaires de la fonction aléatoire Modèle:Formule considérée, qui sera prise dans la suite comme stationnaire d'ordre 2. Une telle fonction aléatoire est décrite par sa loi spatiale pour tout n-uplet de points :

f({x1;...;xn};{z1;...;zn})=𝐏(Z(x1)z1;...;Z(xn)zn)

En pratique, la loi spatiale est trop riche, c'est pourquoi ou se limite à la manipulation des deux premiers moments de la fonction aléatoire :

mx=𝐄[Z(x)]

Cxy=𝐂𝐨𝐯[Z(x),Z(y)] (covariance centrée)

Les espérances seront utilisées pour définir la valeur des estimateurs qui seront utilisés, et les variances comme critères de qualité de ces estimateurs[1].

Cette restriction impose de n'utiliser que des combinaisons linéaires de la fonction aléatoire étudiée, seules expressions dont on saura fournir une espérance et une variance. Une conséquence est qu'il faudra travailler sur des variables régionalisées additives (c'est-à-dire telles que toute combinaison linéaire de cette variable ait le même sens physique que la variable ponctuelle).

Malgré ces restrictions, la géostatistique linéaire possède les avantages suivants : elle est simple à mettre en œuvre, et c'est souvent la seule approche possible.

Combinaisons linéaires autorisées

Une combinaison linéaire de la fonction aléatoire est iλiZi. Une mesure sur la fonction aléatoire est λ(dt)Z(t).

Une combinaison linéaire (respectivement une mesure) est dite autorisée (en abrégé, Modèle:Abréviation) si son espérance et sa variance sont finies.

Cas stationnaire d'ordre 2

Dans le cadre d'une fonction aléatoire stationnaire d'ordre 2, toutes les mesures sont autorisées, toutes les combinaisons linéaires sont autorisées et stationnaires. Dans ce cas, les deux premiers moments s'écrivent :

𝐄[iλiZi]=iλimi
𝐕𝐚𝐫[iλiZi]=ijλiCijλj

De plus, dans les hypothèses présentes, on peut simplifier l'écriture des moments : m(x)=m constant dans l'espace
C(x,y)=C(h) avec h=xy

La covariance stationnaire a les propriétés de symétrie, d'inégalité de Schwarz, de positivité. De plus, son comportement à l'origine est lié aux caractères de continuité ou de dérivabilité en moyenne quadratique de la fonction aléatoire. Par contre, à la différence du covariogramme transitif, Modèle:Formule peut ne pas être identiquement nul au-delà d'une certaine valeur de Modèle:Formule. Son intégrale Modèle:Formule n'est non plus pas forcément définie.

Cas intrinsèque

Dans l'hypothèse intrinsèque, les CLA exactement les combinaisons d'accroissement (du type iλi(Z(xi)Z(yi))), c'est-à-dire les mesures de poids total nul : Modèle:Formule telles que Modèle:Formule. La valeur ponctuelle elle-même n'est pas une CLA.

L'espérance d'une CLA dans le cas intrinsèque sans dérive est nulle. Sa variance s'obtient comme s'il existait une covariance égale à l'opposé du variogramme : 𝐕𝐚𝐫[iλiZi]=i,jλiγi,jλj. Cela reste vrai si le variogramme n'est pas stationnaire.

Variance d'extension

Cas stationnaire d'ordre 2

Soit un domaine borné Modèle:Formule. On posera la variable aléatoire suivante, moyenne spatiale de la fonction aléatoire étudiée :
Z¯(v)=1[v]vZ(x)dxModèle:Formule est la mesure du domaine Modèle:Formule

La variance de Modèle:Formule s'écrit:
𝐕𝐚𝐫[Z¯(v)]=1[v]2vvZ(xy)dxdy, qui est la version continue d'une variance de CLA

Posons maintenant deux domaines Modèle:Formule et Modèle:Formule. Comme 𝐄[Z¯(v)Z(v)]=0, Modèle:Formule est un estimateur sans biais de Modèle:Formule. On appelle variance d'extension de Modèle:Formule à Modèle:Formule la variance de l'erreur d'estimation :
σE2(v,v)=𝐕𝐚𝐫[Z¯(v)Z(v)]

On écrit alors:
σE2=C¯(v,v)+C¯(v,v)2C¯(v,v)

La variance d'extension est invariante par translation identique des deux domaines Modèle:Formule et Modèle:Formule ; c'est donc une caractéristique non-locale du modèle. Dans le cas où Modèle:Formule est un ensemble fini de points Modèle:Formule, on parle de variance d'estimation de Modèle:Formule par les prélèvements Modèle:Formule. Cependant, σE2 n'est pas une variance conditionnelle, puisque la quantité à estimer et l'estimateur y jouent un rôle symétrique. De plus, on ne peut pas en déduire d'intervalle de confiance.

Historiquement, la géostatistique s'est développé initialement pour expliquer les comportements de la variance de dispersion, ce que ne faisait pas la statistique classique.

Cas intrinsèque

On vérifie aisément que Modèle:Formule est une CLA. Alors σE2(v,v)=2γ¯(v,v)γ¯(v,v,)γ¯(v,v).

On retrouve en cas particulier : σE2({x},{x+h})=2γ(h),x.

Dispersion statistique

Cas stationnaire d'ordre 2

Soit un domaine Modèle:Formule de l'espace de travail et une partition de Modèle:Formule en Modèle:Formule sous-domaines Modèle:Formule identiques entre eux à une translation près. Nous poserons Modèle:Formule et Modèle:Formule les moyennes respectivement sur Modèle:Formule et sur Modèle:Formule de Modèle:Formule. On généralise le concept de dispersion (ou variance) grâce à la dispersion statistique de Modèle:Formule dans Modèle:Formule, donnée par : Modèle:Retrait

Par immersion probabiliste, on définit une nouvelle variable aléatoire Modèle:Formule: Modèle:Retrait

On définit la Modèle:Terme défini de Modèle:Formule dans Modèle:Formule comme l'espérance mathématique de Modèle:Formule, et on la note Modèle:Formule.

La variance de dispersion peut également s'écrire sans contrainte de partition (et même quand Modèle:Formule est un sur-ensemble de Modèle:Formule, auquel cas elle est négative) : Modèle:Retrait

On définit également la covariance de dispersion de Modèle:Formule et Modèle:Formule dans Modèle:Formule : Modèle:Retrait

On a également: Modèle:Retrait Modèle:Retrait

Il existe des phénomènes où Modèle:Formule croît indéfiniment lorsque Modèle:Formule croît. Cela oblige à proposer le cas échéant un modèle sans variance a priori.

Cas intrinsèque

On a alors : σ2(v|V)=γ¯(V,V)γ¯(v,v). En particulier, σ2({o}|V)=γ¯(V,V)

Représentation glissante

La représentation glissante d'une variable régionalisée Modèle:Formule Modèle:Formule est la fonction aléatoire Modèle:Formule définie par : Z(x)=z(u_+x)Modèle:Formule est le point aléatoire uniforme sur Modèle:Formule.

En posant en outre la grandeur régionale suivante, qui est covariance de Modèle:Formule : C(x,y)=1[S0]S0z(u+x)z(u+y)du
avec C(x,y)=𝐄[Z(x).Z(y)]

Régularisation

La régularisation d'une variable aléatoire est sa pondération par une mesure. Soit Modèle:Formule une mesure supposée normée (Modèle:Formule), on écrit la régularisée: Zp(x)=Z(x+t)p(dt)

Modèle:Formule est une intégrale stochastique, définie, dans le cas stationnaire d'ordre 2, ssi p(dx)Cx,yp(dy)<inf.

En cas d'existence, Modèle:Formule est stationnaire d'ordre 2 et de covariance Cp(h)=C(h+xy)p(dx)p(dy).

Cela reste vrai en hypothèse intrinsèque stricte, en remplaçant alors Modèle:Formule par Modèle:Formule.

Géostatistique non-stationnaire

Dans cette partie, nous étudions les modèles locaux de non-stationnarité.

Deux techniques permettent de se ramener à une situation stationnaire:

  • Krigeage universel : séparation du phénomène en deux composantes;
  • géostatistique intrinsèque par les FAI-k: transformation du phénomène en phénomène stationnaire.

Géostatistique multivariable

La géostatistique multivariable s'intéresse à l'étude de plusieurs variables connues aux mêmes points (isotopie), ou en des points différant partiellement (hétérotopie). Deux approches sont possibles et équivalentes:

Dans le cas général, les variables ne peuvent pas être traitées indépendamment, même dans le cas où elles sont indépendantes. Les dépendances s'expriment au moyen de la covariance croisée :

Ki,j(x;y)=𝐂𝐨𝐯[Zi(x);Zj(y)]

Supposons que le cas d'une Fonction aléatoire stationnaire d'ordre 2 d'espérance nulle. Les covariances et covariances croisées sont alors toujours définies et invariantes par translation dans l'espace géographique Modèle:Formule : elles ne dépendent que du vecteur différence Modèle:Formule, et on les note Modèle:Formule. On vérifie:

Notes et références

Modèle:Références

Annexes

Articles connexes

Bibliographie

Modèle:Portail

  1. On aurait pu imaginer des estimateurs fondés sur la médiane, le maximum de vraisemblance, ou des critères basés sur des intervalles de confiance, mais les outils et le modèle dépassent alors le cadre de la géostatistique linéaire. D'autre part, la géostatistique linéaire est d'autant mieux adaptée à une étude que la fonction aléatoire traitée est proche d'une gaussienne