Géostatistique intrinsèque
La géostatistique intrinsèque est la branche de la géostatistique qui étudie une variable régionalisée en la considération comme réalisation d'une fonction aléatoire. Ce passage est nommé modèle topo-probabiliste.
Ce passage n'est pas trivial. En effet, le phénomène physique étudié est le plus généralement unique. La géostatistique intrinsèque nécessite de déduire un modèle probabiliste à partir d'une seule de ses réalisations. On parle de randomisation ou d'immersion probabiliste.
Notations
Les notations usuelles sont :
- Modèle:Formule le point courant de l'espace de travail
- Modèle:Formule la variable régionalisée étudiée
- Modèle:Formule la fonction aléatoire associée à Modèle:Formule
- Modèle:Formule le champ de la variable régionalisée étudiée, généralement borné
On notera, pour une fonction aléatoire Modèle:Formule, sa moyenne sur un domaine Modèle:Formule (sous-ensemble de Modèle:Formule) : Modèle:Retrait
Concepts et propriétés utilisés
Stationnarité du modèle
Modèle:Article détaillé Stricto sensu, une variable régionalisée n'est pas sujette à des propriétés de stationnarité ; cette notion n'est pertinente que pour la fonction aléatoire dont le géostatisticien propose un modèle. Ces notions sont donc empiriques et approximatives, dépendantes du domaine et de l'échelle de travail : elles sont souvent supposées a priori, et parfois contrôlées a posteriori.
La stationnarité d'une loi est son invariance par translation. Soit un multiplet quelconque de points (de dimensions et orientation fixées), sa loi spatiale ne dépend pas du lieu de son implantation. On peut également exiger la stationnarité locale, c'est-à-dire que la fonction doit, en tout point, être stationnaire sur un voisinage de ce point (voisinage glissant Modèle:Pourquoi).
Cette hypothèse est extrêmement forte, on lui préfère en pratique la stationnarité d'ordre 2, qui requiert que les espérances des valeurs ponctuelles et des doublets de points de processus existent et soient invariantes par translation. Par rapport à la définition stricte, celle-ci ne concerne que les lois au plus bivariables, cependant elle exige l'existence des moments d'ordre 1 et 2 sur les valeurs ponctuelles. Par abus de langage, cette propriété est souvent appelée « stationnarité », et la précédente « stationnarité stricte ».
Enfin, on peut évoluer dans un modèle intrinsèque, si les accroissements Modèle:Formule sont stationnaires d'ordre 2. Il en découle l'existence de deux fonctions:
- une dérive, fonction linéaire ; le cas sans dérive est tel que ;
- un demi-variogramme, ou variogramme , et dans le cas sans dérive .
Une fonction aléatoire intrinsèque non stationnaire d'ordre 2 est dite strictement intrinsèque.
Problèmes globaux et locaux
Un problème est dit global s'il met en jeu la totalité du champ de la variable régionalisée étudiée. Il dépend à la fois de la structure intrinsèque de la variable régionalisée et de la géométrie du champ d'étude. Un tel problème se traite par la géostatistique transitive. Il est alors demandé l'homogénéité spatiale de l'implantation des données. Dans ce cas, on pourra distinguer le problème d'estimation (qui ne nécessite pas la stationnarité de la variable régionalisée, et se résout à l'aide du comportement à l'origine du covariogramme transitif), et le problème d'interprétation structurale sur la variable régionalisée (où les effets de la variable régionalisée et du champ d'étude doivent être séparés).
Un problème est dit local s'il se pose dans le voisinage d'un point d'étude. Sous la même contrainte d'homogénéité de la répartition de l'information, on construira alors des estimateurs linéaires invariants par translations; la stationnarité est celle de l'estimateur, non celle du phénomène physique.
Ergodicité
On demande généralement au processus stationnaire Modèle:Formule de satisfaire l'hypothèse d'ergodicité. On définit : Modèle:Retrait L'hypothèse d'ergodicité suppose que : Modèle:Retrait On a alors: Modèle:Retrait Modèle:Retrait
La stationnarité n'entraîne pas l'ergodicité. En pratique Modèle:Formule ne peut tendre vers l'infini. On dira que plus Modèle:Formule est faible, plus Modèle:Formule présente de signification objective. Asymptotiquement, on aura : où est la portée intégrale, qui a la dimension de l'espace (aire dans Modèle:Formule).
Tout se passe comme si l'estimateur Modèle:Formule était obtenu en prenant la moyenne de Modèle:Formule variables indépendantes de variance Modèle:Formule. Plus Modèle:Formule est grand, plus le paramètre présente de signification objective. Par conséquent, on peut supposer l'hypothèse d'ergodicité si Modèle:Formule est grand par rapport à Modèle:Formule. De plus, soit un support Modèle:Formule suffisamment grand par rapport à Modèle:Formule. On peut écrire . On peut contrôler si le modèle est correct en estimant la validité de la relation . Il existe également des modèles théoriques de portée intégrale infinie, à éviter.
Échelle de travail
L'échelle de travail est totalement absente du formalisme probabiliste, néanmoins elle détermine la manière dont le géostatisticien contrôlera a posteriori les hypothèses de stationnarité et d'ergodicité.
Support
Modèle:Article détaillé Le Modèle:Terme défini est la taille physique, caractérisée par une géométrie et une orientation, du volume sur lequel est mesurée la variable régionalisée.
Géostatistique linéaire (cas stationnaire ou intrinsèque)
La géostatistique linéaire est la partie de la géostatistique intrinsèque qui étudie des combinaisons linéaires de la fonction aléatoire Modèle:Formule considérée, qui sera prise dans la suite comme stationnaire d'ordre 2. Une telle fonction aléatoire est décrite par sa loi spatiale pour tout n-uplet de points :
En pratique, la loi spatiale est trop riche, c'est pourquoi ou se limite à la manipulation des deux premiers moments de la fonction aléatoire :
(covariance centrée)
Les espérances seront utilisées pour définir la valeur des estimateurs qui seront utilisés, et les variances comme critères de qualité de ces estimateurs[1].
Cette restriction impose de n'utiliser que des combinaisons linéaires de la fonction aléatoire étudiée, seules expressions dont on saura fournir une espérance et une variance. Une conséquence est qu'il faudra travailler sur des variables régionalisées additives (c'est-à-dire telles que toute combinaison linéaire de cette variable ait le même sens physique que la variable ponctuelle).
Malgré ces restrictions, la géostatistique linéaire possède les avantages suivants : elle est simple à mettre en œuvre, et c'est souvent la seule approche possible.
Combinaisons linéaires autorisées
Une combinaison linéaire de la fonction aléatoire est . Une mesure sur la fonction aléatoire est .
Une combinaison linéaire (respectivement une mesure) est dite autorisée (en abrégé, Modèle:Abréviation) si son espérance et sa variance sont finies.
Cas stationnaire d'ordre 2
Dans le cadre d'une fonction aléatoire stationnaire d'ordre 2, toutes les mesures sont autorisées, toutes les combinaisons linéaires sont autorisées et stationnaires. Dans ce cas, les deux premiers moments s'écrivent :
De plus, dans les hypothèses présentes, on peut simplifier l'écriture des moments :
constant dans l'espace
avec
La covariance stationnaire a les propriétés de symétrie, d'inégalité de Schwarz, de positivité. De plus, son comportement à l'origine est lié aux caractères de continuité ou de dérivabilité en moyenne quadratique de la fonction aléatoire. Par contre, à la différence du covariogramme transitif, Modèle:Formule peut ne pas être identiquement nul au-delà d'une certaine valeur de Modèle:Formule. Son intégrale Modèle:Formule n'est non plus pas forcément définie.
Cas intrinsèque
Dans l'hypothèse intrinsèque, les CLA exactement les combinaisons d'accroissement (du type ), c'est-à-dire les mesures de poids total nul : Modèle:Formule telles que Modèle:Formule. La valeur ponctuelle elle-même n'est pas une CLA.
L'espérance d'une CLA dans le cas intrinsèque sans dérive est nulle. Sa variance s'obtient comme s'il existait une covariance égale à l'opposé du variogramme : . Cela reste vrai si le variogramme n'est pas stationnaire.
Variance d'extension
Cas stationnaire d'ordre 2
Soit un domaine borné Modèle:Formule. On posera la variable aléatoire suivante, moyenne spatiale de la fonction aléatoire étudiée :
où Modèle:Formule est la mesure du domaine Modèle:Formule
La variance de Modèle:Formule s'écrit:
, qui est la version continue d'une variance de CLA
Posons maintenant deux domaines Modèle:Formule et Modèle:Formule. Comme , Modèle:Formule est un estimateur sans biais de Modèle:Formule. On appelle variance d'extension de Modèle:Formule à Modèle:Formule la variance de l'erreur d'estimation :
On écrit alors:
La variance d'extension est invariante par translation identique des deux domaines Modèle:Formule et Modèle:Formule ; c'est donc une caractéristique non-locale du modèle. Dans le cas où Modèle:Formule est un ensemble fini de points Modèle:Formule, on parle de variance d'estimation de Modèle:Formule par les prélèvements Modèle:Formule. Cependant, n'est pas une variance conditionnelle, puisque la quantité à estimer et l'estimateur y jouent un rôle symétrique. De plus, on ne peut pas en déduire d'intervalle de confiance.
Historiquement, la géostatistique s'est développé initialement pour expliquer les comportements de la variance de dispersion, ce que ne faisait pas la statistique classique.
Cas intrinsèque
On vérifie aisément que Modèle:Formule est une CLA. Alors .
On retrouve en cas particulier : .
Dispersion statistique
Cas stationnaire d'ordre 2
Soit un domaine Modèle:Formule de l'espace de travail et une partition de Modèle:Formule en Modèle:Formule sous-domaines Modèle:Formule identiques entre eux à une translation près. Nous poserons Modèle:Formule et Modèle:Formule les moyennes respectivement sur Modèle:Formule et sur Modèle:Formule de Modèle:Formule. On généralise le concept de dispersion (ou variance) grâce à la dispersion statistique de Modèle:Formule dans Modèle:Formule, donnée par : Modèle:Retrait
Par immersion probabiliste, on définit une nouvelle variable aléatoire Modèle:Formule: Modèle:Retrait
On définit la Modèle:Terme défini de Modèle:Formule dans Modèle:Formule comme l'espérance mathématique de Modèle:Formule, et on la note Modèle:Formule.
La variance de dispersion peut également s'écrire sans contrainte de partition (et même quand Modèle:Formule est un sur-ensemble de Modèle:Formule, auquel cas elle est négative) : Modèle:Retrait
On définit également la covariance de dispersion de Modèle:Formule et Modèle:Formule dans Modèle:Formule : Modèle:Retrait
On a également: Modèle:Retrait Modèle:Retrait
Il existe des phénomènes où Modèle:Formule croît indéfiniment lorsque Modèle:Formule croît. Cela oblige à proposer le cas échéant un modèle sans variance a priori.
Cas intrinsèque
On a alors : . En particulier,
Représentation glissante
La représentation glissante d'une variable régionalisée Modèle:Formule Modèle:Formule est la fonction aléatoire Modèle:Formule définie par : où Modèle:Formule est le point aléatoire uniforme sur Modèle:Formule.
En posant en outre la grandeur régionale suivante, qui est covariance de Modèle:Formule :
avec
Régularisation
La régularisation d'une variable aléatoire est sa pondération par une mesure. Soit Modèle:Formule une mesure supposée normée (Modèle:Formule), on écrit la régularisée:
Modèle:Formule est une intégrale stochastique, définie, dans le cas stationnaire d'ordre 2, ssi .
En cas d'existence, Modèle:Formule est stationnaire d'ordre 2 et de covariance .
Cela reste vrai en hypothèse intrinsèque stricte, en remplaçant alors Modèle:Formule par Modèle:Formule.
Géostatistique non-stationnaire
Dans cette partie, nous étudions les modèles locaux de non-stationnarité.
Deux techniques permettent de se ramener à une situation stationnaire:
- Krigeage universel : séparation du phénomène en deux composantes;
- géostatistique intrinsèque par les FAI-k: transformation du phénomène en phénomène stationnaire.
Géostatistique multivariable
La géostatistique multivariable s'intéresse à l'étude de plusieurs variables connues aux mêmes points (isotopie), ou en des points différant partiellement (hétérotopie). Deux approches sont possibles et équivalentes:
- selon une famille de fonctions aléatoires Modèle:Formule où Modèle:Formule et Modèle:Formule;
- selon une fonction aléatoire vectorielle Modèle:Formule où Modèle:Formule.
Dans le cas général, les variables ne peuvent pas être traitées indépendamment, même dans le cas où elles sont indépendantes. Les dépendances s'expriment au moyen de la covariance croisée :
Supposons que le cas d'une Fonction aléatoire stationnaire d'ordre 2 d'espérance nulle. Les covariances et covariances croisées sont alors toujours définies et invariantes par translation dans l'espace géographique Modèle:Formule : elles ne dépendent que du vecteur différence Modèle:Formule, et on les note Modèle:Formule. On vérifie:
- Modèle:Formule;
- Modèle:Formule pour Modèle:Formule dans le cas général; on parle de décalage ou déphasage; la symétrie peut être assurée (par exemple pour l'étude corégionalisée entre une fonction aléatoire et sa dérivée seconde), de même que l'antisymétrie (par exemple pour entre une fonction aléatoire et sa dérivée);
- Modèle:Formule (la symétrie est hermitienne dans le cas complexe);
- Modèle:Formule si Modèle:Formule et Modèle:Formule sont indépendantes;
- la matrice Modèle:Formule, de dimensions Modèle:Formule, est la matrice de variances-covariances ; on vérifie l'inégalité de Schwarz Modèle:Formule.
Notes et références
Annexes
Articles connexes
Bibliographie
- ↑ On aurait pu imaginer des estimateurs fondés sur la médiane, le maximum de vraisemblance, ou des critères basés sur des intervalles de confiance, mais les outils et le modèle dépassent alors le cadre de la géostatistique linéaire. D'autre part, la géostatistique linéaire est d'autant mieux adaptée à une étude que la fonction aléatoire traitée est proche d'une gaussienne