Академический Документы
Профессиональный Документы
Культура Документы
9- Gostatistique
9.1 Introduction
Lorsquon mesure une caractristique en un point, on peut considrer la valeur obtenue comme la ralisation dune variable
alatoire en ce point. Il en est de mme pour tous les points dun site donn. On a donc un grand nombre (ou une infinit) de
v.a. reprsentant conjointement un site. La gostatistique adopte ce point de vue et considre la distribution conjointe de
toutes ces v.a.
9.2. Le variogramme
Ide fondamentale: La nature n'est pas entirement "imprvisible". Deux observations situes l'une prs de
l'autre devraient, en moyenne, se ressembler davantage (i.e. tre plus corrles) que deux
observations loignes.
Ex. Soit trois localisations x0, x1 et x2, que l'on dplace par translation sur le site. On mesure la valeur en chacun de
ces points.
x1 x0 x2
La valeur au point x1 devrait ressembler plus (en moyenne) celle observe en x0 qu' celle en x2.
Supposons maintenant que lon connat uniquement la valeur aux points x1 et x2. On a peut-tre intrt utiliser
l'information contenue en x1 et x2 pour fournir une bonne estimation de la valeur en x0.
La diffrence entre les valeurs prises par ces deux v.a. est Z(x) - Z(x+h). C'est galement une v.a. dont on peut
calculer la variance. Cette variance devrait tre plus petite lorsque les points sont rapprochs (les valeurs se
ressemblent plus en moyenne) et plus grande lorsque les points sont loigns. On appelle variogramme la demi-
variance de cette diffrence, i.e. (x,x+h)=0.5*Var(Z(x)-Z(x+h))
Si lon considre n localisations diffrentes x1,x2...xn, la meilleure description que l'on puisse faire des n variables
alatoires Z(x1), Z(x2),...Z(xn) est d'tablir la fonction de distribution conjointe (multivariable). Clairement, ceci n'est
pas possible puisqu'on ne peut disposer gnralement que d'une seule observation chacun de ces n points. On
pourrait formuler une hypothse trs forte du genre: le vecteur des v.a. suit une loi multinormale de moyennes et
variances-covariances spcifies. Ceci serait beaucoup trop restrictif.
La gostatistique a des vises plus modestes. On veut estimer des paramtres statistiques partir des donnes et non
imposer un modle priori qui aurait toutes les chances de s'avrer inadquat. Les paramtres que l'on cherchera
estimer ne sont pas la fonction de distribution conjointe, ni mme la fonction de distribution bivariable (i.e. les v.a.
considres deux deux) mais simplement les deux premiers moments (moyenne, variance, covariance) des v.a.
prises deux deux. Mme rduit cela, on ne dispose toujours que d'une seule paire d'observations situes
prcisment aux points x et x+h. On ne peut donc estimer les paramtres statistiques sans formuler certaines
hypothses. Ces hypothses ont uniquement pour but de permettre l'estimation des paramtres statistiques de notre
modle partir des donnes. On les appelle hypothses de stationnarit du second ordre; elles visent essentiellement
"dtacher" les deux premiers moments de localisations prcises en permettant des translations des emplacements x
et x+h. La covariance (et le variogramme) deviennent donc des fonctions dpendant uniquement de la distance
sparant les points d'observation et non plus de leur localisation exacte.
i.e. 1/2 Var(Z(x)-Z(x+h)) = (h); hypothse intrinsque (cette dernire hypothse est lgrement moins restrictive
que la stationnarit du second ordre)
videmment, ces hypothses supposent une certaine rgularit, une certaine homognit du gisement tudi. Si on
peut reconnatre des zones trs diffrentes gologiquement, on a habituellement intrt les traiter sparment.
9- Gostatistique 3
La fonction la plus utilise en gostatistique pour dcrire la continuit de la minralisation est le variogramme, et ce
surtout parce qu'elle est plus simple estimer que la covariance (qui demande l'estimation pralable de l'esprance
mathmatique), mais galement parce qu'elle permet d'accommoder les situations ou Var(Z(x)) n'est pas dfinie.
1 1
[
(h)= Var[Z(x) - Z(x + h)] = E (Z(x) - Z(x + h))2
2 2
]
o x est le vecteur de coordonnes (1, 2 ou 3 coordonnes selon le cas)
h est le vecteur distance .
i. Porte a : Distance o deux observations ne se ressemblent plus du tout en moyenne, elles ne sont plus lies
(covariance nulle) linairement. cette distance, la valeur du variogramme correspond la variance
de la variable alatoire.
iii. Effet de ppite : C0: Variation trs courte chelle, erreurs de localisation, erreurs d'analyse et prcision
analytique.
Ex. Une carotte fendue en deux et dont chaque partie est analyse sparment ne
fournira pas exactement les mmes valeurs pour les deux moitis. Un mme
paquet de poudre, spar en deux parties pour analyse ne donnera pas exactement
la mme teneur.
Notes : i. Lorsque h = 0 on a
1
(0) = Var ( Z(x) - Z(x) ) = 0 et non C o
2
par contre,
l im ( ) = Co
0 +
ii. Parfois les variogrammes ne montrent pas de palier (dans ce cas, la covariance et la variance n'existent pas).
iii. Lorsque les variogrammes montrent un palier alors on peut facilement tablir le lien entre la valeur du
variogramme pour la distance h et la covariance pour deux observations spares de h.
9- Gostatistique 4
1
(h) = Var ( Z(x) - Z(x + h) )
2
1
= [ Var ( Z(x) ) + Var ( Z(x + h) ) - 2 Cov ( Z(x) , Z(x + h) )
2
= 2 - Cov ( Z(x) , Z(x + h) ) = 2 - C(h)
donc,
(h) = 2 - C(h)
C(h) est appel la fonction de covariance de Z. Cette relation est importante et elle est continuellement utilise en
gostatistique.
On voit que lorsque la porte est atteinte, il n'y a plus de covariance entre les v.a., i.e. C(h) = 0 si h a.
Lorsqu'il y a un palier, les deux fonctions sont quivalentes en ce sens qu'elles fournissent la mme information sur
le processus.
Palier (C0+C)
(h)
C0 Porte (a)
distance h
9- Gostatistique 5
N (h )
1
e (h) =
2 N(h)
[Z(xi ) - Z(xi + h)] 2
i =1
Pour un champ donn, rien n'assure que la continuit soit identique dans toutes les directions. Par exemple, il se
pourrait que des teneurs montrent une meilleure continuit paralllement la stratigraphie que perpendiculairement
celle-ci. De mme, pour la contamination par des hydrocarbures, on pourrait observer une meilleure continuit
horizontalement que verticalement en raison de la gravit. Si le nombre d'observations le permet (typiquement au
moins 50, prfrablement 100), on peut chercher vrifier ce point en calculant le variogramme exprimental dans
diffrentes directions.
N ( h ,)
1
e (h, ) =
2 N(h, )
[Z(xi ) - Z(xi + h)] 2
i =1
En pratique on s'accorde une tolrance sur h et sur afin d'avoir suffisamment de paires pour chaque h et chaque .
Pour chacune des classes ainsi formes, on calcule la distance moyenne sparant les extrmits des paires (abscisse)
et on value le variogramme exprimental pour chaque classe. On obtient donc une srie de points exprimentaux
auxquels on cherche ajuster un modle (i.e. expression analytique) permettant de dduire la covariance entre deux
points quelconque en fonction de leur espacement gographique (et, ventuellement, de la direction qu'ils
dfinissent). Une fois le modle adopt, toute la suite des calculs se fait avec les valeurs obtenues du modle et non
avec les valeurs exprimentales.
La figure suivante illustre quelques exemples de surface et le variogramme exprimental correspondant. Les
simulations ont t ralises avec GSLIB-SGSIM, en imposant les valeurs 0, 2 , 2 et 4 aux 4 coins. De haut en
bas, on a simul un gaussien de porte 25, un sphrique de porte 25, un sphrique avec 20% deffet de ppite et
porte 25, un sphrique avec 80% deffet de ppite et porte 25. Comme on le voit, le variogramme exprimental
dcrit bien le degr d'irrgularit des surfaces.
9- Gostatistique 6
Variogramme
5 2
z(x,y)
0
-5 1
20
20
10 10
0
y 0 0 x 0 2 4 6 8 10
distance (h)
Variogramme
5 2
z(x,y)
0
-5 1
20
20
10 10
0
y 0 0 x 0 2 4 6 8 10
distance (h)
3
Variogramme
5 2
z(x,y)
0
-5 1
20
20
10 10
0
y 0 0 x 0 2 4 6 8 10
distance (h)
3
Variogramme
5 2
z(x,y)
0
-5 1
20
20
10 10
0
y 0 0 x 0 2 4 6 8 10
distance (h)
9- Gostatistique 7
Exemple numrique
Soit une matrice de donnes 3 x 3 ayant les valeurs suivantes (la distance horizontale et verticale entre 2 lments
conscutifs est de 1 m et NaN indique une donne manquante).
3 6 5
7 2 2
4 NaN 0
h g(h) N(h)
1 4.375 4
2 7.5 3
Note: g(1)=0.5/4*[(3-6)2+(6-5)2+(7-2)2+(2-2)2]
h g(h) N(h)
1 5.4 5
2 6.5 2
h g(h) N(h)
1.41 2.33 3
2.82 0.5 1
0123210
3102120
Ces deux sries ont mme moyenne et mme variance, toutefois clairement elles n'ont pas le mme degr de
continuit spatiale, la 1re srie tant nettement plus continue que la seconde. Voyons leur variogramme:
h g(h) - 1re srie g(h) - 2e srie
1 0.5 1.25
2 1.6 1.2
3 2.5 1.13
Le variogramme de la 1re srie montre une croissance soutenue alors que la seconde srie montre un variogramme
peu prs constant un niveau prs de la variance exprimentale (1.06).
9- Gostatistique 8
9.2.3 Modlisation
Les modles sont des expressions analytiques que l'on tente d'ajuster le mieux possible aux points des variogrammes
exprimentaux.
Toute fonction ne peut tre utilise comme modle. Soit une somme quelconque de variables alatoires (plus
gnralement, une combinaison linaire de telles v.a.), la variance de cette combinaison est ncessairement positive
(une variance est, par dfinition, toujours positive). Or cette variance peut s'exprimer en fonction du covariogramme
(modles avec palier) ou du variogramme (modles avec palier ou sans palier pourvu que la somme des poids de la
combinaison linaire donne 0). Il faut donc que la fonction de covariance ou le variogramme assure des variances
positives quelle que soit la combinaison des v.a. considre.
Bref, soit une combinaison linaire i Zi . Dans le cas stationnaire (variogramme avec palier),
i
Var( i Z i ) = i j Cov( Z i , Z j ) = i j C ( hi , j ) 0
i i j i j
Dans le cas intrinsque (variogramme sans palier)
La vrification de l'admissibilit d'un modle donn est relativement complexe et dpasse le cadre de ce cours. Dans
la pratique on se limite des modles prouvs et des modles construits partir de modles prouvs en utilisant
des proprits comme :
- une combinaison linaire (avec coefficients positifs) de variogrammes admissibles donne un modle admissible;
- un produit de modles de covariance admissibles donne un modle de covariance admissible;
- un modle admissible en Rp est admissible en Rp-1 (linverse nest pas ncessairement vrai).
- Effet de ppite.
- Puissance (cas particulier : linaire).
- Sphrique.
- Gaussien.
- Exponentiel.
On peut combiner plusieurs modles en les additionnant. Ainsi, l'effet de ppite est presque toujours prsent en
association avec un ou plusieurs des autres modles dcrits plus haut. Il est important de noter que ces cinq modles
ne sont pas les seuls que l'on peut utiliser, en ralit, il en existe un trs grand nombre.
Il y a un lien troit entre la nature de la variable tudie et le type de modle que lon est susceptible de rencontrer.
Ainsi, le modle gaussien exprime une trs grande continuit typique dune variable comme la topographie,
lpaisseur dune formation, le champ gravimtrique, la charge hydraulique. Ce modle nest pratiquement jamais
rencontr pour des variables comme les teneurs de gisement, les proprits mcaniques des roches, les analyses
gochimiques en gnral. Pour ces variables, les modles sphrique et exponentiel sont beaucoup plus courants. Pour
des variables discrtes, le modle gaussien est mme proscrire compltement car incompatible avec ce genre de
variables.
Notes :
i. Lorsque h = 0, par dfinition (0)=0.
Lorsque h = 0+, alors (h)=C0.
L'effet de ppite se prsente donc comme une discontinuit l'origine du variogramme. Leffet de ppite
peut reprsenter des erreurs danalyse (voir thorie dchantillonnage de P. Gy), de relles micro-structures
ou/et des structures dune certaine taille non-dtectes par un chantillonage insuffisant.
ii. Parfois les variogrammes ne montrent pas de palier (cas du modle linaire). Dautre fois ils ne montrent
qu'un palier atteint asymptotiquement (cas des modles exponentiel et gaussien). Dans ce dernier cas, lon
dfinit la porte effective comme la distance o est atteint 95% du palier. Ainsi, pour les modles
exponentiel et gaussien, la porte effective est "a". Lorsque le variogramme ne montre pas de palier et que
sa croissance seffectue un taux suprieur h2 alors il y a lieu de suspecter une drive de la moyenne
(i.e. lhypothse stationnaire ou intrinsque ne tient pas).
100 100
g(h) g(h)
0 0
0 100 200 0 100 200
h h
200 sphrique 200 gaussien
100 100
g(h) g(h)
0 0
0 100 200 0 100 200
h h
200 exponentiel
100
g(h)
0
0 100 200
h
9- Gostatistique 10
9.2.3.1 Anisotropies
La continuit spatiale n'est pas ncessairement la mme dans toutes les directions.
ex. - gisement prsentant une forme lenticulaire; on peut avoir une meilleure continuit selon l'allongement
principal des lentilles;
- gisement stratiforme; meilleure continuit paralllement aux strates que perpendiculairement.
- placer; meilleure continuit le long des palochenaux que perpendiculairement.
- etc.
Bien que dans la nature il existe une trs grande varit d'anisotropies, en gostatistique, on ne peut modliser
aisment que les anisotropies gomtriques. Les autres anisotropies peuvent tre approches en combinant plusieurs
modles isotropes ou avec anisotropie gomtrique.
Anisotropie gomtrique
Caractristiques :
- On observe dans diverses directions des paliers et des composantes ppitiques identiques mais des
portes diffrentes.
- Les portes maximales (ag) et minimales (ap) s'observent selon deux directions orthogonales.
- On peut rendre les portes identiques (et gales ag suivant toutes les directions en multipliant la
composante de la porte parallle ap par le facteur (ag/ap). Bref, les portes dcrivent une ellipse dont
l'axe majeur est orient paralllement ag.
i.e.
(a cos )2 (a sin )2
+ =1
a g2 a 2p
Connaissant ag et ap, on peut trouver a , o dsigne l'angle mesur par rapport la direction o est rencontr ag.
a ga p
a =
{a 2 2 2 2 1/ 2
p cos + a g sin }
Exemple:
Un gisement 2D est modlis par un modle avec anisotropie gomtrique. Le modle est sphrique avec C=17%2 et
effet de ppite C0=13%2 et les portes sont de 100m dans la direction (convention trigonomtrique) de plus grande
continuit (30o) et 60m dans la direction de plus petite continuit (120o). Quelle est la valeur du variogramme entre
deux observations situes aux coordonnes (x1,y1)=(10,30) et (x2,y2)=(40,20)
h=((20-30)2+(40-10)2)1/2=31.62m
y y1 10
= arctan 2 = arctan = 18.4
o
x 2 x1 30
Cette direction forme un angle de 48.4o avec la direction de plus grande continuit.
9- Gostatistique 11
100 * 60
a = = 70.81m
1/ 2
{ }
60 2 cos 2 ( 48.4) + 100 2 sin 2 ( 48.4)
On calcule la valeur du variogramme en utilisant lquation du modle sphrique pour la distance plus haut et
avec la porte 70.81m:
3
31.62m 31.62m
( 31.62m) = 13% 2 + 17% 2 * 1.5 * 0.5 * = 23.63% 2
70.81m 70.81m
a) Le facteur danisotropie gomtrique obtenu avec les variogrammes exprimentaux sous estime en gnral le
vritable facteur danisotropie en raison de lutilisation dune fentre angulaire et du fait que les variogrammes
exprimentaux ne sont pas ncessairement orients exactement selon les directions principales de lellipse
danisotropie.
- On accorde plus de poids aux points du variogramme exprimental calculs avec beaucoup de paires.
- On essaie davoir N(h) 30 pour chaque point exprimental du variogramme. Si ce nest pas possible pour
certaines classes, on accorde moins dimportance ces points. Si le nombre de paires est trs faible (10), on ne
considre plus du tout le point.
- On accorde plus de poids aux premiers points du variogramme (h petit) car ce sont ces valeurs qui ont le plus
d'impact dans les calculs gostatistiques.
- Lorsque h dpasse environ dmax/2, on ne tient pas compte des valeurs du variogramme. dmax est la taille du
phnomne tudi dans la direction considre.
- On cherche obtenir des modles les plus simples possible qui rendent bien compte des valeurs exprimentales.
- Calculer les variogrammes directionnels selon diffrentes directions (ex. 0, 45, 90, 135) ainsi que le
variogramme omnidirectionnel (i.e. sans tenir compte de la direction).
La gologie peut apporter une information prcieuse dans le choix des directions et la prsence ou non
d'anisotropies.
- Vrifier les critres ci-dessus : N(h) 30, h < dmax/2
- Si ncessaire, augmenter la tolrance angulaire ou le pas de calcul de faon augmenter N(h).
9- Gostatistique 12
- Dterminer s'il y a anisotropie (diffrences de palier ou de portes qui ne peuvent raisonnablement tre imputes
des fluctuations alatoires du variogramme).
- Procder l'ajustement d'un modle anisotrope ou isotrope selon le cas (habituellement par essai et erreur, bien
que l'on puisse aussi obtenir ces ajustements de faon automatique par rgression (pondre, et souvent, non-
linaire).
- Chercher respecter la rgle de la parcimonie: adopter les modles les plus simples possibles qui permettent un
ajustement adquat. Comparer des modles concurrents l'aide de la technique de validation croise.
Soit une v.a. Zv que l'on veut estimer (ici lindice v indique que lon sintresse lestimation dun bloc, si v est 0
alors on estime un point), d'une faon ou d'une autre, en formant une combinaison linaire des valeurs observes en
diffrents endroits, i.e.
n
Z*v = i Zi (1)
i =1
o:
Zi : valeur observe au point xi (v.a.)
Zv* : estimateur de Zv
e = Z v Z v*
Substituant Zv* par son expression, en fonction des Zi , donne en (1), on obtient:
( ) ( ) (
e2 = 2 - (v, v) + i j 2 - ( xi - x j ) - 2 i 2 - ( xi , v) )
i j i
e2 = 2 i ( xi , v) - (v, v) - i j ( xi , x j ) (3)
i i j
On peut calculer la variance d'estimation soit en utilisant le covariogramme (2) ou le variogramme (3). Dans les cas
de modles sans palier, seul le variogramme peut tre utilis pourvu que i = 1 dans (1).
i. Dans les formules prcdentes (2 et 3), on reconnat 3 termes : 1 terme li au bloc estimer (Var(Zv) ou
( v , v ) ), 1 terme li aux points servant lestimation (Cov(Zi,Zj) ou ( x i , x j ) ) et 1 terme crois entre
les points servant lestimation et le bloc estimer (Cov(Zi,Zv) ou ( x i , v ) .
ii. La variance de l'erreur d'estimation est une mesure de la prcision de l'estimation. On pourrait vouloir
choisir les i de faon ce que e2 soit minimale. C'est ce que nous ferons plus tard avec le krigeage.
iii. La variance destimation est une mesure de prcision obtenue, en moyenne, sur lensemble du gisement
pour une mme configuration points-bloc. On constate en effet que la variance destimation peut tre
calcule ds que lon connat le variogramme (ou le covariogramme), lemplacement des points de donnes
et le bloc estimer. La variance destimation ne permet donc pas de tenir compte du fait que certaines
portions pauvres du gisement sont peut-tre plus faciles estimer que des zones haute teneur (effet
proportionnel rencontr par exemple avec des distributions lognormales). On peut en tenir compte par
l'emploi d'un variogramme relatif (norm par la moyenne locale au carr). Toutefois l'estimation du
variogramme relatif est souvent dlicate. Les mthodes non-linaires et les simulations permettent de mieux
tenir compte de ce facteur.
Ex. Soit x1, x2 et x3 trois points chantillonns que l'on veut utiliser pour estimer la valeur inconnue au point x0.
x1
x2 x0 x3
x0 x1 x2 x3
x0 0 1.4 1 2
x1 0 1 3.2
x2 0 3
Supposons que le variogramme est un modle linaire avec pente unitaire et effet de ppite gal 1, i.e.:
(h) = 1 + h
Z *0 = Z 2
2 = 2 ( x 0 , x 2 ) - ( x 0 , x 0 ) - ( x 2 , x 2 )
= 2 (1 + 1) - 0 - 0 = 4
b) Inverse de la distance
1/ d 1 = 1/1.4 1/ d 2 = 1 1/ d 3 = 1/2
1/ d
i
i = 2.21
2 = 2 i ( xi , x0 ) - ( x0 , x0 ) - i j ( xi , x j )
i i j
2.7
Ici l'inverse de la distance est trs suprieur la mthode polygonale en terme de variance d'estimation.
c) krigeage
Par krigeage, on aurait obtenu 1=.25, 2=.43, et 3=.32. Le calcul de la variance d'estimation donne alors 2 2.65,
une amlioration ngligeable par rapport l'inverse de la distance.
9.4 Krigeage
Puisqu'on peut calculer la variance d'estimation pour tout estimateur linaire, pourquoi ne pas choisir celui qui assure
la variance d'estimation minimale? C'est prcisment ce qu'effectue le krigeage. Dans le cas stationnaire, on en
reconnat 2 types principaux, selon que la moyenne du processus est connue ou non, soit le krigeage simple et le
krigeage ordinaire. Ce dernier est, de loin, le plus frquemment utilis.
9- Gostatistique 15
Supposons que l'on veuille estimer un bloc v centr au point x0. Notons Zv la vraie valeur (inconnue) de ce bloc et
Zv* l'estimateur que l'on obtient.
La variance d'estimation minimale, appele variance de krigeage, est obtenue en substituant les quations de
krigeage dans l'expression gnrale pour la variance d'estimation:
9- Gostatistique 16
n
2k = Var[ Zv] - i Cov[ Zv , Zi] -
i =1
Note: Cette variance de krigeage ne dpend pas des valeurs observes, elle ne dpend que du variogramme et de la
configuration des points servant l'estimation par rapport au point (ou bloc) estimer.
Comme la variance d'estimation s'crit aussi directement en terme du variogramme, on peut aussi crire le systme
de krigeage en fonction du variogramme. Ceci tient au fait que C(h) = 2 - (h) et que i=1.
n
j (xi , x j) = (v, xi) i = 1...n
j=1
n
j =1
j =1
et , alors
n
2k = i ( v, x i) ( v, v) -
i =1
Il est intressant de visualiser le systme de krigeage ordinaire et la variance de krigeage ordinaire sous forme
matricielle:
Koo = ko
2k o = 2v ' o k o
o
2 Cov( Z1 , Z 2 ) Cov( Z1 , Z n ) 1
Cov ( Z 2 , Z 1 ) 2 Cov( Z 2 , Z n ) 1
Ko =
Cov( Z n , Z1 ) Cov( Z n , Z 2 ) 2 1
1 1 1 0
Cov( Z1 , Z v ) 1
Cov( Z 2 , Z v ) 2
ko = , o =
Cov( Z n , Z v ) n
1
Note : tous les termes Cov(Zi,Zv) et Var(Zv) sobtiennent directement du variogramme par intgration numrique
considrant que Z v = 1
v Z( x )dx o x dsigne une localisation dans le bloc v . Profitant de la
v
linarit de loprateur esprance, on montre que :
9- Gostatistique 17
Var(Zv)= 1
Cov( Z( x ), Z( y))dxdy o x et y sont deux points dans v , x et y balaient
v2
vv
tous deux indpendamment v .
Ces quelques cas sont prsents dans le seul but d'acqurir une certaine intuition du comportement du krigeage. On
suppose un variogramme sphrique de porte finie "a".
i. Estimation d'un point par un autre point situ une distance "h"
( )
1 = 1, k2o = 2 2 C( h ) = 2( h )
2
(Note si h>a, ko = 2 )
2
Remarque: Il est possible d'avoir une variance de krigeage ordinaire suprieure la variance thorique de la variable
tudie!
ii. Estimation d'un point situ en x0 par deux points situs en "x1" et "x2"
2 + C( x0 , x1 ) C( x1 , x 2 ) C( x0 , x 2 ) 2 + C( x0 , x 2 ) C( x1 , x 2 ) C( x0 , x1 )
1 = ,2 =
(
2 2 C( x1 , x 2 )) ( )
2 2 C( x1 , x 2 )
Note: dans les deux cas, les poids peuvent tre ngatifs dpendant de la position respective des trois points.
iii. Estimation d'un point par "n" points en prsence d'un variogramme effet de ppite pur.
1 (n + 1 ) 2
i = , et k2o =
n n
ii. Interpolateur exact. : si lon estime un point connu, on retrouve la valeur connue.
iii. Prsente un effet d'cran: les points les plus prs reoivent les poids les plus importants. Cet effet d'cran varie
selon la configuration et selon le modle de variogramme utilis pour le krigeage. Plus l'effet de ppite est
important, moins il y a d'effet d'cran.
iv. Tient compte de la taille du champ a estimer et de la position des points entre eux.
9- Gostatistique 18
v. Par l'utilisation du variogramme, tient compte de la continuit du phnomne tudi (effet de ppite, anisotropie,
etc.).
vi. Effectue gnralement un lissage, i.e. les estimations sont moins variables que les teneurs relles (point ou bloc)
que l'on cherche estimer.
vii. Presque sans biais conditionnel. Ceci signifie que lorsqu'on applique une teneur de coupure des valeurs
estimes, on rcuprera approximativement la teneur prvue. C'est une proprit trs importante pour les mines.
Cette proprit implique que l'estimateur utilis soit plus lisse que la valeur qu'il cherche estimer, ce qui est le
cas pour le krigeage.
viii. Transitif. Si lon observe en un point une valeur concidant avec la valeur krige pour ce point, alors les valeurs
kriges en d'autres points ne sont pas modifies par l'inclusion de ce nouveau point dans les krigeages. Par
contre les variances de krigeage, elles, sont diminues. De mme, si lon krige un certain nombre de points et
que lon utilise les valeurs kriges comme si ctaient de nouvelles donnes, alors les krigeages subsquents ne
sen trouvent pas modifis (sauf pour la variance de krigeage).
9- Gostatistique 19
INTERPOLATEUR EXACT
8 8
6 6
Z(x)
Z(x)
4 4
2 2
0 0
0 5 10 0 5 10
x x
Modle sphrique (C0=25%, a=10) Effet de ppite pur
10 10
8 8
6 6
Z(x)
Z(x)
4 4
2 2
0 0
0 5 10 0 5 10
x x
Note: Aux points chantillons, le krigeage retourne la valeur de l'chantillon. Pour viter les discontinuits dans des
cartes il est donc recommand de ne pas kriger un point chantillon. En somme, on s'assure d'avoir au moins une
distance "epsilon" entre le point kriger et le point chantillon. Comme souvent l'effet de ppite reprsente une
erreur de mesure, il est justifi de s'carter des valeurs observes.
9- Gostatistique 20
EFFET D'CRAN
- Permet de limiter les systmes de krigeage aux observations avoisinantes (voisinages glissants)
0 0
l=0.25 l=0.25 l= -0.01 l= 0.29 l= 0.29 l= -0.01
-50 0 50 -50 0 50
- La variance d'estimation diminue puis augmente si on cherche estimer un champ plus grand que celui
renfermant les donnes (extrapolation)
-0.02 0 0 -0.02 02 05 05 02
50 50
0 0.27 0.27 0 05 12 12 05
0 0
0 0.27 0.27 0 05 12 12 05
-0.02 0 0 -0.02 02 05 05 02
-50 -50
-50 0 50 -50 0 50
0 0
06 06 06 06 06 01 01 06
12 06 06 12
-50
06 06 06 06
-50
-100
-50 0 50 -100 -50 0 50 100
9- Gostatistique 21
Contrairement aux mthodes de type "inverse de la distance", la position des points entre eux est trs importante.
Chaque point est pondr automatiquement en fonction de sa "zone d'influence". (Les poids par inverse de la
distance auraient t 1/3 pour chaque point dans les 2 cas). (Toujours variogramme sphrique avec a=100, C=100,
C0=0).
Var. k. = 29.29 Var. k. = 8.84
50 50
42 27
0 16 0 47
42 27
-50 -50
-60 -40 -20 0 20 40 -50 0 50
Plus l'effet de ppite est important (relativement un plateau fixe), plus la variance d'estimation augmente.
Inversement, plus la porte augmente, plus la variance destimation diminue.
6 modle sphrique, a=100, c0+c=100; bloc de 133 x 133; grille centre de 4x4
4
var. k.
3
1
0 10 20 30 40 50 60 70 80 90 100
proportion relative de ppite
3 modle sphrique, c0=0; c=100; bloc de 133 x 133; grille centre de 4x4
var. k.
0
0 50 100 150 200 250 300
porte (m)
9- Gostatistique 22
INFLUENCE D'ANISOTROPIES
On doit adapter l'chantillonnage en augmentant la densit d'chantillonnage dans la direction de plus faible porte.
Dans cet exemple, le modle est sphrique avec Co=0; C=100 et ax==200 et ay=50. Les 3 exemples ci-contre
correspondent une mme densit d'chantillonnage (1 chantillon par surface de 33*33 units). Pour le mme cot
d'chantillonnage on peut donc obtenir des estimations beaucoup plus prcises si l'on ajuste la stratgie
dchantillonnage lanisotropie.
5
INFLUENCE DU CHOIX DU MODLE
Le choix du modle a peu d'influence sur les rsultats du krigeage pour autant que chaque modle fournisse un
ajustement quivalent pour les courtes distances. Ici, le champ fait 100m x 100m et chaque point est espac de
33.3m. On estime le point au centre de la grille. Les modles thoriques fournissent peu prs les mmes valeurs
pour les distances de 0 25m, or les points centraux, recevant les poids les plus levs, sont 24m du point
estimer.
EFFET DE LISSAGE
Krigeage ordinaire:
Pour "v" fixe, le terme Var(Zv) ne dpend pas de la localisation, les termes Var(Zv*) et 2k 0 et ,eux, dpendent du
bloc considr et des chantillons disponibles. Normalement, 2ko + 2 > 0 , d'o l'effet de lissage annonc.
Exemple. Considrons un bloc carr de taille 10 x 10 estim par ses 4 coins. Le variogramme est sphrique avec
palier de 1 et porte de 20. L'estimation est faite par krigeage ordinaire (poids gaux 0.25).
On peut calculer :
Var(Zv)=0.6278
2ko = 0.1311
De plus, Var(Zv*)=1/16*(4*1+8*0.3125+4*0.1161)=0.4353
BIAIS CONDITIONNEL
Considrons la teneur relle du bloc Zv et son estimation Zv*. Supposons que l'esprance conditionnelle de Zv tant
donn Zv* est linaire (ce sera assur si les deux suivent une loi binormale). On aura alors:
9- Gostatistique 24
[ ]
E Z v | Z*v = a + bZ*v
Cov( Z v , Z *v )
o b = et a=(1-b)m
Var( Z *v )
Krigeage ordinaire
ce qui indique que le krigeage prsente un biais conditionnel. Ce biais sera trs faible lorsque l'estimation sera
prcise (faible variance de krigeage et multiplicateur de Lagrange prs de zro, forte Var(Zv*)).
Gnralement, le multiplicateur de Lagrange est lgrement ngatif, ce qui implique que la pente de la rgression est
infrieure 1. Donc en utilisant les valeurs kriges directement, on surestime lgrement aux fortes valeurs et on
sous-estime aux faibles valeurs.
Note : pour lestimateur par mthode polygonale (plus proche voisin), lon a :
Cov( Z v , Z*v ) Cov( Z v , Zi )
b= = <1
Var ( Z*v ) 2
cet estimateur prsente un biais conditionnel qui sera dautant plus important que le point utiliser sera loign du
bloc estimer.
est le coefficient de corrlation entre Zv et Zv* et est ncessairement infrieur (ou gal) 1 et *v = Var(Zv* )0.5 . Pour
que b=1, il faut donc obligatoirement que l'on ait *v v . On conclut que si un estimateur est plus variable que la
quantit qu'il cherche estimer alors il prsente certainement un biais conditionnel (la pente de la rgression sera
infrieure 1). C'est, par exemple, le cas pour l'estimateur par mthode polygonale ou la variance des valeurs
estimes est gale la variance des donnes ponctuelles. Le lissage de l'estimateur (proprit du krigeage) est un
pralable essentiel l'absence de biais conditionnel.
Grille de krigeage: Souvent, le krigeage est ralis sur une grille rgulire de points ou de blocs.
9- Gostatistique 25
Dans le cas de points, L'objectif est habituellement de fournir une carte de la variable tudie. La grille de krigeage
doit tre alors assez dense pour que la carte corresponde effectivement au krigeage et non la mthode particulire
(souvent inconnue) utilise pour tracer les isocontours.
7 6
10
9
3 2
8
5 11
Une pratique intressante pour valider le modle de variogramme et le voisinage utilis pour le krigeage consiste
effectuer une validation croise. Le principe est d'liminer tour de rle chaque observation et de l'estimer l'aide de
ses voisins. En chaque point, on obtient donc une valeur vraie et une valeur estime que l'on peut comparer pour
dterminer si le modle fournit des estimations se comportant comme prvu , si le voisinage utilis est adquat, etc.
Plus prcisment, soit Zi* l'estimation obtenue par krigeage au point "i" (en enlevant la valeur observe Zi) ainsi que
ei
la variance de krigeage 2ki . On peut dfinir un rsidu ei=Zi-Zi* et un rsidu normalis ni = . Un modle et un
ki
voisinage adquats devraient fournir:
i. ei 0 et ni 0
i i
9- Gostatistique 26
iv. Il faut aussi examiner l'histogramme des ei et des ni, de mme que leur disposition spatiale pour vrifier si
les statistiques prcdentes pourraient tre causes par 1 ou 2 donnes extrmes et vrifier si les rsidus sont
spatialement homognes.
Les 4 figures suivantes montrent les rsultats de simulation effectues pour 1600 points (40 x 40) des pas variables
(abscisse sur les graphes). En ordonne, on retrouve dans la figure du maut la moyenne des erreurs de krigeage (par
validation) au carr et la moyenne des variances de krigeage. Dans la figure du bas on a la moyenne des erreurs de
krigeage normalises par la variance de krigeage. Tous les krigeages sont effectus avec 50 voisins. Le vritable
modle utilis pour la simulation est sphrique avec a=10 (C0=0) pour les 3 premires figures et un effet de ppite
pur pour la dernire. Dans tous les cas, la variance des donnes simules est 1.
0.5
0
2 3 4 5 6 7 8
n2 (erreurs normalises)
2
1.5
0.5
0
2 3 4 5 6 7 8
Pas de la grille
On note :
- la variance de krigeage prdit parfaitement la prcision accrue due une grille plus resserre;
- les erreurs normalises ont une variance de 1 comme prvu.
9- Gostatistique 27
Figure 2 : On a fourni un modle trop pessimiste (effet de ppite pur) au lieu du vrai modle :
Effet ppite pur au lieu de sphrique a=10: e2
2
Moy e2
1.5 Moy 2
0.5
0
2 3 4 5 6 7 8
n2 (erreurs normalises)
2
1.5
0.5
0
2 3 4 5 6 7 8
Pas de la grille
On note :
- pour la grille espace (pas de 6 8), la structure est faible et la variance de krigeage prdit assez bien la prcision
obtenue;
- pour les grilles serres (2 4), la variance de krigeage est suprieure la variance des erreurs (vue pessimiste) ce
qui rsulte en une variance des erreurs normalises infrieure 1.
Figure 3 : On a fourni un modle trop optimiste par rapport la ralit de la simulation (a=20 au lieu de a=10)
0.5
0
2 3 4 5 6 7 8
n2 (erreurs normalises)
0
2 3 4 5 6 7 8
Pas de la grille
On note que la variance de krigeage sous-estime la variance des erreurs (vue optimiste); la variance des erreurs
normalises est donc suprieure 1.
9- Gostatistique 28
Figure 4 : On a fourni un modle trop optimiste par rapport la ralit (sphrique avec a=10 fourni vs ralit : effet de
ppite pur)
0.5
0
2 3 4 5 6 7 8
2
n (erreurs normalises)
0
2 3 4 5 6 7 8
Pas de la grille
On note :
- la variance des erreurs augmente puis dcrot en fonction du pas de la grille;
- bien quune grille au pas 4 reprsente 4 fois plus dchantillons quune grille au pas 8, la variance des erreurs
est suprieure. En spcifiant le mauvais modle, on ne profite pas de linformation accrue disponible. . Il peut
donc tre assez dangereux de fournir un modle exagrment optimiste. Lexplication pour la dtrioration de la
prcision est que les poids de krigeage prsentent un fort effet dcran lorsquils sont prs du point estimer
(grille serre) et que lon se trouve donc faire une moyenne sur quelques points seulement au lieu des 50 points
lorsque la grille est assez espace pour que les corrlations (et leffet dcran) soient faibles.
- la variance des erreurs normalises est nettement suprieure 1, indiquant que le modle est exagrment
optimiste
1 2
2=
i. La variance exprimentale des teneurs (i.e. (Z i Z ) ) devrait tre gale la variance de dispersion
n
d'un point dans le gisement D2(|G).
ii. La relation de lissage du krigeage (voir section 5.3) fournit naturellement un outil de validation du modle. Une
fois le modle fix, on peut calculer les variances de bloc pour diffrentes tailles de bloc. On peut galement raliser
*
les krigeages pour diffrentes tailles de bloc et calculer la variance exprimentale des valeurs kriges ( Z v ) les
2
moyennes des multiplicateurs de Lagrange ( )et des variances de krigeage ko . On devrait alors avoir:
2Z*v D2 ( Z v | G ) ko
2
2 .
9- Gostatistique 29
x1
x2 x0 x3
x1=(0,1) Z1=9
x2=(0,0) Z2=3
x3=(3,0) Z3=4
On veut estimer le point x0 situ (1,0). Supposons que l'on a un modle sphrique, avec effet de ppite 1, palier 11
et porte 3. On calcule d'abord les distances entre toutes les paires de points:
h
x0 x1 x2 x3
x0 0 1.4 1 2
x1 1.4 0 1 3.2
x2 1 1 0 3
x3 2 3.2 3 0
(h)
x0 x1 x2 x3
x0 0 7.55 5.81 9.52
x1 7.55 0 5.81 11
x2 5.81 5.81 0 11
x3 9.52 11 11 0
C(h)=11-(h)
x0 x1 x2 x3
x0 11.0 3.45 5.19 1.48
x1 3.45 11 5.19 0
x2 5.19 5.19 11 0
x3 1.48 0 0 11
K = k0
=
11 5.19 0 1 1 3.45
5.19 11 0 1 5.19
2
0 0 11 1 1.48
3
1 1 1 0 1
=
1 .21
.51
2
.28
3
-1.55
2ko = 11 - k 0 = 8.76