Вы находитесь на странице: 1из 5

МЕТОДЫ ЦИФРОВОГО МОДЕЛИРОВАНИЯ: статистического моделирования и анализа "GST".

КРИГИНГ И РАДИАЛЬНАЯ
* На наш взгляд, руководство пользователя "GST"
ИНТЕРПОЛЯЦИЯ содержит неплохое описание процедуры моделиро-
вания с помощью кригинга.
С.М. Кошель, О.Р. Мусин (МГУ)
skoshel@geogr.msu.ru Основные термины и уравнения кригинга.
Мы продолжаем, после некоторого перерыва, Перейдем теперь к краткому описанию идеи
серию публикаций [см. ИБ NN 4(16), 5(17), 2(19), и уравнений кригинга. Предположим, что у нас есть
3(20)], посвященных методам цифрового моделиро- некоторый пространственно-зависимый показатель
вания в ГИС. В настоящей статье речь пойдет об Z (высота, глубина, поллютант, концентрация мине-
одном из самых мощных методов геостатистики – рала и т.д.) и нам известны значения zi этого пока-
кригинге. Перед нами стоит весьма непростая зада- зателя в конечном наборе опорных точек
ча: как в популярном журнале, каковым является p i , i 1,...n (так как метод кригинга применим для
"Информационный бюллетень", доступно описать пространства любой размерности, для простоты
этот метод, базирующийся на довольно сложных обозначений мы будем использовать векторное обо-
математических понятиях и изобилующий различ-
ными формулами и алгоритмами. В принципе, при-
веденные в статье формулы предназначены для тех
читателей, которые желают самостоятельно запро-
граммировать этот метод. Остальные могут пропус-
кать "математику", обращая главное внимание на
понимание терминологии и практический смысл
скрытых за ней понятий, без чего использование
кригинга и радиальной интерполяции при цифровом
моделировании подобно "гаданию на кофейной гу-
ще". Для удобства читателей, которые используют в
своей работе англоязычные пакеты по моделирова-
нию, мы будем приводить наряду с русскими назва-
ниями терминов и понятий кригинга их английский
вариант.
Метод кригинга был назван так известным
французским исследователем, одним из "отцов" гео-
статистики Г. Матероном по фамилии южно-
африканского геолога D.G. Krige, который применял
его для определения запасов золота в россыпях.
Иногда неправильно называют этот метод крайгин-
гом (как бы сохраняя английское произношение
слова kriging). Фамилия Krige произносится и по-
русски, и по-английски как Криге, и, соответствен-
но, название метода (в том числе и по-английски) Рис. 1. Пример расположения опорных точек
произносится как кригинг.
В отличие от других методов цифрового мо- значение точек пространства, то есть выделять их
делирования, например, триангуляции Делоне, по жирным шрифтом). Требуется построить функцию
кригингу имеется обширная библиография на рус- Z f ( p) такую, что ее значения в опорных точках
ском языке. Однако практически все эти публика-
равны (интерполяция) или приблизительно равны
ции исходят от геологов или геофизиков и предна-
значены для специалистов именно в этих областях. (аппроксимация) zi . На Рис.1 показан пример рас-
С этой точки зрения с кригингом можно ознако- положения опорных точек и значений в них, кото-
миться, например, по книгам: В.Ф.Родионов, Спра- рый мы будем в дальнейшем использовать в качест-
вочник по математическим методам в геологии, М: ве тестового. В геостатистике предполагается, что Z
Недра, 1987 и Дж. Дэвис, Статистический анализ является случайным процессом со стационарными
данных в геологии, М.: Недра, 1990. В начале своей приращениями и заданной вариограммой
деятельности ГИС-Ассоциация активно поддержи- (variogram, semivariogram) h (или ковариацион-
вала работу сотрудника ВНИИ Геосистем В.А. ной функцией ch ), а значения в опорных точках
Мальцева, автора программного комплекса для гео- являются некоторой реализацией этого случайного
процесса. Вариограмма (а также ковариационная
*
Кошель С.М., Мусин О.Р. Методы цифрового модели- или автокорреляционная функции) является важ-
рования: кригинг и радиальная интерполяция // Информацион- нейшей характеристикой случайного процесса со
ный бюллетень ГИС-Ассоциации. – 2000. - №4(26)-5(27). – с.32-
33. – 2001. - №1(28). – с.58, №2(29)-3(30). – с.23-24. стационарными приращениями и задает распреде-
Кошель С.М., Мусин О.Р. Методы цифрового моделирования: кригинг и радиальная интерполяция

ление квадратов разностей значений (или корреля- 2


n k
p0 ai ii p0 , что дает возможность
цию) в парах точек в зависимости от их взаимного i
i1 i1
расположения, но не от их абсолютного положения.
Процедура интерполяции называется оцениванием оценить точность моделирования.
(estimating), а полученное в результате интерполя-
ции значение Z 0 f p0 называется оценкой (esti- Вариография.
mation) в точке p 0 . В наиболее простом и самом Заметим теперь, что уравнения кригинга мы
распространенном варианте линейного кригинга выписывали, считая известной вариограмму. На
оценка в произвольной точке p рассматриваемой практике же вариограмма моделируемого процесса
0
практически никогда неизвестна и ее приходится
области ищется в виде линейной комбинации значе- подбирать по исходным данным в опорных точках.
ний в опорных точках: Z a1 z1 a 2 z 2 K a n z n . Эта процедура называется вариографией и, собст-
Неизвестные коэффициенты ai определяются из венно говоря, является начальным и самым важным
условий несмещенности оценки и минимизации ее этапом в кригинге, от которого полностью зависит
дисперсии, что приводит к системе линейных урав- результат моделирования. На первом шаге варио-
нений кригинга. При условии, что процесс Z имеет графии по исходным данным строится выборочная
стационарное математическое ожидание, система (экспериментальная) вариограмма, для дискретного
уравнений кригинга выглядит следующим образом: набора точек определяемая формулой
n n Nh
* 1 2
aj ij i , i 1,..., n ; a j 1 ;
(h) Z pi h Z pi , N h - количество
j1
j1 2 N h i1
где - множитель Лагранжа, возникающий из-за пар точек со сдвигом h. Здесь различают изотроп-
условия несмещенности оценки, ный (когда вариограмма и, соответственно, взаимо-
ij pi p j ,
влияние между парами точек зависит только от рас-
i pi p0 . Процедура оценивания в этом слу- стояний между ними) и анизотропный (когда варио-
чае называется ординарным (простым) линейным грамма зависит не только от расстояния между
кригингом (ordinary linear kriging). Так как миними- парами точек, но и от направления вектора, соеди-
зируемая дисперсия оценки может быть записана няющего эти точки) случаи. Из-за нерегулярности
также и через ковариационную функцию, в уравне- расположения опорных точек на практике выбороч-
ниях кригинга может использоваться функция ch . ную вариограмму вычисляют в осредненном виде.
Пусть s – некоторый эмпирически выбранный шаг
Если же процесс Z не является стационарным (в
данных присутствует значимый тренд), используют осреднения, t k k 12 s, k 1,2,... , тогда (для изо-
процедуру универсального (universal) линейного * 1 2
тропного случая) (t k ) z i
z j , где сум-
кригинга. В этом случае считается, что случайный 2nk i, j
процесс Z может быть представлен в виде
k
мирование ведется по всем парам точек, для кото-
Z p bii p p , где 1 p,..., k p - набор рых t k s 2 pi p j t k s 2 , а nk - количество
i1
линейно-независимых детерминированных базис- таких пар. Экспериментальную вариограмму изо-
ных функций, а p - стационарный случайный бражают в виде кусочно-линейной функции, по го-
ризонтальной оси откладывают расстояния между
процесс с нулевым математическим ожиданием. парами точек, по вертикальной – вариацию (квадрат
Детерминированная составляющая называется
трендом или дрифтом (drift), а в качестве функций
i p обычно используют мономы, то есть тренд
представляет собой полином, как правило, не выше
второй степени. Минимизация дисперсии оценки и
учет несмещенности приводят к системе уравнений
универсального кригинга для коэффициентов a i :
n k
aj ij j j pi i, i 1,..., n ;
j1 j1
n
a ji p j i p0 , i 1,..., k ;
j1
где 1 ,..., k
– множители Лагранжа. Отметим, что
Рис. 2. Пример выборочной вариограммы
ординарный кригинг является частным случаем
универсального при k 1 и 1 p 1 . Метод кри- разности значений). Точки t k , для которых nk 0 ,
гинга, кроме вычисления самого показателя, позво- не учитываются. На Рис.2 показан пример выбороч-
ляет найти дисперсию в точке p0 по формуле ной вариограммы, построенной по данным Рис.1.

2
Фоном в виде столбчатой диаграммы показано рас- (nugget effect), c c0 c1 - порог (sill), c0 c - отно-
пределение пар точек по интервалам осреднения. В сительный эффект самородка (relative nugget). На
случае анизотропии вводят шаг осреднения по углу, Рис.3 показаны графики перечисленных модельных
аналогичным образом вычисляют несколько выбо- функций.
рочных вариограмм, соответствующих разным уг-
ловым секторам, и одновременно отображают их на
Практические рекомендации.
графике. Выборочную вариограмму нельзя напря-
мую использовать в уравнениях кригинга, ее необ- В этом разделе мы хотели бы поделиться с
ходимо приблизить некоторой модельной функцией читателями некоторыми рекомендациями по выбору
вариограммы. В качестве модельной годится не лю- параметров кригинга, основанными на более чем
бая функция, а только обладающая некоторыми оп- десятилетнем практическом опыте, накопленном
ределенными свойствами, на которых мы не будем при создании и использовании пакета "МАГ".
здесь останавливаться. Приведем формулы для не- Выбор параметров c0 , c1 и типа модельной
которых наиболее популярных модельных функций вариограммы при фиксированном радиусе влияния
вариограмм (здесь везде t h , 0 0 ; для пп. 1)- может быть сделан как визуально, путем изучения
a
графиков выборочной и модельных вариограмм, так
5) h c0 c1 при h a ):
и автоматически с помощью метода наименьших
1) линейная квадратов. Мерой близости модельной и выбороч-
h c0 c1t ; ной вариограмм в этом случае является сумма квад-
2) сферическая ратов отклонений в точках t k при t k a . Наличие
h c 3
c 31 t 2 1 t 2;
0 эффекта самородка обычно хорошо определяется по
3) логарифмическая графику выборочной вариограммы (при подходе к
2
h c0 c1t 1 ln t ;
2 нулю функция стремится к некоторой константе,
отличной от нуля). В связи с этим, часто при авто-
4) квадратичная 0
матическом выборе параметров значение c фикси-
2
h c0 c1 2t t ; руют, а ищут только c1 . Начальное значение радиу-
5) круговая са влияния обычно выбирают равным значению h,
h c 2 2 при котором график выборочной вариограммы
0 c1 t 1 t arcsin t ;
впервые пересекает горизонтальную прямую, про-
6) экспоненциальная веденную на уровне общей дисперсии показателя,
3t вычисленной по всей совокупности значений в
h c0 c1 1 e ;
7) гауссова опорных точках. Эту горизонтальную прямую все-
гда рисуют на графиках вариограмм, так как счита-
3t 2
h c0 c1 1 e ; ется, что на расстояниях, при которых значение
функции вариограммы превосходит общую диспер-
сию, взаимовлияние между точками отсутствует.
Иногда применяют и нелинейные методы оптимиза-
ции для одновременного поиска всех параметров
( a, c0 , c1 ). В этом случае желательно
проконтроли- ровать найденные параметры
визуально из-за воз- можного наличия нескольких
локальных миниму- мов целевой функции. Для
более полного понима- ния значения эффекта
самородка заметим, что при его ненулевом значении
кригинг превращается в процедуру аппроксимации,
а не интерполяции. При этом эффект сглаживания,
то есть отклонение вы- численных данных от
исходных, возрастает с рос- том относительного
эффекта самородка.
Правильному выбору типа модельной варио-
граммы может помешать наличие глобального трен-
да в исходных данных. Выборочная вариограмма
при этом обычно все время возрастает с ростом h и
ведет себя как выпуклая вниз парабола или экспо-
нента, тогда как при отсутствии тренда выборочная
вариограмма сначала возрастает с ростом h прибли-
Рис. 3. Графики модельных вариограмм
зительно до значения общей дисперсии, а с даль-
Параметрами вариограмм являются: a – ради- нейшим увеличением расстояния продолжает коле-
баться вокруг этого значения. В таких случаях необ-
ус влияния или лаг (range), c0 - эффект самородка
ходимо строить тем или иным способом (обычно
методом наименьших квадратов) тренд по опорным лены по возможности все направления, область по-
точкам, последовательно увеличивая его степень, иска часто разбивают на несколько секторов (обыч-
вычитать его из исходных данных и изучать варио- но 4 или 8) и константы n max , n min применяют для
грамму остатков, то есть, в терминах универсально- каждого сектора. Такой прием позволяет сущест-
го кригинга постараться найти детерминированную венно снизить размерность решаемых систем урав-
составляющую случайного процесса. Если же с по- нений и повысить скорость вычислений. Но здесь
мощью обычных полиномов этого сделать не удает-
есть и свои проблемы. Дело в том, что при таком
ся, можно попробовать тригонометрические поли-
отборе точек моделируемая функция формально
номы или использовать в качестве базисных функ-
становится разрывной. Это приводит к появлению
ций системы ортогональных полиномов.
на построенной модели линий, на которых происхо-
Моделирование при наличии тренда можно выпол-
дит заметный скачок функции, обусловленный
нять с как с помощью ординарного кригинга по ос-
только неравномерностью расположения точек, а не
таткам, прибавляя к полученному результату вы-
природой самого показателя. В таких случаях не
чтенный ранее тренд, так и с помощью универсаль-
нужно "притягивать за уши" различные объяснения
ного кригинга, используя в качестве базисных
происхождения этого разрыва, а попытаться изба-
функций дрифта те же, что и в найденном тренде.
вится от него, изменяя область поиска.
Следует отметить, что при создании цифро-
Рис.4 иллюстрирует разницу в моделях при
вых моделей показателя приходится решать систему разном радиусе влияния. При моделировании ис-
уравнений кригинга для каждого узла регулярной пользовалась логарифмическая вариограмма, для
сетки. Кроме того, при большом количестве опор- уравнений кригинга выбирались 16 ближайших то-
ных точек (>300-500 для двойной точности) числен- чек, черным цветом показаны изолинии при a 40 ,
ное решение системы линейных уравнений стано- а красным при a 20 .
вится неустойчивым, а при количестве в несколько Рис.5 иллюстрирует разницу в моделях при
тысяч и вовсе невозможным. В таких случаях при-
разном типе вариограммы. Здесь a 40 , для урав-
бегают к следующему приему. В уравнениях кри-
гинга используют не все опорные точки, а только те, нений кригинга выбирались 16 ближайших точек,
которые попали в заданную окрестность точки, в черным цветом показаны изолинии при использова-
которой мы ищем оценку. Окрестность задается ра- нии логарифмической вариограммы, а красным -
диусом поиска (search radius) и, в принципе, может при использовании экспоненциальной.
иметь эллиптическую форму в соответствии с вы-
бранными параметрами анизотропии. Количество Интерполяция с помощью радиальных функ-
отобранных точек при этом можно ограничивать ций.
снизу и сверху, то есть использовать только
nmax ближайших и увеличивать окрестность поиска В заглавии нашей статьи имеется указание на
еще один метод цифрового моделирования - ради-
до тех пор, пока не будет отобрано nmin точек. Для альная интерполяция (интерполяция с помощью
того чтобы среди отобранных точек были представ- радиальных функций, interpolation by radial func-

Рис.4. Рис. 5.
functions). Во многих учебниках, монографиях и вой степени и нормировкой пространства на радиус
статьях по геоинформатике и геометрическому мо- влияния, вычисленные значения f p будут совпа-
делированию описываются такие способы построе- дать во всех точках. Таким образом, с точки зрения
ния цифровых моделей рельефа как мультиквадри- теории приближений, радиальную интерполяцию
ки, аналитические сплайны (D-сплайны) и др. В по- можно рассматривать как вариант кригинга, а под-
следние годы появилось общее название для класса бор подходящей радиальной функции, радиуса
этих методов - радиальная интерполяция. Коротко, влияния и параметров анизотропии выполнять с
суть этого метода состоит в следующем. Пусть t помощью вариографии. При небольшом количестве
– функция, возрастающая с ростом t (мы намеренно опорных точек гораздо удобней пользоваться ради-
используем то же обозначение, что и для варио- альной интерполяцией, так как здесь систему урав-
граммы в методе кригинга). Предположим, что ис- нений приходится решать только один раз.
комая функция f p имеет вид:
n k ***
f p ai p pi bi i p .
i1 i1
Методы моделирования, основанные на кри-
гинге, в настоящее время получили широчайшее
Здесь a1 ,..., a n , b1 ,..., - неизвестные коэф-
распространение. Для понимания этого достаточно
bk
фициенты; p p i - расстояние между точками p и осуществить поиск в INTERNETе с ключевым сло-
pi ; p,..., k p - набор линейно-независимых вом kriging. В результате получится список из не-
1
базисных функций (обычно мономы), а скольких тысяч статей. Все университетские курсы
k по геоинформатике (геоматике) и геостатистике
T p bi i p - функция тренда (обычно поли- обязательно включают раздел связанный с кригин-
i1 гом.
ном степени не выше 2). Требование, чтобы функ- Читателям, желающим более подробно озна-
ция f p удовлетворяла условиям интерполяции и комиться с математическим аппаратом и другими
была точна на любой линейной комбинации базис- процедурами кригинга (блочный, индикаторный,
ных функций, приводит к следующей системе ли- нелинейный и др.), мы можем посоветовать моно-
нейных уравнений для вычисления неизвестных графию Journel, A.G., and Huijbregts, C.J., 1978, Min-
коэффициентов: ing Geostatistics: Academic Press, 600 p. Желающим
n k же быть постоянно в курсе всех новинок в этой нау-
aj bj p i z i , i 1,..., n ; ке порекомендуем читать журнал Mathematical Ge-
ij j
j1 j1 ology, являющийся своеобразным клубным журна-
n лом любителей геостатистики и содержащий, кроме
a j i p j 0, i 1,..., k . статей, посвященных теоретическим проблемам,
j1 множество работ по вычислительным алгоритмам
Наиболее известными среди радиальных ин- различных процедур кригинга.
терполянтов являются В рамках небольшой статьи невозможно сде-
2 2 лать обзор многочисленных приложений этого ме-
мультиквадрики: t s t , параметры тода. Отметим, что для ГИС наиболее важными
1 p 1; приложениями кригинга и радиальной интерполя-
, s 0, k 1, 1
2 ции являются: создание цифровых моделей геопо-
D-сплайны (сплайны Дюшона, аналитические лей (рельефа); цифровое моделирование динамиче-
сплайны): t t 2 log t для двумерного случая ских изменений, в том числе и прогнозирование
(когда одной из координат является время); геомет-
(легко видеть, что это тоже самое, что кригинг с рическая трансформация снимков (или карт) в про-
логарифмической вариограммой). екцию карты по опорным точкам.
Также как и в кригинге, в методе радиальной
интерполяции можно учитывать радиус влияния и
анизотропию с помощью соответствующей норми-
ровки пространства независимых переменных.
Функцию t в этом методе называют радиальной
функцией. Для того чтобы система уравнений на
коэффициенты имела решение, радиальная функция
должна, кроме возрастания с ростом t , удовлетво-
рять некоторым дополнительным требованиям. Ока-
зывается, что этим требованиям удовлетворяют все
модельные функции вариограмм. Можно также до-
казать, что в случае ординарного кригинга с некото-
рой вариограммой и радиальной интерполяции с
аналогичной радиальной функцией, трендом нуле-