Академический Документы
Профессиональный Документы
Культура Документы
Geological Modelling on
the Base of Geostatistics
By Evge n iy Kovalevs kiy (C e ntral Ge ophys ical Expe diti o n (CG E ) )
CO U RS E N OTE
www.eage.org
FREE Student Membership for one year – after that only € 25 a year
FIELD Challenge
FIELD Challenge
(Fully Integrated EvaLuation and Development)
Apply for the 2012 FIELD Challenge with a team essay of 2,000 - 3,000 words on ‘The
value of integration between Geoscience and Engineering’ before Wednesday 30
November 2011.
By Evgeniy Kovalevskiy
Central Geophysical Expedition (CGE)
История и содержание курса
1997 год. На конференции EAGE в Женеве Е. Ковалевский показывает стендовый доклад
«Нечеткая геологическая модель». Его выслушивает Оливье Дюбрул и замечает, что
представление неопределенности в нечеткой модели похоже на представление в геостатистике.
Удивительно, но Ковалевский ничего не знает о геостатистике.
2005 год. Книга Оливье Дюбрула «Использование геостатистики для включения в геологическую
модель сейсмических данных (DISC-2003)» выходит на русском языке в переводе Ковалевского.
Сразу после этого Ковалевский начинает читать краткие курсы по геостатистике на конференциях,
в университетах и компаниях. Позже он превращает свои лекции по книге О. Дюбрула в
семестровые курсы геостатистики в МГУ (осенний семестр 2007 года), МФТИ (с 2007 года по
настоящее время) и в РГГРУ (с 2008 года по настоящее время). Курсы сопровождаются
практическими занятиями в системе геологического моделирования DV-Geo. Многие начинают
считать, что Ковалевский является убежденным сторонником геостатистики.
Вместе с тем, нет более вдохновенного критика геостатистики, чем Ковалевский. Он утверждает,
что исходное допущение геостатистики (о статистической однородности геологической среды)
выполняется очень редко. Индикаторное моделирование, по его мнению, представляет собой
самую тусклую часть геостатистики. Но это спасательный круг, без которого она очень часто идет
ко дну. Преобразование «Normal Score» – второй спасательный круг, однако можно привести
примеры, не оставляющие от этого метода камня на камне. Объектное моделирование – голая
эвристика, которая хорошо работает только тогда, когда на площади мало скважин.
Многоточечная геостатистика – на нее можно положиться, если обучающий образ предоставит все
знающий абсолютный разум. Геостатистическая сейсмическая инверсия – прогнозирует свойства
среды с высоким разрешением и точно воспроизводит реальные сейсмические трассы, но только
вдали от скважин, поскольку скважины не позволяют врать. И так далее, и тому подобное... И все
это он говорит потому, что ревнует свою нечеткую модель.
2011–2012 годы, студенческое лекционное турне EAGE. На самом деле, резкая критика,
основанная на ревности – не более чем лекторский прием. Выступая серьезно,
Ковалевский не устает повторять, что геостатистика представляет собой
авангард геологического моделирования. Рассказывать ее легко, поскольку в ее
основе лежит несколько блестящих идей. Главные свои плоды геостатистика
приносит после интеграции с гидродинамическим моделированием, об этом
тоже идет речь. Автор надеется, что в результате этого курса вы поймете
геостатистику, полюбите ее и научитесь ее применять. И, конечно, рассмотрим
нечеткую геологическую модель.
2
Предисловие
В настоящее время в свободном доступе имеется достаточное число лекционных курсов и книг по
геостатистике, и любой желающий может изучить эту тему самостоятельно. Но самый короткий
путь к знанию – спросить у того, кто знает. Если вы действительно хотите понять, что такое
геостатистика, в чем ее сильные и слабые стороны, что она может и что она не может дать при
геологическом моделировании – я смогу вам это объяснить. Потому что только что прошел этот
путь, преодолевая собственное непонимание и делая ошибки.
Что касается меня, то я, как мне кажется, использую логику его книги. Многие мои иллюстрации
являются аналогами иллюстраций О. Дюбрула. Но слова, очень часто, я произношу другие. Иначе
и быть не может. Во-первых, некоторые вопросы, описанные в его книге, я до сих пор не
прочувствовал в полной мере. Во-вторых, как говорилось на предыдущей странице, в моем взгляде
на геостатистику по субъективной причине присутствует значительный критический аспект. И,
наконец, у меня есть свой преподавательский опыт и свои представления о том, как сделать
изложение геостатистики наиболее понятным для слушателя. Из первого, второго и третьего
следует, что О. Дюбрул никакой ответственности за мой курс не несет.
Что еще необходимо сказать в связи с данным конспектом? Основная моя работа заключается в
том, что как ведущий инженер Центральной геофизической экспедиции я участвую в создании
программной системы геологического моделирования DV-Geo. В сферу моей ответственности
входит научное руководство разработкой модуля геостатистического моделирования и подготовка
методических документов для пользователей. Наиболее интересные материалы, с которыми я
имею дело по работе, также включены в данный лекционный курс. Благодарность своим коллегам
я приношу на его последней странице.
3
Содержание
1. Введение 6
1.1. Что такое геологическая модель. Иерархия геологических моделей 6
1.2. Этапы построения геологической модели 7
1.3. Главная интрига геологического моделирования 9
1.4. Детерминированная и геостатистическая модель 10
1.5. Обзор содержания курса 12
2. Ковариация и вариограмма 15
2.1. Как статистика появляется в геологии. Среднее значение и дисперсия 15
2.2. Стационарность 16
2.3. Первый критерий стационарности. Анализ гистограмм 19
2.4. Исходное положение геостатистики 21
2.5. Ковариация двух случайных переменных X и Y 22
2.6. Ковариация случайной переменной Z(x). Вариограмма 23
2.7. Расчет экспериментальной вариограммы. Модели вариограмм 25
2.8. Параметры вариограммы: радиус, порог, эффект самородков, поведение вблизи нуля 27
2.9. Анизотропия вариограммы. Вариограмма в пространстве 3D 28
2.10. Априорная модель случайной переменной 30
2.11. Суть геостатистики 32
3. Кригинг 38
3.1. Что такое кригинг? 38
3.2. Вывод системы уравнений кригинга 39
3.2.1. Простой кригинг 40
3.2.2. Универсальный кригинг 42
3.2.3. Обыкновенный кригинг 44
3.3. Скользящая окрестность 46
3.4. Стандартное отклонение кригинга 47
3.5. Особенности кригинга, обусловленные моделью вариограммы 49
3.6. Перекрестная проверка 50
3.7. Почему кригинг называют оптимальной интерполяцией 51
3.8. Кокригинг ошибок и факторный кригинг 53
3.9. Кригинг как рабочий процесс. О корректном применении кригинга 55
5. Стохастические реализации 66
5.1. Метод последовательного гауссовского стохастического моделирования (ПГСМ) 66
5.2. Кригинг и стохастические реализации в пространстве 2D. Методика анализа качества 69
интерполяции
5.3. Исходные данные примера в пространстве 3D. Детерминированная интерполяция в 71
пространстве 3D
5.4. Кригинг и стохастические реализации в пространстве 3D 74
5.5. Последовательное индикаторное стохастическое моделирование (ПИСМ) 78
4
5.6. Расчет реализаций параметра с разделением на категории 81
5.7. Расчет реализаций параметра с использованием преобразования «Normal Score» 85
Ссылки 117
5
1. Введение
Поскольку раздел «Введение» читает больше людей, чем всю книгу, то мы постараемся именно в
нем рассказать, что такое «геологическая модель» и что такое «геостатистика». Начнем мы с
описания иерархии геологических моделей, дальше скажем об основных этапах создания
геологической модели и о том, как в ходе построения модели мы сочетаем формальные и
неформальные процедуры. Завершая вводный рассказ о моделях мы опишем главную интригу
геологического моделирования. Если коротко, то она заключается в том, что свойства
геологической среды нельзя интерполировать обычным путем. В том смысле, что значения
свойств в промежутке между точками с известными значениями не являются промежуточными по
значению.
6
Главными исходными данными при этом являются результаты сейсмических наблюдений по сети
поисковых профилей. Основное внимание на данном этапе уделяется расчету скоростей
сейсмических волн, суммированию и миграционным преобразованиям, поскольку именно эти
процедуры определяют качество получаемых глубинных разрезов.
После того, как поисковая скважина, пробуренная в своде предполагаемой ловушки, подтверждает
наличие в ней промышленных запасов нефти или газа, считается, что открытие месторождения
состоялось. Дальше начинается разведочный этап. На этом этапе бурится группа разведочных
скважин, а также, если это приемлемо по экономическим показателям, выполняются
сейсморазведочные работы 3D. Область моделирования при этом еще более сокращается (до
размера порядка десяти километров), поскольку охватывает уже только конкретное
месторождение. Данную модель мы относим к третьему уровню иерархии. На этом уровне
решаются задачи точной геометризации природного резервуара, определения уровней ВНК и ГНК,
детального прогноза коллекторских свойств, подсчета запасов. Затем, уже в процессе разработки,
в каждой пробуренной эксплуатационной скважине в обязательном порядке выполняются
исследования методами ГИС, после чего в детальную геологическую модель резервуара вносятся
необходимые уточнения.
В ходе данного курса мы будем в основном говорить о моделях, относящихся к третьему уровню
рассмотренной иерархии, то есть о детальных моделях природных резервуаров. Региональных
моделей мы касаться не будем. Поисковые и гидродинамические модели мы будем рассматривать
в отдельных, специально оговоренных случаях.
Как известно, модель природного резервуара строится в два этапа: на первом этапе создается
геометрический каркас модели, выделяются пласты, строятся их кровли и подошвы, а затем, на
втором этапе, прогнозируются свойства в объеме выделенных пластов.
Каркас детальной геологической модели создается на основании двух видов данных. Первое – это
структурные поверхности, получаемые из 2D и 3D сейсмики. Очень часто это всего одна опорная
отражающая поверхность, которая находится вблизи кровли резервуара, и еще, возможно,
несколько субвертикальных поверхностей тектонических нарушений. Вторым видом данных при
создании каркаса являются результаты детальной корреляции скважин по данным ГИС. По
отметкам детальной корреляции на скважинах интерполируются стратиграфические поверхности,
7
причем в ходе этой интерполяции стараются учесть и рельеф опорного отражающего горизонта, и
выделенные тектонические нарушения. Построенные стратиграфические поверхности и
поверхности нарушений в совокупности составляют нужный нам каркас, или, другими словами,
геометрическую модель. Главное назначение геометрической модели – на ее основе
рассчитывается стратиграфическая сетка. На этом первый этап моделирования завершается.
Поэтому, уже на самом раннем этапе знакомства с данными, или даже просто на основании общих
представлений о районе работ выдвигается гипотеза в отношении генезиса соответствующего
геологического объекта. Далее, параллельно с созданием модели и включением в нее новых и
новых данных эта гипотеза углубляется и уточняется. Зачем она нужна? Гипотеза в отношении
генезиса геологического объекта нужна постольку, поскольку именно она представляет собой
единственную объективную основу для интеграции и верификации самых разных видов данных.
Действительно, что есть общего, например, у сейсмического разреза и у микрофотографий
отшлифованного керна? Общим является то, что каждый из названных видов данных по-своему
отображает один и тот же генезис геологического объекта – ту или иную древнюю обстановку
осадконакопления, тектонический режим, постседиментационные процессы и т.д., и т.п. Если нам
удается выработать гипотезу, которая подтверждает (и подтверждается!) всеми видами данных –
на нашу модель можно положиться, и даже там, где данных недостаточно. И наоборот, пока
правомерная гипотеза в отношении генезиса геологического объекта не выработана, модели у нас
нет, и мы не можем доверять рассчитанным кубам свойств.
8
можно по-разному, возможность получить нужный результат всегда имеется. Вот об
интерполяции мы будем говорить очень много.
Однако продолжим. Зададим следующий вопрос: зачем нам прогнозировать литологию, если для
подсчета запасов и расчета фильтрации флюидов нам необходимы только пористость,
проницаемость и насыщенность? Причина здесь в том, что мы не можем интерполировать
пористость и другие параметры между скважинами напрямую. Почему? Чтобы ответить на это,
рассмотрим следующий пример. Он включает гистограмму значений параметра альфа-ПС
(нормализованного параметра ПС), рассчитанную по скважинным данным на некоторой площади,
и гистограмму того же параметра после интерполяции скважинных данных в объеме среды
(рис. 1).
9
Если интерполировать параметр между скважинами напрямую, то гистограмма значений
пористости в объеме будет иметь вид, представленный на том же рисунке серой кривой.
Поскольку скважины размещены на рассматриваемой площади равномерно (что мы увидим, когда
будем рассматривать этот пример подробно), мы вправе ожидать сходства двух гистограмм.
Однако никакого сходства нет – после интерполяции исходные явно выраженные максимумы
распределения почти исчезают и бессмысленные промежуточные (по величине) значения альфа-
ПС начинают преобладать. Очевидно, что такая интерполяция является ошибочной. То есть, мы
видим, что непосредственно интерполировать скважинные данные в категориальной среде нельзя.
Возможно, их вообще нельзя интерполировать. Это обстоятельство мы и называем главной
интригой геологического моделирования.
Именно для исключения (насколько это возможно) показанной ошибки, до интерполяции этого
или любого другого параметра производят разделение геологической среды на категории, то есть
выполняют интерполяцию литологии. При этом чаще всего используют только две категории
пород – коллектор и неколлектор. После названного разделения интерполяцию пористости
производят обычно только в пределах коллектора. Такой подход позволяет лучше воспроизвести в
объеме гистограмму скважинных данных (в той ее части, которая соответствует коллектору).
Однако в том, что мы исключаем из рассмотрения весь условный «неколлектор», ничего хорошего
нет. Во-первых, мы сами себе создаем проблему порога. Попробуйте, например, выбрать
пороговое значение для разделения среды на коллектор и неколлектор на гистограмме
скважинных данных на рис. 1. Во-вторых, объем исключаемого неколлектора может быть очень
велик, вследствие чего даже малая его пористость может иметь большое значение. Наконец, и это
в-третьих, необходимо иметь в виду, что строгого обоснования интерполяция параметров в
несвязной (или в многосвязной) области коллектора не имеет.
Рассмотрим в этой связи сечение куба литологии, который мы рассчитали для одной из
детерминированных, как мы сейчас говорим, моделей (рис. 2). Этот куб точно соответствует
имеющимся скважинным данным. Беда только в том, что его горизонтальная изменчивость в
разбуренной части площади (левая половина сечения) резко отличается от той же самой
изменчивости в неразбуренной части площади (правая половина сечения). Понятно, что такой
особенности в реальной среде быть не может.
Из картины на рис. 2 можно сделать два вывода. Первый вывод (очевидный) состоит в том, что
детерминированная интерполяция дает нам ложное представление о среде в правой части сечения,
то есть там, где у нас недостаточная плотность данных. Второй вывод (менее очевидный) – левой
половине мы тоже не можем доверять до тех пор, пока мы не определим, какова истинная
изменчивость среды.
Так вот, детерминированное моделирование перестало нас устраивать ровно с того момента, как
мы поняли, что оно не позволяет нам сначала определять, а затем воспроизводить в модели
истинную пространственную изменчивость среды.
10
К каким негативным последствиям приводит детерминированное моделирование? К низкой
точности прогноза? Нет, не только. Мы вообще не можем говорить о какой-либо точности
прогноза на правой части сечения на рис. 2, когда картина принципиально неверна. Когда модель
содержит столь очевидный изъян, наивно надеяться, что мы сумеем правильно подсчитать запасы,
или, тем более, адаптировать ее к данным разработки.
Что вместо этого предлагает геостатистика? Единственного куба литологии, имеющего всюду
истинную изменчивость (хотя бы как в левой части рис. 2) она дать не может, поскольку в
неразбуренной части площади скважин как не было, так и нет. Но геостатистика может дать
множество кубов литологии (так называемых реализаций), каждый из которых точно
соответствует имеющимся скважинным данным (первое) и точно воспроизводит истинную
изменчивость геологической среды (второе). Различия между этими реализациями (которые будут
велики именно в правой части приведенного сечения) покажут нам неопределенность даваемого
прогноза.
Но это еще не вся неопределенность. Говоря о реализациях куба литологии, мы забыли про его
границы, то есть про кровлю и подошву резервуара. Недостатки детерминированной
интерполяции границ на рис. 2 тоже видны – это разная изменчивость рельефа границ вблизи и
вдали от скважин. Геостатистическая же интерполяция скважинных отметок даст нам
11
стратиграфические границы с истинной изменчивостью, но решение опять же будет
неединственным. Вместо одной детерминированной границы мы получим множество реализаций
этой границы. Соответственно, при расчете очередной реализации куба литологии мы должны
будем использовать новую реализацию геометрических границ, то есть новую реализацию
стратиграфической сетки. Точно так же мы должны будем действовать и дальше – применительно
к каждой реализации куба литологии мы рассчитаем реализацию пористости, и потом, уже в связи
с последней, реализацию проницаемости и насыщенности. В итоге, вместо одной
детерминированной модели мы будем иметь достаточно большой набор ее реализаций
(желательно несколько десятков), каждая из которых будет соответствовать скважинным данным
и иметь истинную изменчивость структурных поверхностей и свойств.
Что мы будем делать с этими реализациями? Подсчитав запасы в каждой реализации, мы сможем
подсчитать среднее значение запасов и среднеквадратичное отклонение от среднего. Последнее
даст нам очень важную оценку – точность подсчета запасов. И второе, еще более главное –
множество реализаций значительно расширит наши возможности в части адаптации модели к
данным разработки. Об адаптации модели мы будем говорить в последней главе.
Теперь, наконец, можно сказать, что такое геостатистика. Геостатистикой называют набор методов
интерполяции точечных данных, позволяющих воспроизводить в пространстве их истинную
изменчивость. Или, иначе, это набор методов интерполяции, основанных на использовании
вариограмм. Геостатистической моделью называют такую модель, в которой при расчете
структурных поверхностей и кубов свойств используются методы геостатистической
интерполяции. Соответственно, геостатистическая модель представляет собой не единственную
(детерминированную) модель, а набор равновероятных стохастических реализаций. Определение
«стохастических» указывает на то, что при расчете реализаций в определенный момент мы будем
использовать генератор случайных чисел.
Как мы только что сказали, геостатистикой называют набор методов интерполяции точечных
данных, основанных на использовании вариограмм. Это не совсем так, поскольку сегодня в
геостатистику входит несколько новых методов, реализующих идею расчета стохастических
реализаций на иных основаниях, без использования вариограмм. Тем не менее, свое изложение мы
начнем с описания классической двухточечной геостатистики, основанной именно на
вариограмме.
Первая после данного Введения глава курса (глава 2) называется «Ковариация и вариограмма».
Понятие «ковариация» является в геостатистике основным. Достаточно понять, что такое
12
ковариация, как знание ковариации позволяет предсказывать поведение случайной переменной – и
после этого можно считать себя геостатистиком. В стационарном случае ковариация имеет
простую связь с вариограммой. После исходных определений мы рассмотрим, как рассчитывается
экспериментальная вариограмма и какие модели используются для ее аппроксимации. Нам важно
будет понять, какую информацию несет вариограмма сама по себе. С этой целью мы сравним
образы случайной переменной, соответствующие разным моделям вариограмм. Обсуждая эти
образы (которые и есть наши стохастические реализации) и их привязку к имеющимся точечным
данным мы проясним суть геостатистики.
После этого, в главе 3, мы выясним, что же такое «кригинг», и как он связан со стохастическими
реализациями случайной переменной. Кригинг является детерминированной интерполяцией
(дающей единственное решение) точечных данных, основанной на использовании вариограммы.
Рассматривая кригинг, мы восстановим истинную историю развития геостатистики, поскольку на
самом деле идея кригинга на двадцать лет старше идеи расчета реализаций. Дальше в главе 3 мы
выведем систему уравнений кригинга, рассмотрим его разновидности (простой, обыкновенный и
универсальный кригинг), а также возможности кригинга в части фильтрации ошибок.
В главе 4 мы рассмотрим возможности кригинга в части учета, наряду с основными точечными
данными, дополнительных пространственных данных – карт и кубов свойств. Если точечными
данными в наших моделях являются скважинные данные, то дополнительными
пространственными данными чаще всего являются данные сейсмики. Дополнительные
пространственные данные могут учитываться тремя разными способами. Первое – как тренд.
Второе – как дрейф. Третье – посредством использования их ковариации с данными скважин.
Будет рассмотрена формальная основа и особенности каждого из трех подходов.
В главе 5, соблюдая историческую последовательность, мы перейдем от кригинга к
стохастическим реализациям. Знание кригинга позволит нам рассмотреть основной алгоритм
расчета реализаций – последовательное гауссовское стохастическое моделирование. Сам по себе
названный алгоритм не сложен – сложным является обеспечение условий его корректного
применения. Обеспечить названные условия мы можем при помощи двух процедур – или
посредством разделения среды на категории пород при помощи индикаторного стохастического
моделирования, или посредством формального преобразования данных «Normal Score». Будут
рассмотрены обе названные возможности.
Материал, изложенный в главах 2-5, представляет собой логически связанный и математически
строгий классический курс геостатистики. Однако использование классической геостатистики
является допустимым лишь при выполнении весьма жесткого предварительного условия –
моделируемая среда должна быть статистически однородной. Все детерминированные
особенности среды (тренды, категории, аномальные области) должны быть предварительно
выделены и исключены.
Выход из названной ситуации нашли в том, что арсенал геостатистики дополнили двумя
неклассическими (эвристическими) методами категориальной интерполяции, позволяющими
геологу жестко контролировать пространственную форму монопородных тел. Первый из этих
13
методов – объектное моделирование. Второй метод – многоточечная геостатистика. Оба этих
метода мы рассмотрим в главе 6. Идеи этих методов достаточно просты. Вариограмму они не
используют.
14
2. Ковариация и вариограмма
2.1. Как статистика появляется в геологии. Среднее значение и дисперсия
Среднее значение:
1
mP = E ( P ) =
N
∑P
i =1, N
i
Дисперсия:
1
σ 2P =
N
∑ (P − m
i =1, N
i P )2
15
дисперсия пористости по керну всегда больше дисперсии пористости, выведенной по каротажу, а
последняя, в свою очередь, всегда больше дисперсии пористости, выведенной из данных
сейсмики.
2.2. Стационарность
Зададим следующий вопрос: «Всегда ли мы, делая прогноз, можем полагаться на среднее и
дисперсию?» Не всегда. Полагаться на среднее и дисперсию можно только тогда, когда случайная
переменная ведет себя везде примерно одинаково. То есть так, как это показано на рис. 5. Такое
поведение случайной переменной называется стационарным.
16
Рис. 5. Стационарное поведение случайной переменной. На среднее (красная сплошная
линия) и среднеквадратичное отклонение (две красные пунктирные линии)
полагаться можно.
17
Рис. 6. Нестационарное поведение случайной переменной. На среднее (красная сплошная
линия) и среднеквадратичное отклонение (две красные пунктирные линии)
полагаться нельзя.
Однако ситуацию, изображенную на рис. 6, можно исправить. Для этого достаточно найти и
вычесть из значений случайной переменной детерминированный тренд (голубая линия). В
результате задача сводится к случаю, показанному на рис. 5, после чего точность прогноза
значительно возрастает. Названное преобразование называется приведением случайной
переменной к стационарному виду.
18
Рис. 7. Стационарное (слева) и нестационарное (в центре) поведение переменной в случае
2D. Картина справа показывает выделенный тренд.
19
Рис. 8. Гистограммы значений параметра, соответствующие картам, показанным на рис. 7.
Рис. 9. Распределение яблок по весу. Слева – выборка содержит яблоки одного сорта.
Справа – выборка содержит яблоки двух сортов.
Однако нельзя исключить, что после взвешивания яблок вы получите гистограмму другой формы,
например, двугорбую (рис. 9 справа). О чем это будет говорить? Это будет говорить о том, что вам
продали яблоки двух сортов. То есть, негауссовский вид гистограммы тех или иных значений (веса
яблок, пористости в пробах, отметок глубины некоторого горизонта и т.д.) однозначно указывает
на нестационарность – на присутствие в данных некоторого детерминированного фактора.
«Случайно» негауссовская гистограмма получиться не может.
20
Геологическая среда, как и яблоки, тоже может состоять из разных сортов (типов горных пород).
Поэтому двугорбые или иные негауссовские гистограммы свойств мы очень часто получаем
именно по причине того, что среда состоит из пород разных категорий. В этих условиях опираться
на среднее значение свойств и их дисперсию нельзя (как и в случае с трендом). Сначала
необходимо разделить среду на категории. Каждая категория будет иметь свое среднее и свою
дисперсию.
Анализ гистограмм, при всей его простоте, является очень мощным исследовательским
инструментом. И не только в геостатистике. Можно упомянуть, что именно анализ гистограмм
является весьма эффективным средством выявления фальсификаций в ходе избирательных
процедур. Искусственное вмешательство – вбросы бюллетеней, приписки – мгновенно нарушает
естественные (гауссовские) распределения показателей явки и числа голосов в пользу различных
кандидатов или партий на множестве избирательных участков.
Подведем первый итог. Мы собираемся строить геологическую модель. В ходе этого процесса мы
будем интерполировать сначала структурные поверхности, а затем значения свойств. И в первом,
и во втором случае мы будем на основе точечных (скважинных) данных прогнозировать значения
в пространстве некоторого параметра Z(x). При этом мы будем стараться воспроизвести истинную
изменчивость геологической среды, то есть наш расчет мы будем основывать на статистических
свойствах данных. Но мы только что увидели, что даже простейшим прогнозом – средним и
дисперсией – можно пользоваться только в стационарном (статистически однородном) случае.
Первым критерием стационарности является вид гистограммы известных значений параметра. (О
втором критерии мы скажем чуть позже). Если гистограмма гауссовская – наш случай, скорее
всего, стационарный, и на среднее и дисперсию полагаться можно. Если гистограмма
негауссовская – у нас точно нестационарный случай, и на среднее и дисперсию полагаться нельзя.
Во втором случае надо искать причину нестационарности. Это может быть или тренд (рис. 6), или
наличие аномальной области, или категориальный характер среды (рис. 9) – одним словом,
некоторая детерминированная черта. На среднее и дисперсию мы сможем положиться только
после того, как причина нестационарности будет выявлена и исключена.
Почему мы так много говорим о возможности использовать среднее и дисперсию? Потому, что
если мы не можем положиться на среднее и дисперсию, то и на все последующие
геостатистические прогнозы тем более положиться будет нельзя. Сейчас мы увидим, что
геостатистика добавляет к среднему и дисперсии случайной величины совсем немного, всего
только одну ее дополнительную характеристику – ковариацию.
Итак, мы пришли к тому, что прогнозируемый пространственный параметр Z(x) должен быть
представлен как сумма детерминированной части m(x) и случайного стационарного остатка R(x):
Z ( x ) = m( x ) + R ( x ) (1)
Но ведь это очень бедное, невыразительное представление! Два простых слагаемых, первое –
известная детерминированная часть, и второе – стационарный случайный остаток с известным
средним и известной дисперсией. Ну и что? На чем здесь можно построить науку?
21
Дело в том, что стационарные случайные остатки, или лучше сказать переменные, даже при
одинаковом среднем и одинаковой дисперсии, могут вести себя совершенно по-разному. То есть,
помимо среднего и дисперсии, существует еще одна (третья) характеристика этих переменных,
которая позволяет их различать, подробно описывать и даже предсказывать их поведение (при
всей их случайности).
Третья характеристика, которую мы имеем в виду, называется ковариацией. Она показывает, как
резко меняется случайная переменная вокруг своего среднего и внутри коридора, определяемого
дисперсией (рис. 10). Но это мы забегаем вперед. Сначала мы напомним, что такое ковариация
двух разных случайных переменных X и Y и как она связана с коэффициентом их корреляции, а
затем покажем, как при помощи ковариации описывается пространственная изменчивость
случайной переменной Z(x).
Рис. 10. Примеры различного поведения стационарной переменной Z(x) при одинаковом
среднем и одинаковой дисперсии. Показанное различие описывается ковариацией.
Чтобы понять, что такое ковариация, достаточно просто прислушаться к этому слову. Это
совместная, согласованная вариация (кстати, очень похоже на слово «кооперация»). Пусть у нас
есть две случайные переменные X и Y, зависящие от координат в пространстве или во времени.
Мы хотим определить, есть ли между случайными переменными X и Y какая-нибудь связь. Мерой
этой связи является ковариация X и Y, которая обозначается Cov(X,Y). Последняя характеризует
склонность двух случайных величин одновременно (при одном значении координаты) находиться
по одну сторону от своих средних:
22
Если в формуле (2) случайные переменные ведут себя согласованно (допустим, обе склонны
одновременно быть или выше своих средних, или ниже), то тогда в квадратных скобках у нас
всегда будет положительная величина, которая после осреднения тоже даст величину
положительную. Если же согласованности нет, то усредняться будут знакопеременные случайные
величины, и результат будет близок к нулю.
Знание ковариации позволяет нам, используя одну случайную величину, предсказывать поведение
другой. Допустим, X есть температура воздуха в центре Москвы, измеряемая в каждый полдень, а
Y есть количество проданных в тот же день (и тоже в Москве) порций мороженного. То есть, в
каждый день года мы имеем две случайные величины. Для летних месяцев их ковариация, скорее
всего, будет значительной, поскольку в жаркие дни мороженного продается больше, а в
холодные – меньше. Используя рассчитанное (по данным за некоторое предшествующее время)
значение ковариации, директор хладокомбината сможет, ориентируясь на прогноз температуры
воздуха на предстоящий день, увеличивать или уменьшать свое суточное производство. Но только
летом. Для других сезонов никакой ковариации, скорее всего, не будет.
Однако ковариацию, определенную по формуле (2), трудно использовать, поскольку она имеет
сложную размерность. И мы не можем сразу сказать – 10000 [порций]*[градусы], это много или
мало? Для исключения названной неопределенности ковариацию нормируют на
среднеквадратичное отклонение X и Y. В этом случае она превращается в хорошо всем известный
безразмерный коэффициент корреляции ρ, который может принимать значения от -1 до 1.
Максимальная корреляция имеет место в случае, когда переменная коррелирует сама с собой, то
есть когда Y равен X. Нетрудно видеть, что в этом случае ρ становится единицей. Значение -1
получается тогда, когда отклонения случайных переменных от их средних значений точно
согласованы, но противоположны по знаку.
Пусть у нас есть пространственная стационарная случайная переменная Z(x). Например, это могут
быть значения пористости на некоторой площади. Ковариацию пространственной переменной Z(x)
определяют как ковариацию двух случайных переменных – Z(x) и Z(x+h), то есть как ковариацию
переменной с ней же самой, но взятой в точках со смещением h.
Осреднение в приведенной формуле идет по всем парам точек, расстояние между которыми равно
h. Результат этого осреднения не зависит от положения пар точек в пространстве, а только от
расстояния между ними. Очевидно, что Cov(Z(x), Z(x+h)) будет иметь вид некоторой спадающей
функции от h. Максимальное значение ковариация будет иметь при h=0, и это значение, по
определению, будет равно дисперсии Z(x). С увеличением h ковариация будет уменьшаться
(согласованность поведения Z(x) и Z(x+h) будет снижаться) и, начиная с некоторого h, станет
равной нулю. Примерный график ковариации Z(x) показан на рис. 11.
23
Рис. 11. График ковариации C(h) стационарной случайной переменной Z(x).
У ковариации Z(x), которую мы определили по формуле (4), есть один недостаток – при ее расчете
необходимо знать еще и среднее значение mZ. В чем здесь проблема, ведь если у нас есть данные в
отношении Z(x), то и среднее, казалось бы, тоже есть? Дело в том, что обычно мы имеем только
среднее значение переменной в известных точках, а нам надо знать среднее значение переменной
на всей области ее определения. Последнее нам, строго говоря, неизвестно. Кроме того, опираться
на среднее мы можем лишь в стационарном случае, а стационарность надо еще доказать. Поэтому
удобнее пользоваться несколько иной характеристикой изменчивости Z(x) – так называемой
вариограммой γ(h), которая есть половина среднего квадрата разности значений в точках,
разделенных расстоянием h. Вариограмму мы можем рассчитать прямо из данных:
1
γ (h) = E{[ Z ( x + h) − Z ( x)]2 } (5)
2
Вариограмма γ(h) имеет вид возрастающей функции (рис. 12).
24
1
γ ( h) = E{[ Z ( x + h) − mZ + mZ − Z ( x)]2 }
2
1
γ (h) = E{[ Z ( x + h) − mZ ]2 + [ Z ( x) − mZ ]2 − 2[ Z ( x + h) − mZ ][ Z ( x) − mZ ]}
2
1
γ (h) = {2C (0) − 2C (h)} = C (0) − C (h) (6)
2
Продолжим рассматривать случайную переменную Z(x). Как мы говорили, это могут быть
значения пористости на некоторой площади. Очень важная деталь – на практике мы имеем
значения Z(x) не на всей площади, а только в некотором количестве точек (на скважинах,
рис. 13а). Можем ли мы по отдельным точкам рассчитать вариограмму? Да, можем. Вариограмму,
рассчитываемую по имеющимся (чаще всего точечным) данным, называют экспериментальной.
При ее расчете и количество пар точек, и расстояния между точками в парах являются
фиксированными. Легко показать, что если на площади у нас имеется N точек (скважин), то
количество их пар будет (N-1)*N/2. Если мы отобразим каждую пару точек в координатах
«расстояние между точками» и «половина квадрата разности значений Z в этих точках», мы
получим так называемое «облако точек вариограммы» (рис. 13б). В отношении усреднения этих
точек поступают следующим образом. Шкалу расстояний между точками разбивают на
фиксированные интервалы, после чего усредняют значения половины квадрата разности Z для
точек, попавших в один интервал. Каждое такое усредненное значение ассоциируется с центром
соответствующего интервала. Усредненные точки соединяют отрезками и полученную ломаную
линию называют экспериментальной вариограммой.
25
геостатистика имеет всего два аналитических инструмента – гистограмму и вариограмму. Но с
этими двумя инструментами, как мы увидим, можно сделать очень много. Определение
«двухточечная» как раз и указывает на вариограмму. Разговор о гистограммах мы уже начали чуть
раньше. О вариограммах мы тоже будем говорить очень много.
И прежде всего, скажем следующее. Вторым по важности (но тоже недостаточным) признаком
стационарности случайной переменной Z(x) является выход ее вариограммы, начиная с некоторых
h, на «плато». Напомним, первым признаком стационарности является гауссовский вид
гистограммы значений.
26
Почему мы должны выбирать аппроксимирующую кривую только из списка так называемых
моделей вариограмм и не можем предложить какую-то свою? Причина в том, что точки
вариограммного облака, которые мы усредняем, не автономны, а имеют взаимную связь.
Произвольная аппроксимирующая функция может потребовать наличия в вариограммном облаке
точек с отрицательной ординатой (квадратом разности). В отношении функций, представленных
на рис. 15 (и еще некоторых других) доказано, что такого противоречия быть не может (Chiles,
Delfiner, 1999). Можно также использовать линейную комбинацию разрешенных моделей с
положительными коэффициентами.
2.8. Параметры вариограммы: радиус, порог, эффект самородков, поведение вблизи нуля
Уровень плато C называют порогом вариограммы. Как следует из выражений (4), (6), порог
вариограммы равен дисперсии значений Z(x).
27
Второе, на что мы смотрим – имеет ли вариограмма наклонный участок, или же она имеет вид
«ступеньки». На показанной вариограмме (рис. 16) наклонный участок есть. Удаление h, на
котором наклонный участок заканчивается и вариограмма выходит на плато, называют радиусом
вариограммы R. Радиус вариограммы показывает расстояние, на котором значения переменной
Z(x) становятся независимыми друг от друга.
Если наклонного участка нет и радиус вариограммы R равен нулю – то это случай
неблагоприятный. Такую вариограмму называют вариограммой «белого шума». Она говорит о
том, что значения случайной переменной даже в соседних точках никак не коррелируют друг с
другом. Геостатистика прогнозировать значения такой переменной не может. Однако чаще всего
дело обстоит так, что корреляция значений в соседних точках все-таки есть, но мы ее не видим из-
за недостаточной плотности данных. В этой ситуации мы должны найти способ повысить
плотность данных, хотя бы только локально. Для расчета вариограммы локального уплотнения
данных вполне достаточно (при условии статистической однородности Z(x)).
Эффектом самородков С0 называют уровень вариограммы при h равном нулю. Эффект самородков
означает, что при стремлении расстояния между точками пар к нулю, вариация значений в этих
точках стремится к некоторому ненулевому значению. Эффект самородков указывает на наличие в
данных некоррелированного случайного шума.
28
максимальным радиусом вариограммы, и (нормальное к нему) с минимальным. При малом
количестве точек данных расчет вариограмм по направлениям может быть затруднен.
⎛ h 2
h 2 ⎞
γ (hi , h j ) = 0.0025Sph ⎜ i
+
j ⎟
⎜ 1000 2 1000 2 ⎟
⎝ ⎠
Вертикальная вариограмма описывается сферическая моделью с радиусом 1.6 м и порогом 0.0025:
⎛ hk ⎞
γ (hk ) = 0.0025Sph⎜ ⎟
⎝ 1.6 ⎠
Выше мы использовали традиционное обозначение для сферической вариограммы:
⎛3 1 ⎞
Sph( x) = ⎜ x − x 3 ⎟ , 0 ≤ x ≤ 1,
⎝2 2 ⎠
Sph( x) = 1, 1< x
29
После этого мы можем представить вариограмму в пространстве 3D как сумму горизонтальной и
вертикальной модели. Показанную анизотропию называют «геометрической».
⎛ h 2
h 2
hk2 ⎞
γ (hi , h j , hk ) = 0.0025Sph ⎜ i
+
j
+ ⎟
⎜ 1000 2 1000 2 1.6 2 ⎟
⎝ ⎠
Итак, если разобраться, мы сделали уже довольно много. К двум известным характеристикам
пространственной случайной переменной (среднему и дисперсии) мы добавили третью –
вариограмму. В стационарном случае вариограмма имеет однозначную связь с ковариацией.
Вариограмма (ковариация) характеризует изменчивость случайной переменной. Мы научились
рассчитывать экспериментальную вариограмму. Мы твердо знаем, что опираться на среднее и
дисперсию (и на вариограмму) мы можем только в стационарном случае. Мы также знаем
критерии стационарности, основные причины нестационарности и как нестационарный случай
свести к стационарному.
Будем отвечать по порядку. Среднее значение определяет, что случайная переменная одинаково
часто принимает значения больше или меньше указанной величины. Дисперсия определяет,
насколько далеко случайная переменная может отклоняться от своего среднего. Вариограмма
определяет, какова корреляция между значениями случайной переменной в соседних точках
пространства. Или, другими словами, насколько резко меняются значения случайной переменной
вокруг своего среднего и в коридоре, определяемом дисперсией. И все.
30
Рис. 18. Реализации случайной переменной Z(x) в пространстве 2D. Средние значения и
дисперсии значений Z(x) во всех пяти случаях совпадают, различия обусловлены
только различиями вариограмм.
Первая из показанных картин соответствует вариограмме белого шума. Для геостатистики этот
случай является предельно неблагоприятным. Но и встречается он, можно сказать, только в
теории.
То есть, мы можем ответить на наш вопрос так. Априорная модель достаточно подробно
описывает свойства значений случайной переменной, но не сами эти значения. Это означает, что
каждой априорной модели может соответствовать бесконечное число образов, типа показанных на
рис. 18. Отдельные же образы называют реализациями случайной переменной.
31
2.11. Суть геостатистики
Предположим теперь, что наряду с априорной моделью Z(x) мы имеем одну точку данных. То есть
мы знаем, что в точке x0,y0 значение Z(x0,y0) равно Z0. Что изменится в этом случае? В этом случае
из бесконечного числа реализаций мы должны оставить только те, которые в точке с координатой
x0,y0 имеют значение Z0. Таких реализаций тоже будет бесконечно много. Как они будут
выглядеть? Для модели белого шума ничего не изменится – мы просто не заметим, что все
реализации в какой-то одной точке имеют одинаковое значение. Но вот реализации с гауссовской
вариограммой будут иметь в точке x0,y0 не просто одно одинаковое значение, но и, в силу
плавности изменения Z(x), некоторое одинаковое пятно, и это будет заметно.
А если у нас будет не одна, а большее число точек данных? Множество реализаций будет «зажато»
во всех этих точках. В окрестности каждой такой точки все реализации будут иметь близкие
значения. И если точек данных будет достаточно много, общие черты в реализациях будут
преобладать. Разумеется, конкретное содержание понятия «много» зависит от соотношения
размера области и радиуса вариограммы. Для вариограммы белого шума данных никогда не будет
«много».
Вот в этом суть геостатистики. Вместо одной карты (кровли горизонта, пористости и т.п.),
построенной на основании некоторого числа точечных данных, и которая ничего не говорит о
32
своей надежности, мы получаем бесконечное число так называемых реализаций, которые (первое)
соответствуют экспериментальной вариограмме и (второе) воспроизводят значения в имеющихся
точках данных. Все эти реализации равновероятны. Реальность, разумеется, у нас одна. Какая она,
мы не знаем, но реализации показывают нам, какой она, по имеющимся данным, может быть.
По полученным реализациям мы сразу можем судить, насколько точным является наш прогноз в
той или иной области. Там, где реализации отличаются друг от друга незначительно – прогноз
точен, и наоборот. Кроме того, при помощи множества реализаций мы отвечаем на ряд очень
важных вопросов, на которые детерминированное моделирование ответить в принципе не может.
Какие это могут быть вопросы?
Например, нас интересует, связана ли локальная залежь «А» с основной частью месторождения,
или она является изолированной (рис. 20)? Чтобы ответить на этот вопрос мы считаем 100
реализаций поверхности «кровля резервуара» и смотрим, как они располагаются относительно
уровня ВНК. И видим, что 90 реализаций показывают локальную залежь как изолированную, и
только 10 – как связанную. На основании этого расчета делаем вывод о том, что с вероятностью
90% локальная залежь «А» является изолированной. В показанном примере изменчивость
реализаций кровли резервуара не очень велика потому, что наряду со скважинными данными при
ее расчете используется еще и отражающая сейсмическая граница.
33
Рис. 20. Две реализации поверхности «кровля резервуара» вместе с детерминированной
поверхностью ВНК. Вверху – локальная залежь «А» изолирована от основной части
месторождения. Внизу – локальная залежь «А» соединена с основной частью
месторождения.
Или второй вопрос – нас интересует, связаны ли коллекторские тела «А» и «В» (рис. 21)? Считаем
100 реализаций куба пористости и видим, что в 90 из них коллекторские тела связаны, а в 10 – не
связаны. На основании этого расчета делаем вывод, что с вероятностью 90% коллекторские тела
«А» и «В» связаны.
34
Рис. 21. Реализации куба пористости. Вверху – коллекторские тела «А» и «В» связаны.
Внизу – тела «А» и «В» не связаны.
И, наконец, самое главное – подсчет запасов. Построив 100 реализаций геологической модели на
некоторой площади и подсчитав запасы нефти в каждой из них, мы получаем гистограмму запасов
(красная кривая на рис. 22). Допустим, среднее значение запасов по 100 реализациям получилось
2380 тысяч тонн. Но в Государственной Комиссии по Запасам (ГКЗ) у нас примут не эту цифру, а
меньшую, так называемую оценку P90 – 2280 тысяч тонн. Оценка P90 является более
осторожной – она означает, что с вероятностью 90% мы получим больше, чем она указывает. По
аналогии легко понять, какой смысл имеют оценки P10 и P50.
35
Рис. 22. Оценка неопределенности подсчета запасов.
Для сравнения – при расчете геостатистических реализаций оценка точности параметров модели
дифференцирована в пространстве. В частности, вблизи скважин погрешности параметров
(различия реализаций) всегда значительно меньше, чем вдали от них. Далее – реализации
показывают, как могут сочетаться погрешности (отклонения от средних значений) каждого
параметра в пространстве. Что же касается погрешностей разных параметров, то при расчете
геостатистических реализаций модели их возможные сочетания учитываются естественным путем
(в отдельных случаях для исключения противоречий принимаются специальные меры).
Отклонения одного и того же или разных параметров реализаций в ту или иную сторону от
средних значений очень часто компенсируют друг друга. В результате действия трех названных
36
факторов геостатистические реализации отличаются друг от друга значительно меньше, чем
оптимистический и пессимистический вариант детерминированной модели.
И что в результате? Оценка P90 для детерминированной модели оказывается равной 2080 тысяч
тонн. То есть, после детерминированного моделирования ГКЗ примет у нас на 200 тысяч тонн
нефти меньше, чем после моделирования (той же площади и по тем же данным) на основе
геостатистики!
37
3. Кригинг
3.1. Что такое кригинг?
Подведем очередной промежуточный итог. Мы выяснили, что суть геостатистики в том, что
вместо одной карты или одного куба параметра, полученных в результате интерполяции точечных
данных и надежность которых нам неизвестна, мы имеем бесконечный набор реализаций – карт
или трехмерных кубов. Каждая из этих реализаций соответствует априорной модели случайной
переменной (среднему значению, дисперсии и вариограмме) и ее известным точечным значениям.
В заданных точках все реализации совпадают, но по мере удаления от этих точек отличия
реализаций друг от друга постепенно нарастают. Закон, по которому нарастают эти различия, и
предел этого нарастания определяются вариограммой. Совокупность реализаций дает нам
очевидный критерий для оценки полноты (или, наоборот, неполноты) наших данных и позволяет
судить об их достаточности (или недостаточности) для решения конкретной задачи.
Дело в том, что, изложив суть геостатистики, мы не ответили на два важных вопроса. Первый
вопрос: как нам быть, когда от нас требуют все же только одно решение? И второй вопрос: как
рассчитываются описанные реализации?
Два этих вопроса имеют один ответ – надо использовать кригинг. Кригинг это такая
детерминированная интерполяция (одна карта, один трехмерный куб параметра), относительно
которой ожидаемое отклонение реализаций минимально. Например, в некоторой точке X, Y на
плоскости или X,Y,Z в пространстве (и если это не есть точка данных) реализации дадут нам
некоторое распределение значений нашего параметра. Так вот, кригинг, по определению, имеет в
этой точке значение, относительно которого среднеквадратичное отклонение реализаций
минимально.
Можно ли рассчитывать кригинг, усредняя реализации? Нет, все делается ровно наоборот. Для
расчета реализаций нужен кригинг. Но о расчете реализаций мы будем говорить значительно
позднее.
38
3.2. Вывод системы уравнений кригинга
Пусть Z(x) есть случайная функция, являющаяся случайной переменной в каждой точке x. Мы
знаем априорную модель этой функции, то есть ее ковариацию C(h). Оценку для случайной
функции Z(x0) в точке прогноза x0 (обозначим эту оценку Zk(x0), индекс k есть сокращение от
«кригинг») будем искать как взвешенное среднее от ее же значений Z(xi) в заданных точках xi, i =
1, 2,…, n, используя весовые коэффициенты λi:
n
Z k ( x0 ) = ∑ λi Z ( xi )
i =1
Рис. 23. Оценка Zk(x0). Для наглядности показан одномерный случай и только две заданные
точки, x1 и x2. При помощи коэффициентов λi минимизируется средний квадрат
разности Zk(x0) и Z(x0). (названные разности выделены красным цветом). Осреднение
идет по бесконечному числу реализаций. Показаны три реализации, отвечающие
ковариации C(h).
Var[ Z k ( x0 ) − Z ( x0 )] = E[( Z k ( x0 ) − Z ( x0 )) 2 ] =
= E[( Z k ( x0 )) 2 ] + 2 E[ Z k ( x0 ) * Z ( x0 )] + E[( Z ( x0 )) 2 ] = ...
39
n n
... = E[(∑ λi Z ( xi )) ] − 2 E[(∑ λi Z ( xi )) * Z ( x0 )] + E[( Z ( x0 )) 2 ] = ...
2
i =1 i =1
n n n
... = ∑ ∑ λi λ j E[ Z ( xi ) * Z ( x j )] − 2∑ λi E[( Z ( xi ) * Z ( x0 )] + E[( Z ( x0 )) 2 ] (7 )
i =1 j =1 i =1
Прежде, чем идти дальше, вспомним определение (4) ковариации случайной функции Z(х). Для
большей наглядности запишем его для случая, когда среднее m равно нулю:
Однако существует так называемая эргодическая теорема, гласящая, что среднее для одной точки
по множеству реализаций (а также дисперсия для одной точки и ковариация для одной пары
точек) и среднее по множеству точек для одной реализации (а также дисперсия по множеству
точек и ковариация по множеству пар с фиксированным h) равны. Подробнее смотрите, например,
книгу Демьянов, Савельева, 2010. На основании этой теоремы мы можем записать следующее
(ниже E означает осреднение по бесконечному числу реализаций):
После этого присутствующие в (7) члены вида E[Z(xi)*Z(xj)] можно выразить через ковариацию
C(h). Из выражения (7) выводятся системы уравнений простого, обыкновенного и универсального
кригинга.
Простой кригинг соответствует случаю, когда функция Z(x) имеет известное среднее m, равное
нулю. (Если среднее не ноль, мы просто вычтем его из всех данных). Тогда математическое
ожидание E[Z(xi)* Z(xj)] сразу дает нам ковариацию Cij и выражение (7) для вариации приобретает
вид:
n n n
Var[ Z k ( x0 ) − Z ( x0 )] = ∑ ∑ λi λ j Cij − 2∑ λi Ci 0 + C00 (8)
i =1 j =1 i =1
40
вверх. Минимум параболы достигается в той точке, где ее производная равна нулю. Поочередно
дифференцируем выражение (8) для вариации по λ1, λ2,.. λn и приравниваем результат
дифференцирования к нулю:
Эта система уравнений называется системой уравнений простого кригинга. Она определяет
искомые λ1, λ2,.. λn, необходимые для вычисления Zk(x0). Если значения наших реализаций Z(xi) в
точках данных фиксированы (обратите внимание, в ходе вывода мы этого не требовали, см.
рис. 23), то и в точке прогноза мы тоже получим фиксированное интерполированное значение.
Посмотрим на полученную систему уравнений (9). Все коэффициенты Сij нам известны. Откуда
мы их берем? Мы их снимаем с графика ковариации C(h) (рис. 12), приравнивая h к расстоянию
между точками xi и xj. Матрица коэффициентов системы уравнений зависит, таким образом,
только от C(h) и координат точек данных. Размерность матрицы коэффициентов равна числу точек
данных. Столбец же правой части зависит от координат точки прогноза. Чтобы выполнить
интерполяцию кригингом точек данных на плане XY, необходимо задать сетку на плане XY и
решить систему уравнений (9) в каждом узле сетки.
41
3.2.2. Универсальный кригинг
E[( Z ( xi ) * ( Z ( x j )] =
= E{[( Z ( xi ) − T ( xi ) + T ( xi )] * [( Z ( x j ) − T ( x j ) + T ( x j )]} =
= E{[( Z ( xi ) − T ( xi )] * [( Z ( x j ) − T ( x j )]} +
+ E{[( Z ( xi ) − T ( xi )] * T ( x j )} + E{T ( xi ) * [( Z ( x j ) − T ( x j )]} + E{T ( xi ) * T ( x j )} =
= C ( xi , x j ) + 0 + 0 + T ( xi ) * T ( x j ) =
= Cij + Ti * T j
∑λ x − x
i =1
i i 0 =0
n
∑λ y
i =1
i i − y0 = 0
42
n
∑λ
i =1
i −1= 0
F (λi ,..., λn ) + μϕ3 (λ1 ,...λn ) + μ xϕ1 (λ1 ,...λn ) + μ yϕ 2 (λ1 ,...λn )
Объединяя эти уравнения с тремя полученными ранее, приходим к искомой системе уравнений
для универсального кригинга:
43
C (0) C12 ... C1n 1 x1 y1 λ1 C10
C21 C (0) ... C2 n 1 x2 y2 λ1 C20
... ... ... ... ... ... ... ... ...
Cn1 Cn 2 ...C (0) 1 xn yn * λ1 = Cn 0 (10)
1 1 ... 1 0 0 0 μ 1
x1 x2 ... xn 0 0 0 μx x0
y1 y2 yn 0 0 0 μy y0
Некоторое внутреннее противоречие универсального кригинга заключается в том, что, хотя тренд
может оставаться неизвестным, ковариации Cij нам нужны без тренда (то есть рассчитанные после
того, как тренд исключен, или по участку, где тренда нет). Названное противоречие снимается
тогда, когда мы используем универсальный кригинг с опцией «скользящая окрестность» (см.
ниже). В этом случае решение будет лучше, если мы будем автоматически учитывать переменный
(и неизвестный) линейный тренд в пределах каждой окрестности.
Обыкновенный кригинг отличается от простого тем, что нам не требуется явно указывать среднее
значение для случайной переменной Z(x). Мы уже говорили, что среднее значение случайной
переменной Z(x) не следует путать со средним значением случайной переменной Z(x) в известных
точках. Обыкновенный кригинг сам выбирает уровень, на который решение выходит при удалении
от точек данных на расстояние, большее радиуса вариограммы. Это важное его преимущество.
Также понятно, что обыкновенный кригинг не содержит того внутреннего противоречия, которое
содержит универсальный – тренд в виде T(x,y) = c не мешает нам рассчитать экспериментальную
вариограмму, а значит и ковариации Cij. По этим двум причинам именно обыкновенный кригинг
используется наиболее часто.
Проведем наше короткое исследование. Очевидно, что если точка прогноза x0 совпадает с точкой
данных x1, то прогнозное значение будет равно значению в точке данных x1. Пусть теперь точка
44
прогноза x0 удалена от точек данных на бесконечность. Чтобы получить оценку быстро, примем
еще одно упрощение – пусть вариограмма имеет вид «ступеньки». Тогда у нас, помимо
ковариаций в правой части, обнулятся еще и все недиагональные ковариации в матрице
коэффициентов. Решением будет μ = -С(0)/n и все λ1,.. λn равны 1/n. Соответственно, значение
кригинга на бесконечности будет равно среднему значению, рассчитанному по точкам данных. Но
это только если радиус вариограммы меньше расстояния между точками данных. Если радиус
вариограммы превышает расстояние между точками данных, то при определении уровня на
бесконечности точки данных будут иметь разные веса. А именно, индивидуальные веса близких
друг к другу точек будут меньше весов удаленных точек.
Как будет отличаться интерполяция одних и тех же точечных данных в зависимости от того, какой
кригинг мы применили – простой, обыкновенный, или универсальный? Ответ показан на рис. 24.
Это интерполяция поверхности по отметкам на скважинах. Там, где у нас достаточная плотность
данных, разницы не будет никакой. Отличия будут только на удалении от точек данных, большем
радиуса вариограммы, то есть главным образом в краевых областях. Простой кригинг при
удалении от скважин выходит на горизонтальный уровень, который мы ему указали. Это чревато
ошибкой – на рис. 24 мы указали уровень, который является слишком низким. Обыкновенный
кригинг при удалении от скважин выходит на оптимальный горизонтальный уровень, который он
рассчитывает сам. Универсальный кригинг при удалении от скважин выходит на оптимальную
наклонную плоскость (линейный тренд), которую он тоже рассчитывает сам.
45
Рис. 24. Интерполяция поверхности по отметкам на скважинах при помощи простого (а),
обыкновенного (б) и универсального (в) кригинга.
Итак, мы теперь знаем, что каждое интерполированное значение кригинга есть взвешенное
среднее от величин в известных точках. Весовые коэффициенты получаются в результате решения
системы, число уравнений в которой равно числу точек данных. Для расчета кригинга на сетке
1000х1000 необходимо решить названную систему уравнений миллион раз (минус число точек с
данными). Желая ускорить расчет, часто используют опцию «скользящая окрестность». Названая
46
опция ограничивает число участвующих в интерполяции точек данных. Чтобы точки данных
равномерно окружали точку интерполяции, используется их отбор по квадрантам.
Шиле и Дельфинер (Chiles, Delfiner, 1999) пишут о том, что радиус окрестности желательно брать
равным двойному радиусу вариограммы. Влияют на интерполируемое значение, действительно,
только точки в пределах радиуса вариограммы, но сила этого влияния зависит от исходных
данных в пределах радиуса вариограммы вокруг уже этих точек.
47
Рис. 25. Слева – карта поверхности, рассчитанной посредством обыкновенного кригинга (и
показанной ранее на рис. 24б). Справа – карта соответствующей вариации (ошибки
кригинга). Линия показывает сечение, см. далее рис. 26.
Еще раз, поскольку это важно – кригинг имеет совсем не такую вариограмму, как та, по которой
он рассчитан. Никакого противоречия здесь нет. Кригинг дает нам не поверхность, какой она
может быть, а некоторое осторожное решение, относительно которого ожидаемое отклонение
нужной нам поверхности минимально.
Поверхность, которая нам нужна, может выглядеть как одна из реализаций, также показанных на
рис. 26. У каждой представленной реализации и гистограмма, и вариограмма всех ее значений
48
примерно совпадают с гистограммой и вариограммой реальной поверхности, насколько мы можем
судить по ее известным точкам. Но о реализациях мы будем говорить не сейчас, а позже.
49
3.6. Перекрестная проверка
Мы только что увидели (на рис. 27), что модель вариограммы очень сильно влияет на результат
интерполяции точечных данных посредством кригинга. Однако при малом количестве точек
данных (особенно таких точек, которые позволяют рассчитать начальный участок вариограммы)
бывает так, что мы не можем выбрать модель вариограммы уверенно (рис. 28). Как в этих
условиях определить, какая интерполяция (рис. 29) лучше?
Рис. 28. При малом количестве данных подбор модели к экспериментальной вариограмме
затруднен.
50
Рис. 29. Результат кригинга с гауссовской (слева) и сферической (справа) вариограммой.
Теперь самое время вспомнить одну историю. Дело было в ЦГЭ лет двадцать (или уже тридцать?)
тому назад. Геологические модели в то далекое время представляли собой наборы карт. Поскольку
карт требовалось много, и карты были очень ответственные, была поставлена задача разработать
собственную программу рисовки изолиний. Задание, как это часто в ЦГЭ бывает, поручили двум
независимым группам специалистов. Обе группы задачу решили, и в назначенный день
руководство получило сразу две программы рисовки изолиний.
51
Тестирование программ решили провести на одном и том же наборе точечных данных. Первая
программа нарисовала идеальную карту изолиний... И вторая программа нарисовала идеальную
карту изолиний... Но эти две карты оказались совершенно разными (рис. 29). В связи с этим
возникло некоторое замешательство.
Что произошло? Сама по себе рисовка изолиний, понятно, вторичная задача, главное заключается
в интерполяции точечных данных. Неожиданно обнаружилось, что одни и те же данные можно
интерполировать по-разному. Нет, о существовании разных методов интерполяции, конечно,
знали. Неожиданностью стало то, что результаты интерполяции разными методами могут очень
сильно различаться. Этот случай интересен тем, что тут мы буквально носом уперлись в
геостатистику.
Что в этой ситуации дает нам знание геостатистики? Во-первых, благодаря геостатистике мы
знаем, как мгновенно определить, какая из двух карт лучше. Надо для каждой карты выполнить
перекрестную проверку. Та карта, для которой гистограмма ошибок будет более узкой, (допустим,
это будет карта, рассчитанная программой 1) и есть лучшая. Но из этого вовсе не следует, что от
программы 2 надо отказаться. Потому как на другом массиве точечных данных лучше (по той же
перекрестной проверке) может оказаться карта, рассчитанная именно программой 2. То есть,
геостатистика говорит нам, что у точечных данных есть некие внутренние свойства, и лучший
результат (в смысле перекрестной проверки) дает тот алгоритм интерполяции, который
оказывается адекватнее этим внутренним свойствам. В примере с двумя программами это
происходит случайно.
Кригинг называют оптимальной интерполяцией именно потому, что прежде, чем выполнять
интерполяцию, мы определяем внутренние свойства данных (рассчитываем их вариограмму) и
затем выполняем интерполяцию, опираясь на эту вариограмму. Поэтому результат перекрестной
проверки для кригинга всегда будет наилучшим. Пример с двумя программами рисовки изолиний
очень ясно показывает суть и преимущества кригинга. Когда мне необходимо дать самое краткое и
самое простое объяснение тому, что такое кригинг, я рассказываю именно эту историю.
52
Но мы должны помнить следующее. Говорить об оптимальности кригинга мы можем только тогда,
когда наши данные статистически однородны.
Допустим, у нас есть две случайные переменные A(x) и B(x). Это может быть полезный параметр
и некоторая помеха, которая сопровождает его измерения. Пусть случайная переменная A имеет
вариограмму γA, а переменная B имеет вариограмму γB. Зададим вопрос – какую вариограмму
будет иметь сумма случайных переменных A(x) и B(x)?
По определению:
1
γ A+ B ( h ) = E{[ A( x + h) + B( x + h) − A( x) − B( x)]2 }
2
Мы помним, что математическое ожидание E означает осреднение для всех пар точек, расстояние
между которыми равно h. Перегруппируем усредняемые члены:
1 1
γ A+ B ( h ) = E{[ A( x + h) − A( x)]2 } + E{[ B( x + h) − B( x)]2 } +
2 2
+ E{[ A( x + h) − A( x)] * [ B( x + h) − B( x)]}
Перемножая скобки в последнем слагаемом, получим:
γ A+ B ( h) = γ A ( h) + γ B ( h)
Что означает этот результат? Этот результат означает, что если наши данные включают некоторую
помеху, то их вариограмма будет представлять собой сумму двух вариограмм – вариограммы
полезной части и вариограммы помехи.
В чем состоит важность этого результата? Важность этого результата состоит в том, что очень
часто нам гораздо легче разделить на полезную часть и помеху не сами исходные данные, а их
вариограмму. Получив же вариограмму полезной части, мы можем выполнить интерполяцию
именно полезной части данных, не выделяя эту полезную часть из самих данных. Для этого
достаточно поставить в правую часть системы уравнений кригинга (см. например (9)) ковариацию
именно полезного сигнала.
53
Рис. 31. Экспериментальная вариограмма, модели вариограммы, результаты интерполяции.
На плане XY показана сглаженная поверхность.
54
данных, интерполированное значение не будет воспроизводить «зашумленное» значение в той
самой точке, а будет равно некоторой сглаженной величине, рассчитанной по всей совокупности
точек данных (синяя кривая на профильном разрезе на рис. 31).
Исключение описанным образом случайной ошибки в виде белого шума (с вариограммой в виде
«ступеньки») называют кокригингом ошибок. Что бы выполнить кокригинг ошибок, достаточно
использовать при интерполяции модель вариограммы с эффектом самородков. Отношение порога
вариограммы (за вычетом эффекта самородков) к эффекту самородков можно интерпретировать
как отношение «сигнал-шум». Более сложный вариант, когда описанным образом исключается
систематическая ошибка с некоторой своей вариограммой (например, порожденная системой
наблюдений), называют факторным кригингом.
Подведем очередной промежуточный итог. Самое необходимое из того, что надо знать о кригинге,
мы рассмотрели. Итак, кригинг – это метод интерполяции точечных данных, основанный на
случайной модели среды. Получив данные (таблицу точек), мы, прежде всего, изучаем их
гистограмму. При этом наша цель – обнаружить и по возможности исключить из данных
детерминированную составляющую (тренды, категории, аномальные области и т.п.). Пока мы это
не сделали, геостатистика не применима. Необходимый (но не достаточный) критерий отсутствия
в поведении переменной детерминированных особенностей – гауссовский вид гистограммы ее
значений в известных точках. При необходимости (и с учетом количества данных) на этом этапе
решается вопрос о разбиении области моделирования на подобласти, в которых данные можно
считать статистически однородными.
55
После гистограммы мы исследуем экспериментальную вариограмму. С помощью вариограммы мы
вторично судим о стационарности данных – вариограмма должна выходить на плато. Далее мы
должны убедиться, что вариограмма имеет наклонный участок, то есть что мы выявили масштаб
пространственной изменчивости. Если наклонного участка нет, необходимо хотя бы локально
увеличить плотность данных. Пока мы не установили, что радиус вариограммы больше нуля (и не
определили этот радиус), геостатистика не применима. Дальше, рассчитывая вариограммы по
азимутам, мы судим о наличии анизотропии. Этап заканчивается тем, что мы подбираем модель
вариограммы.
Результатами кригинга являются интерполированная карта параметра (или куб параметра в случае
3D) и карта (куб) стандартного отклонения кригинга. Если принятая модель вариограммы
вызывает сомнения, выполняется расчет с разными моделями и оптимальное решение выбирается
на основе перекрестной проверки.
Но что будет, если мы в самом начале не обратим внимания на то, что гистограмма значений
параметра в исходных точках негауссовская. Допустим, гистограмма пористости по скважинным
данным на площади в пределах некоторого горизонта окажется двугорбой – как следствие наличия
двух категорий пород. Или двугорбой окажется гистограмма отметок стратиграфической
поверхности на скважинах – как следствие разлома и вертикального сдвига одной части
поверхности относительно другой. Сможем ли мы в этих условиях рассчитать вариограмму
данных? Да, сможем, и вариограмма может получиться очень хорошей (с наклонным участком и
плато). Сможем ли мы дальше решить систему уравнений кригинга? Да, сможем, и у нас будет и
карта интерполированных значений, и карта ошибок. Но что это будет за результат? Мы знаем,
что кригинг, как только точки данных расходятся, тянется к среднему. А среднее у нас
бессмысленное! Это или несуществующая промежуточная пористость (между коллектором и
неколлектором), или столь же несуществующий промежуточный уровень поверхности (между
уровнями поднятого и опущенного участков).
А что в этом случае покажут реализации? Мы сможем рассчитать реализации? Да, сможем
(алгоритм расчета реализаций будет описан ниже). Реализации, как мы знаем, «крутятся» вокруг
кригинга в коридоре, который определяет ошибка кригинга. И именно значение кригинга
реализации принимают чаще всего (рис. 26). Если кригинг будет иметь бессмысленное значение,
то и реализации будут давать нам формально правильное, но, по сути, совершенно ложное
представление о среде.
Вот в этом все дело! Опасность некорректного применения кригинга (и геостатистики в целом)
очень велика именно потому, что никаких формальных препятствий на этом пути мы не
встречаем.
56
Подробно о реализациях мы будем говорить позже. Сейчас мы начнем новую главу, в которой
рассмотрим кригинг точечных данных с использованием вспомогательной пространственной
переменной.
57
4. Кригинг с использованием вспомогательной переменной
До сих пор мы рассматривали кригинг как средство интерполяции одних только точечных данных.
Сейчас же мы рассмотрим, как при помощи кригинга можно интерполировать точечные данные с
учетом дополнительных пространственных данных, которые мы считаем менее точными, но
которые тоже могут и должны внести свой вклад в результат. С этой ситуацией мы сталкиваемся,
например, когда интерполируем отметки кровли резервуара на скважинах с учетом близлежащей
сейсмической поверхности (рис. 33). Или это может быть задача в пространстве 3D – например,
интерполяция скважинных значений пористости с учетом куба сейсмического импеданса.
58
Учесть в процессе интерполяции дополнительные пространственные данные можно тремя
способами:
• использовать пространственные данные как тренд;
• использовать пространственные данные как дрейф;
• выполнить кокригинг точечных и пространственных данных.
Что касается первого способа, то как работать с трендом мы уже говорили. Правда, мы не
говорили, что в качестве тренда можно брать сейсмическую поверхность. В чем здесь
особенность? Необходимо все-таки убедиться, что после вычета тренда гистограмма
интерполируемых значений является гауссовской. Далее мы интерполируем не сами отметки на
скважинах, а их невязки с поверхностью тренда. После интерполяции невязок прибавляем тренд к
результату. На этом о тренде – все. А вот о «дрейфе» и о «кокригинге» мы поговорим подробнее.
Кригинг с внешним дрейфом (КВД) очень похож. Мы берем некоторую известную нам
поверхность S(x,y) и предполагаем, что в наших точечных (скважинных) данных есть тренд в виде
T ( x ) = T ( x, y ) = a0 + a1S ( x, y ) (11)
Далее мы точно так же выводим систему уравнений, которая позволяет кригингу самому
подобрать коэффициенты a0, a1 так, чтобы сделать вариацию (7) минимальной. В результате
решения системы уравнений коэффициенты a0, a1 мы не получим, но мы получим результат
кригинга с включенным дрейфом. То есть, при удалении от точек данных кригинг будет выходить
на тренд вида (11).
Отличие дрейфа от тренда показано на рис. 34. Дрейф, в сравнении с трендом, дает кригингу
больше свободы – кригинг может менять его уровень и его амплитуду. Отличия дрейфа от тренда
очень важны вот в каком контексте. Коэффициенты a0, a1 можно интерпретировать как
коэффициенты пересчета отражающей сейсмической поверхности из временного масштаба в
глубинный. А именно, коэффициент a1 можно трактовать как эффективную скорость
сейсмических волн, а коэффициент a0 - как статическую поправку. Это позволяет брать
поверхность S(x,y) непосредственно из временного сейсмического куба. Использование же КВД с
опцией «скользящая окрестность» позволяет учитывать изменения эффективной скорости на плане
XY. То есть, опираясь (первое) на скважинные данные в отношении глубины рассматриваемой
поверхности и (второе) на сейсмическую карту этой поверхности во временном масштабе, кригинг
самостоятельно выполняет скоростной анализ среды.
59
Рис. 34. Отличие дрейфа от тренда. Внимательному читателю поясним, что «дыры» в
сейсмической поверхности устранены посредством ручной редакции.
Что нам осталось? Нам осталось вывести систему уравнений кригинга с внешним дрейфом.
Названный вывод производится аналогично выводу уравнений универсального кригинга. Отличие
состоит только в том, что надо дополнительно минимизировать вариацию не по коэффициентам
линейного тренда, а по коэффициентам a0, a1. Выпишем только отличающиеся фрагменты:
∑ λ S(x ) − S(x ) = 0
i =1
i i 0
∑ λ −1 = 0
i =1
i
60
C (0) C12 ... C1n 1 S ( x1 ) λ1 C10
C21 C (0) ... C2 n 1 S ( x2 ) λ2 C20
... ... ... ... ... ... ... ...
(12)
Cn1 Cn 2 ... C (0) 1 S ( xn ) * λn = C n 0
1 1 ... 1 0 0 μ0 1
S ( x1 ) S ( x 2 ) ... S ( x n ) 0 0 μ1 S ( x0 )
Но обратите внимание – как и в случае универсального кригинга, ковариации Cij в этих уравнениях
должны быть без дрейфа (то есть рассчитанные после того, как дрейф исключен, или по участку,
где дрейфа нет).
S ( x0 ) − S ( x 2 ) S ( x1 ) − S ( x0 )
λ1 = , λ2 =
S ( x1 ) − S ( x 2 ) S ( x1 ) − S ( x 2 )
Z ( x 2 ) S ( x1 ) − Z ( x1 ) S ( x 2 ) Z ( x1 ) − Z ( x 2 )
Z ( x0 ) = + S ( x0 )
S ( x1 ) − S ( x 2 ) S ( x1 ) − S ( x 2 )
Мы видим, что решение воспроизводит дрейф S(x) с коэффициентом, зависящим от соотношения
масштабов изменений Z(x) и S(x).
4.2. Кросс-ковариация
Cov[ Z1 ( x ), Z 2 ( x )] = E{[ Z1 ( x ) − m1 ][ Z 2 ( x ) − m2 ]}
Ковариация двух случайных переменных есть просто число. Ковариация (если она имеет место)
позволяет предсказывать значение одной переменной по известному значению другой.
Ковариация, нормированная на среднеквадратичное отклонение Z1 и Z2, есть безразмерный
коэффициент корреляции. Это был наш первый шаг.
61
Потом мы сказали, что если в качестве второй переменной Z2 брать ту же самую первую
переменную Z1, но в точках с некоторым смещением h, то можно рассчитать уже не число, а
некоторую функцию ковариации C(h):
Третий шаг, который мы сейчас сделаем, просто совмещает два предыдущих. Мы рассмотрим
ковариацию двух разных случайных переменных, взятых в точках со смещением h:
62
4.3. Совместный кокригинг
Допустим, у нас есть две случайные переменные, Z1(x) и Z2(x), которые коррелируют друг с
другом. Наличие корреляции Z1(x) и Z2(x) означает, что наряду с ковариацией C1(h) переменной
Z1(x) мы имеем кросс-ковариацию C12(h) переменных Z1(x) и Z2(x). В этом случае при
интерполяции кригингом точечных данных Z1(x) можно дополнительно использовать данные
Z2(x).
Вспомним, как мы выводили систему уравнений кригинга (пункт 3.2). Будем действовать точно
так же, но используя еще и значения случайной переменной Z2(x). Оценку для случайной функции
Z1(x0) в точке прогноза x0 (обозначим эту оценку Zcok(x0), индекс cok есть сокращение от
«кокригинг») будем искать как взвешенное среднее от значений Z1(xi) и Z2(xj) в точках,
соответственно, xi, i = 1, 2,…, n, и xj, j = 1, 2,…, m. Весовые коэффициенты обозначим как λi и μj:
n m
Z cok ( x0 ) = ∑ λi Z1 ( xi ) + ∑ μ j Z 2 ( x j )
i =1 j =1
Решение относительно коэффициентов λi и μj, обеспечивающее минимум вариации
называется «кокригинг».
Переменная Z2(x) обычно представляет собой сейсмический параметр, и мы можем взять ее хоть в
миллионе точек. Однако, поскольку Z2(x) меняется очень плавно, то, кроме усложнения системы
уравнений кокригинга (мы помним, что каждая точка добавляет одно уравнение), это нам мало что
даст. Поэтому мы поступим иначе. При оценке Zcok(x0) мы будем брать вторую переменную только
в одной точке x0, то есть именно в той точке, в которой мы делаем прогноз:
n
Z cok ( x0 ) = ∑ λi Z1 ( xi ) + μ Z 2 ( x0 )
i =1
Попробуем вывести систему уравнений совместного кокригинга. Действуем так же, как и при
выводе системы уравнений простого кригинга. Применяем те же обозначения. Подставляя
выражение для Zcok(x0) в выражение для вариации, получим:
Var[ Z cok ( x 0 ) − Z1 ( x 0 )] =
n m n n
= ∑∑ λi λ j C + μ C1
ij
2 2
00 +C 1
00 + 2∑ λi μC 12
i0 − 2∑ λi C 1i 0 − 2μC 12 00
i =1 j =1 i =1 i =1
Здесь С1 обозначает ковариацию Z1(x), С2 – ковариацию Z2(x) , С12 – кросс-ковариацию Z1(x), Z2(x).
Условием минимума вариации является равенство нулю производной по каждому коэффициенту
63
λi, μ. Поочередно дифференцируем выражение для вариации по λ1, λ2,.. λn, μ и приравниваем
результат каждого дифференцирования к нулю. В результате получаем систему уравнений:
Эта система уравнений определяет искомые λ1, λ2,.. λn, μ. Можно видеть, что ковариация
переменной Z2(x) нам не понадобилась, нам оказалась нужна только ее дисперсия С200.
64
После этого решение системы становится очевидным:
12
C00
λ1 = λ2 = ... = λn = 0, μ= 2
C00
65
5. Стохастические реализации
Перед тем, как сделать очередной шаг, резюмируем коротко наши достижения. В главе 2 мы
выяснили суть геостатистики. Параметр геологической среды (в случае 2D это структурная
поверхность, в случае 3D это куб пористости и т.п.) мы представляем в виде случайной
переменной. Эту переменную мы разделяем на детерминированную часть и случайный
стационарный остаток. Стационарный остаток мы характеризуем при помощи среднего значения,
дисперсии и вариограммы. Вариограмму остатка мы рассчитываем по известным точечным
значениям и аппроксимируем разрешенной моделью. После этого мы полагаем, что наиболее
адекватным представлением рассматриваемой случайной переменной (ее стационарной части)
будет бесконечный набор реализаций, каждая из которых отвечает вариограмме и воспроизводит
значения в известных точках. Реальный параметр (мы так считаем) совпадает с одной из этих
реализаций, мы только не знаем, с какой именно. Эти реализации позволяют нам давать ответы на
очень важные практические вопросы (какие вопросы – повторять не будем).
Теперь мы знаем (после глав 3 и 4), что такое кригинг. Кригинг, по определению, это такое
детерминированное решение, от которого среднеквадратичное отклонение реализаций
минимально. Кригинг является оптимальным, когда нам надо дать одно единственное решение.
Кроме того, мы знаем, как рассчитать кригинг, как рассчитать ошибку кригинга, насколько
широкие возможности имеет кригинг в части исключения случайных (и систематических) ошибок,
а также в части учета сейсмических данных.
Чего мы пока не знаем? Мы пока не знаем, как рассчитываются реализации. Мы также не знаем, с
какими проблемами мы сталкиваемся при расчете реализаций. Именно об этом мы будем говорить
в данной главе.
Рассмотрим алгоритм ПГСМ. Для большей наглядности будем считать, что моделирование
производится на двумерной сетке. В трехмерном случае все делается точно так же.
Итак, мы считаем, что в некоторых ячейках сетки мы имеем известные значения непрерывного
параметра (рис. 36). Пусть это будет пористость, а известные значения – это значения в скважинах.
Далее, когда мы будем говорить «точка на сетке», мы будем иметь в виду центр ячейки.
66
Рис. 36. Последовательный обход ячеек сетки по случайной траектории.
67
Рис. 37. Расчет реализации методом ПГСМ: а – значение кригинга и удвоенного
стандартного отклонения; б – распределение возможных значений; в – интегральное
распределение, выборка при помощи случайных чисел, равномерно распределенных
на интервале [0, 1]; г – значение, определенное посредством случайной выборки.
Расчет следующей реализации начинается с того, что мы оставляет на плане (как и в начале
предыдущего расчета) только истинные исходные значения. После этого мы выбираем новую
случайную траекторию обхода точек. Понятно, что при повторном обходе новые значения во всех
точках, кроме точек с исходными данными, будут отличаться от предыдущих. То есть, вторая
реализация будет отличаться от первой. Всего, таким образом, мы должны рассчитать достаточно
большое число реализаций, например 100. Чтобы представить, насколько сильно реализации могут
отличаться друг от друга, достаточно рассчитать две.
Почему мы считаем, что вариограмма значений рассчитанных таким образом реализаций будет
совпадать с вариограммой данных? Потому, что следуя описанному алгоритму, мы просто
выбираем нужную нам реализацию из бесконечного числа, изначально соответствующих заданной
вариограмме. Процесс этого выбора можно пояснить с помощью рис. 38. На исходной картине
показаны реализации, проходящие через известные точки. Мы выбираем новую точку, определяем
в ней значение кригинга и его стандартное отклонение σ, после чего случайным образом выбираем
значение в новой точке и оставляет только те реализации, которые принимают в ней именно
выбранное значение. Таких реализаций будет тоже бесконечное число, но отличаться друг от
друга они будут уже меньше. Потом мы возьмем следующую точку, определим значение в ней и
так до тех пор, пока различия между реализациями не станут бесконечно малыми.
68
Рис. 38. Расчет одной конкретной реализации можно представить как постепенное сужение
исходного бесконечного множества реализаций, соответствующих вариограмме γ(h).
В заключение сделаем два замечания. Если мы рассчитываем реализации на сетке 100х100 узлов,
то ближе к концу нам придется решать систему уравнений кригинга со многими тысячами точек
данных (то есть со многими тысячами уравнений). В пространстве 3D число точек данных будет
еще большим. Поэтому при расчете реализаций обязательно используется опция «скользящая
окрестность» с ограничением по числу учитываемых (ближайших) точек. И второе. Если у нас
есть дополнительные данные – карта или куб значений вспомогательной переменной и функция
кросс-ковариации (кросс-вариограмма) основной и вспомогательной переменной, то мы можем
рассчитывать реализации посредством решения системы уравнений совместного кокригинга (13).
При этом отличия реализаций друг от друга будут меньше, и все они будут коррелировать с
картой или кубом вспомогательной переменной.
69
Рис. 39. Стратиграфическая поверхность, рассчитанная по отметкам на скважинах и данным
сейсмики. Слева – интерполяция кригингом, справа – одна из реализаций.
Данный расчет является важным примером в методическом плане. Результат любой интерполяции
мы оцениваем по трем критериям. Первое – насколько хорошо на плане (или в объеме)
воспроизводятся исходные точечные данные. Второе – насколько хорошо на плане (или в объеме)
воспроизводится гистограмма точечных данных. И третье – насколько хорошо на плане (или в
70
объеме) воспроизводится вариограмма точечных данных. Рассчитанная реализация поверхности
(рис. 39 справа) устраивает нас по всем трем критериям.
В разделе 3.7 мы уже упоминали о том, что существует (и широко применяется) множество
методов интерполяции, не имеющих никакой связи с геостатистикой. На рис. 41 показан результат
так называемой «весовой» интерполяции скважинных значений APS.
71
Рис. 41. Размещение скважин на площади, каротажные кривые APS и результат их
«весовой» интерполяции в объеме среды. Куб интерполированных значений показан
в условиях палеореконструкции. На вертикальном слайсе отмечены индексы
стратиграфических горизонтов. Красный цвет палитры примерно соответствует
песчаникам, зеленый – глинам.
n
1
∑R
i =1
2
Z ( xi )
Z ( x0 ) = n
i
(15)
1
∑
i =1 Ri
2
Здесь x0 – точка интерполяции в пространстве 3D, Z(xi) – значение параметра в точке данных xi,
Ri – расстояние между точкой интерполяции x0 и точкой данных xi, n – число точек данных. Суть
этой интерполяции проста – ближние точки влияют на интерполированное значение сильнее,
дальние точки – слабее. В случае совпадения точки интерполяции с точкой данных (в пределе), вес
последней устремляется в бесконечность, и результат интерполяции совпадает со значением
именно в этой точке. При удалении точки интерполяции на бесконечность (в пределе), веса всех
72
точек становятся одинаковыми, и результат интерполяции совпадает со средним арифметическим.
Можно также модифицировать решение – брать расстояния в степенях, отличных от двойки,
ограничивать число влияющих точек, вводить регуляризацию (сглаживание), дополнительно
учитывать анизотропию по направлению. Например, можно учесть анизотропию по
вертикальному и горизонтальному направлению. Для этого расстояние R между точками следует
представить как сумму (то есть корень из суммы квадратов) вертикальной и горизонтальной
составляющих, и вертикальную составляющую, для повышения ее значимости, умножить на
коэффициент анизотропии k. Допустим, k=100. Даже после названных усложнений весовая
интерполяция остается простой и понятной.
На первый взгляд полученное решение (рис. 41) выглядит вполне удовлетворительно. Оно точно
воспроизводит исходные данные и разумно интерполирует их в межскважинном пространстве. В
частности, мы сразу видим область повышенных значений APS в пределах горизонта AV3,
предположительно – погребенное русло. Однако для более глубокой оценки результата
интерполяции мы (следуя нашей методике) должны выполнить анализ гистограмм и вариограмм.
73
На что еще следует обратить внимание? Гистограмма скважинных значений APS явно
негауссовская. Это говорит о том, что наша среда не является статистически однородной. Мы
можем предположить, что она состоит из нескольких категорий пород, однако трудно сказать, из
какого числа категорий – двух, трех или большего. Еще одна особенность – пороги
горизонтальной и вертикальной вариограмм (прежде всего для скважин, но и в кубе тоже) сильно
различаются. Это показывает, что дисперсия значений в слоях сетки меньше дисперсии значений
вдоль вертикалей. Горизонтальные пласты более однородны по свойствам, чем вертикали.
Выше мы много говорили о том, когда можно применять геостатистику. Напомним, что условие,
по сути, только одно – среда должна быть статистически однородной. Первый критерий
статистической однородности – гистограмма свойств должна быть гауссовской. Второй
критерий – вариограмма должна выходить на плато. Но что делать, если среда не является
статистически однородной? Об этом мы тоже говорили. Если в среде есть области, различающиеся
по статистическим свойствам (а горизонты AV1, AV2,..., AV5 явно различаются, см. рис. 41), то
каждую такую область следует рассматривать отдельно. Если в среде присутствуют
детерминированные особенности (а погребенное русло в пласте AV3 есть именно такая
особенность), то они должны быть выделены и исключены. Если среда состоит из разных
категорий пород (а у нас, судя по гистограмме, именно такой случай), то ее необходимо разделить
на категории. Все названные требования просты и понятны. Проблема только в том, что
выполнить их очень трудно.
Вместе с тем мы говорили, что, имея вариограмму, мы всегда можем формально рассчитать
кригинг и стохастические реализации. Может быть, все не так страшно? К нашим
экспериментальным вариограммам (горизонтальной и вертикальной) можно подобрать
следующую комбинированную модель:
⎛ hhorz
2 2
hvert ⎞ ⎛ 2
hhorz 2
hvert ⎞
⎜
γ (hvert , hhorz ) = 0.046 Exp⎜ + ⎟ + 0 .054 Exp ⎜ + ⎟
2 2 ⎟ ⎜ 100000 2 20 2 ⎟
⎝ 750 20 ⎠ ⎝ ⎠
где
Exp( x) = 1 − exp( x)
есть обозначение экспоненциальной модели вариограммы.
74
Рис. 43. Интерполяция кригингом скважинных значений APS.
75
Какие особенности имеет рассчитанная интерполяция кригингом? На горизонтальном сечении мы
видим, что при отходе от точек данных на расстояние порядка радиуса вариограммы (у нас это 750
м), кригинг тянется к среднему. Именно об этом мы говорили в разделе 3.9. Увеличение доли
средних значений (в сравнении с исходными данными и в сравнении с весовой интерполяцией) мы
видим и на гистограмме. Увеличение числа средних значений понижает дисперсию значений, что
отражается на порогах вариограмм. Главное же состоит в том, что горизонтальную изменчивость
среды кригинг воспроизводит неправильно. Кригинг сглаживает горизонтальную изменчивость
примерно так же, как и весовая интерполяция.
Почему это произошло? Геостатистика исходит из того, что моделируемая среда является
статистически однородной, и что распределение значений в ней – нормальное. Его мы и получили.
То, что гистограмма исходных точечных значений является двугорбой, для геостатистики
значения не имеет. Из объема с нормальным распределением свойств можно выбрать точечные
данные с каким угодно распределением.
Мы же, наоборот, считаем, что гистограмма исходных данных имеет значение, и что интерполяция
в объеме среды должна ее воспроизводить. Поэтому результат с гауссовской гистограммой по
объему нас не устраивает.
76
Рис. 45. Стохастическая интерполяция скважинных значений APS.
77
В чем мы убедились в результате последнего расчета? Мы убедились в том, что в достаточно
типичной ситуации (при интерполяции скважинных данных) мы не смогли получить приемлемый
результат. Основной причиной нашей неудачи является, по-видимому, категориальный характер
геологической среды. Что делать, отказаться от геостатистики? Ни в коем случае, поскольку идея
расчета стохастических реализаций чрезвычайно ценна! Геостатистику надо «спасать», она стоит
того.
Отметим, что число используемых категорий не должно быть большим. В противном случае
уменьшается приходящийся на одну категорию объем исходных данных, от чего страдает качество
вариограмм. Кроме того, чем больше категорий, тем больше у нас будет искусственных
контрастов в значениях целевого параметра, так как последние рассчитываются в пределах
категорий независимо и не коррелируют. Очень часто среду разделяют только на две категории
пород – «коллектор» и «неколлектор», после чего реализации пористости (если решается задача
интерполяции пористости) рассчитывают только в коллекторе.
Алгоритм ПИСМ позволяет разделять объем среды только на две категории. Поэтому, если число
категорий больше двух, некоторые из них временно объединяют друг с другом таким образом,
чтобы свести задачу к разделению среды именно на две категории. На следующем этапе
выделенную в пространстве одну объединенную категорию разделяют на две подкатегории, и так
далее. С учетом сказанного дополним характеристику исходного состояния: значения индексов в
ячейках на траекториях скважин имеют значения или 0, или 1.
Описание метода ПИСМ мы дадим на примере двумерной сетки. В трехмерном случае все
делается точно так же. Исходное состояние показано на рис. 47: имеется сетка, в некоторых
ячейках которой стоят известные (скважинные) значения индексов – 0 или 1.
78
Рис. 47. Последовательный обход узлов сетки по случайной траектории.
Алгоритм ПИСМ в основных чертах повторяет алгоритм ПГСМ (рис. 49). Мы последовательно
обходим точки на сетке (те, в которых у нас нет значений) по случайной траектории. В каждой
очередной точке мы рассчитываем значение кригинга, используя для этого известные данные
79
(рис. 49 а). Полученное значение кригинга (в нашем примере это 0.65) мы интерпретируем как
вероятность иметь в рассматриваемой точке категорию «1». Далее мы реализуем эту вероятность.
Для этого мы генерируем случайное число из равномерного распределения на интервале [0,1].
Если это случайное число оказывается меньше значения кригинга, в рассматриваемую точку
заносится значение 1; в противном случае в рассматриваемую точку заносится значение 0.
Определенное таким образом значение присоединяется к числу известных данных, то есть
получает статус «значение в скважине». После этого на сетке выбирается следующая случайная
точка, которая не должна совпадать ни с одной из уже определенных. Для новой точки все
повторяется, но с одним изменением – в расчете кригинга участвует уже на одну точку больше,
чем на предыдущем шаге. После того, как мы заполняем значениями все ячейки сетки, расчет
реализации индикатора считается завершенным.
Рис. 49. Расчет реализации методом ПИСМ: а – значение кригинга в очередной точке
прогноза; б – случайное число, равномерно распределенное на интервале [0, 1],
сравнивается со значением кригинга; в – если случайное число меньше значения
кригинга, в точку заносится 1, в противном случае заносится 0.
Расчет следующей реализации начинается с того, что мы оставляет на плане только истинные
исходные значения... (дальнейшее повторяет сказанное в отношении ПГСМ). Отметим только
самое важное. Если наряду со скважинными данными у нас есть карта или куб вспомогательной
переменной, то мы можем каждое значение на этой карте интерпретировать в терминах
вероятности категории «1». После этого значение вероятности, рассчитанное на очередном шаге
кригингом, мы можем по формуле Байеса сложить с вероятностью, определяемой картой, и
получить суммарную вероятность в точке категории «1». И именно эту суммарную вероятность
мы можем дальше реализовывать (выбрасывать случайное число и т.д.). В результате карта (куб)
пространственного распределения категорий будет коррелировать с картой (кубом)
вспомогательной переменной.
80
Покажем теперь, что можно получить при помощи индикаторного стохастического моделирования
в нашем примере 3D.
Очень часто для разделения среды на коллектор и неколлектор используют значение APS равное
0.35 (синяя линия на рис. 50). Но сейчас такое разделение нас никак не устроит. Причина в том,
что распределение APS в интервале «больше, чем 0.35» совершенно не похоже на гауссовское, и
мы не сможем его воспроизвести при расчете реализаций. Прямо скажем, подходящий нам
вариант разделения на категории на гистограмме на рис. 50 не просматривается.
Что надо сделать в ситуации, показанной на рис. 50? Надо рассмотреть горизонты AV1 – AV5 по
отдельности. У каждого горизонта будет своя гистограмма и свои причины ее деформации. Что-то
81
прояснится. Надо также посоветоваться с геологом. Он подскажет, какие должны быть категории
пород. Вот тогда все получится.
Мы же, для иллюстрации метода ПИСМ, сделаем следующее. Мы выделим интервал APS
«больше, чем 0.8», соответствующий коллекторам самого высокого качества (правее зеленой
линии на рис. 50). На указанном участке гистограмма исходных значений близка к гауссовской.
82
Рис. 52. Последовательно – гистограммы, горизонтальные вариограммы, вертикальные
вариограммы. Красные линии – для исходных скважинных данных, зеленые линии –
для куба стохастической реализации. Пунктиры на правом графике показывают
пороги вариограмм, соответствующие долям категорий на скважинах и в объеме
среды.
Что можно сказать о результатах расчета? Пропорции категорий в скважинных данных и в объеме
среды практически совпадают. Радиусы вертикальных вариограмм совпадают. Радиусы
горизонтальных вариограмм также примерно совпадают. Пропорции категорий на вертикалях
близки к пропорциям в объеме среды, что видно по порогам вертикальных вариограмм.
Пропорции категорий в слоях сетки отличаются от пропорций во всем объеме, причем для
скважин сильнее, чем для куба. В целом результат разделения объема среды на две заданные
категории выглядит вполне удовлетворительным.
83
Рис. 53. Стохастическая интерполяция скважинных значений APS в пределах категории
«высококачественный коллектор».
84
Таким же образом мы должны проинтерполировать скважинные данные в пределах всех других
категорий. Но, напомним, без серьезного анализа (выходящего за рамки данного курса) никакие
другие категории в нашем примере мы выделить не смогли. Поэтому мы вынуждены завершить
описание интерполяции с использованием разделения на категории и перейти к обсуждению
второго «спасательного круга» геостатистики – преобразования «Normal Score (NS)». Метод NS
позволит нам получить желаемый результат.
Вернемся в исходную точку. Наша проблема состоит в том, что распределение известных
значений параметра (на скважинах) является негауссовским. В этой ситуации формальный расчет
стохастических реализаций коренным образом меняет исходную гистограмму, что нас никак не
устраивает. Разделение среды на категории в принципе позволяет решить проблему должным
образом, но этот путь, во-первых, требует глубокого анализа исходных данных и, во-вторых,
является очень сложным технически. Даже в демонстрационном примере мы не смогли пройти его
до конца.
Но есть еще и второй путь решения той же проблемы, гораздо более легкий. Он состоит в том, что
мы просто меняем шкалу, при помощи которой измеряется наш параметр (APS, пористость и т.п.).
Новая шкала выбирается таким образом, чтобы значения параметра на скважинах, измеренные в
новых единицах, оказались распределенными по Гауссу. Отсюда и название – метод нормального
преобразования («Normal Score»). Дальше мы действуем на совершенно законных основаниях – по
известным значениям параметра (в новых единицах) рассчитываем вариограмму и выполняем
стохастическую интерполяцию. Последняя, как мы знаем, сохраняет гауссовское распределение (в
новых единицах). На заключительном этапе выполняется обратное преобразование NS, и мы
получаем значения в объеме, гистограмма которых точно совпадает с гистограммой исходных
данных.
Описанный процесс (и его издержки) легче всего пояснить при помощи рис. 55. Для простоты
показан пример 1D – интерполяция точечных значений (пористости) вдоль координатной оси Х.
Рис. 55 разделен на четыре фрагмента – «а», «б», «в» и «г». Прокомментируем их
последовательно.
Фрагмент «а». В правой части показаны неизвестные нам истинные значения пористости
(непрерывная линия) вдоль координаты X. У нас есть только значения пористости в отдельных
точках (данные по скважинам). На вертикальной оси показана исходная равномерная шкала
пористости P (с одинаковыми интервалами). Рядом со шкалой пористости помещена гистограмма
известных значений пористости – она показывает частоту, с которой точки попадают в интервалы
на шкале P. Гистограмма имеет двугорбый вид – у нас много высоких значений пористости
(песчаные тела), много низких значений (глинистые тела), и почти нет промежуточных значений.
В левой части фрагмента «а» помещена измененная, неравномерная шкала пористости P*(с
интервалами разной ширины). Интервалы на шкале изменены так, чтобы в центральный интервал
попадало больше всего точек, а дальше, по мере удаления от центра, число точек, попадающих в
интервалы, постепенно уменьшалось (точно так, как в распределении Гаусса).
Фрагмент «б». Значения пористости вдоль координаты X показаны теперь в единицах P*. В новых
единицах часть точек, попадавших в прежние максимумы, смещается ближе к среднему значению.
85
При этом разница между песчаниками и глинами в единицах P* уменьшается, а малые флуктуации
пористости в пределах песчаников и глин, наоборот, увеличиваются. Но зато теперь известные
значения (в единицах P*) распределены по Гауссу. Для известных точечных значений (в единицах
P*) рассчитывается вариограмма.
86
Рис. 55. Стохастическая интерполяция с использованием преобразования «Normal Score»
(пояснения даны в тексте).
Описание метода «Normal Score» получилось у нас с большой долей критики. В отношении
вариограммы наша критика чрезмерна. Чтобы улучшить решение, делают небольшую подмену –
преобразованные данные интерполируют на основании не их собственной вариограммы
(рассчитанной после преобразования), а на основании исходной. У которой меняют только порог.
После этого песчаные тела приобретают должный размер.
Рассмотрим теперь, какой результат дает стохастическая интерполяция методом «Normal Score» в
нашем примере. Кубы интерполированных скважинных значений APS (две реализации) показаны
на рис. 56. Гистограмма и вариограммы интерполированных значений представлены на рис. 57.
87
Рис. 56. Две реализации стохастической интерполяции скважинных значений APS с
использованием преобразования «Normal Score».
88
Рис. 57. Последовательно – гистограммы, горизонтальные вариограммы, вертикальные
вариограммы. Красные линии – для исходных скважинных данных, синие линии –
для реализации APS, рассчитанной с использованием преобразования «Normal
Score».
Ну и что, к какому выводу мы пришли? Модели, которые дает геостатистика, плохие? Нет, не
плохие. Реализации, показанные на рис. 56, очень неплохие. Даже, можно сказать, замечательные!
Они несравненно лучше нашего исходного детерминированного решения, показанного ранее на
рис. 41. Вот только горизонт AV1 следовало рассчитать отдельно.
89
Рис. 58. Гистограммы и горизонтальные вариограммы. Красные линии – для исходных
скважинных данных, синие линии – для реализации APS, рассчитанной с
использованием преобразования «Normal Score». Проверка для пласта AV1.
90
6. Неклассические геостатистические методы
В предыдущей главе мы выпустили в сторону геостатистики много критических стрел. Давайте
восстановим баланс и скажем в ее адрес необходимые положительные слова. Например, скажем о
том, какие идеи геостатистики мы считаем очень ценными.
1. Очень ценной мы считаем идею анализа гистограмм данных. Повторим – каждая негауссовская
гистограмма говорит о чем-то важном и интересном, надо только понять, что именно она говорит.
Чрезвычайно полезным (для выяснения причин искажения нормального распределения) является
сравнительный анализ гистограмм данных по разным участкам на плане XY и по разным
интервалам (стратиграфическим горизонтам) по Z.
2. Столь же ценной и конструктивной является идея расчета вариограммы. Имея на площади всего
несколько пар близко расположенных скважин, мы можем (сравнивая значения скважинных
параметров на разных уровнях Z) достаточно хорошо рассчитать наиболее важный начальный
участок вариограммы и получить представление о характере горизонтальной изменчивости среды.
В разделе Введение мы говорили о том, что модель среды должна соответствовать не только
скважинным и сейсмическим данным, но и нашим знаниям о процессах формирования
геологической среды. Объектное моделирование является инструментом, позволяющим
представлять знания о среде (в отношении вероятной формы песчаных и иных тел) в виде моделей
среды.
91
множество (тысячи, миллионы) соответствующих объектов, но оставляет только те из них,
которые согласуются со скважинными данными.
Посмотрим еще раз на рис. 60 (на фрагмент внизу). Он показывает, что индикаторное
моделирование на основе двухточечной вариограммы позволяет нам очень слабо влиять на
конфигурацию песчаных тел. Мы можем лишь приблизительно задавать средние размеры этих тел
и, дополнительно, придавать этим размерам некоторую анизотропию. Объектное моделирование
(рис. 60 вверху) позволяет нам больше – мы можем задавать конфигурацию отдельных песчаных
тел непосредственно. Но при этом мы не очень хорошо контролируем, какую конфигурацию
принимает совокупность этих тел. Однако бывает так, что большое значение имеет конфигурация
именно их совокупности. Например, геологу необходимо воспроизвести в модели
пространственную картину, аналогичную той, которую он видит на космическом снимке какой-
нибудь дельты. Имея такой снимок (или иной подобный образ), геолог хочет получить результат,
близкий к нему настолько, насколько позволяют скважинные данные. Названная задача решается
при помощи многоточечной геостатистики.
Метод, имеющий столь внушительное название, на самом деле очень прост. Для его объяснения
достаточно одной иллюстрации (рис. 61). На представленном рисунке показан расчет на
двумерной сетке, но в трехмерном случае все делается точно также (за исключением того, что
сложнее подготовить эталонный образ). Итак, с левой стороны помещен план XY исследуемой
площади. Окрашены те ячейки сетки, в которые попали скважины. Цветом ячеек отображены
скважинные данные в отношении типа пород (коллектор или неколлектор). С правой стороны
показан подготовленный эталонный образ. В центре на рис. 61 изображен используемый шаблон.
В нашем случае это квадрат размером 7х7 ячеек.
92
Рис. 60. Вверху – одна из реализаций объектного моделирования. Внизу – одна из
реализаций (на основании данных тех же скважин) индикаторного моделирования.
93
Рис. 61. Алгоритм метода «многоточечная геостатистика» (пояснения в тексте).
Порядок работы с планом XY, эталонным образом и шаблоном следующий. Первое – случайным
образом выбирается ячейка на плане XY, отличная от известных. Пусть это будет ячейка (точка)
А. С ней совмещается центральная ячейка шаблона, после чего на шаблон переносятся попавшие в
него скважинные данные (выделены окружностями). Второе – шаблоном с попавшими в него
данными сканируется весь эталонный образ и фиксируются те положения шаблона, при которых
данные на шаблоне совпадают с подложенной картиной. В нашем примере таких положений
оказалось три (показаны на рис. 61). В каждом таком положении проверяется тип породы в
центральной ячейке шаблона. У нас дважды в центре оказывается «коллектор» и один раз
«неколлектор». На этом основании делается вывод о том, что вероятность коллектора в точке А
составляет 66%. Третье и последнее – генерируется случайное число, равномерно распределенное
на интервале [0,1]. Если оно оказывается меньше, чем 0.66, в точку A заносится значение
«коллектор», в противном случае – «неколлектор». После этого ячейка A получает такой же
статус, как ячейки со скважинами, и процесс продолжается дальше. При заполнении всех ячеек
расчет реализации считается завершенным. Затем рассчитывается вторая реализация, и т.д.
У метода многоточечной геостатистики есть свои проблемы. Например, рассчитанная при помощи
описанного алгоритма картина может иметь дефекты в виде разрывов (рис. 62). Метод приходится
усложнять. Для более глубокого знакомства с многоточечной геостатистикой рекомендуем
обратиться к работе Daly, Caers, 2010.
94
Рис. 62. Результат расчета методом многоточечной геостатистики. Отмечены разрывы
русел.
6.3.1. Введение
Прежде, чем идти дальше, подведем очередной промежуточный итог (проведем сеанс рефлексии).
Мы рассмотрели шесть методов: детерминированную (весовую) интерполяцию, кригинг и
реализации кригинга, а также три метода категориальной интерполяции данных – индикаторное
моделирование, объектное моделирование и многоточечную геостатистику. Откуда такое
изобилие?
На самом деле все очень логично. Детерминированные методы не воспроизводят истинную
изменчивость геологической среды. Их результат зависит от плотности данных (скважин). Это
плохо, и поэтому они нас не устраивают. Геостатистические реализации воспроизводят
изменчивость среды, но исходят из ее статистической однородности. Все (не выделенные)
детерминированные особенности, которые присутствуют в данных, в реализациях стираются. То
есть никаких особенностей чередования тонких и толстых пластов, узнаваемых конфигураций
литологических тел и т.п. в реализациях не остается. Это тоже плохо. Чтобы вернуть в реализации
детерминированные черты, придумали объектное моделирование и многоточечную геостатистику.
Детерминированные черты в реализациях действительно появляются. Но это не те черты, которые
присутствуют (зачастую в глубоко скрытом виде) в данных, а те, которые «навязывает» геолог.
Теперь понятно, что мы собираемся предложить. Мы собираемся предложить метод, который
будет рассчитывать стохастические реализации, имеющие те самые детерминированные черты,
которые присутствуют в данных. И нам не надо будет предварительно искать, выявлять эти
черты – они сами проявят себя в реализациях.
Метод, который мы имеем в виду, называется «нечеткая геологическая модель». Поясним, что он
дает, при помощи следующего примера. Выведем на один профиль 5 скважин с вертикальными
разрезами пористости. Попросим 10 геологов, чтобы каждый взял пачку фломастеров (20 цветов)
95
и нарисовал по этим скважинам профильный разрез пористости. В результате мы получим 10
разных разрезов. Каждое значение пористости (с шагом в один процент) будет закрашено своим
цветом, но на каждом разрезе это будет сделано чуть иначе, чем на других. И конечно, эти разрезы
нельзя будет назвать статистически однородными. Вот примерно такие реализации пористости
дает нечеткая геологическая модель.
Однако бывают ситуации, когда адекватно представить прогнозное значение параметра при
помощи только двух чисел невозможно. Рассмотрим пример, показанный на рис. 63 а. Точка А
расположена вблизи границы между породами с пористостью 4% и 12%. Какой прогноз
пористости мы можем дать в точке А?
96
Кригинг дает в точке А что-то похожее на PA = 8±1%. Принять этот прогноз мы не можем,
поскольку скважинные данные однозначно указывают на отсутствие вблизи данной скважины
пород с пористостью 8%. Корректный геостатистический подход требует предварительно
разделить среду на категории пород, после чего выполнять интерполяцию пористости отдельно в
пределах каждой категории. Трудности, которые встречаются на этом пути, мы описали в главе 5.
Напомним – мы так и не смогли довести пример с реальными скважинными данными до конца.
Чтобы получить решение нам пришлось использовать не очень натуральный метод «Normal
Score».
97
Рис. 64. Каждая точка на траектории скважины является источником свидетельства в
пользу своего значения.
98
В скобках показаны свидетельства в пользу предшествующих категорий. Обратите внимание, если
сумма свидетельств в пользу отдельных категорий меньше 1, остаток приписывается Θ. Для
суммирования E1 и E2 мы должны составить следующую таблицу:
Верхняя строка и левая колонка таблицы показывают исходные свидетельства E1 и E2. Значения в
других клетках таблицы являются произведением компонент Е1 (из той же колонки) и Е2 (из той
же строки). Полученные значения присваиваются категориям, которые являются пересечением
категорий Е1 (из той же колонки) и Е2 (из той же строки). Пересечением одинаковых категорий и
пересечением категории и Θ является та же самая категория, пересечением разных категорий
является ø, пересечением двух Θ является Θ.
Нет, не будут. Описанный прогноз не устраивает нас вот по какой причине. В нем остаются
скрытыми значения параметра, в пользу которых также имеются свидетельства, уступающие
максимальному, возможно, очень малую величину. Представьте – в большом объеме среды
свидетельства в пользу пористости 1-2% лишь чуть-чуть превосходят свидетельства в пользу
пористости 19-20%. И что же, весь этот объем мы должны записать в неколлектор? Это было бы
неправильно.
99
должны обойти все элементарные объемы модели по случайному пути, исключая те, в которых
значение параметра определено однозначно. В каждом очередном объеме генерируется случайное
число, равномерно распределенное на интервале [0, 1]. Одновременно мы делим интервал [0, 1] на
внутренние участки, пропорциональные имеющимся в этом объеме свидетельствам в пользу
различных категорий. Решение о значении параметра принимается в зависимости от того, на какой
участок попадает случайное число. После этого рассмотренный объем сам становится источником
свидетельств в пользу той категории, которая ему определена. Заполнив весь куб, мы получим
одну из множества возможных реализаций значений параметра в объеме среды. После этого мы
выполняем расчет следующей реализации, начиная с выбора нового случайного пути обхода
элементарных объемов, и так далее.
Следующее замечание касается площадей с неравномерной или очень малой плотностью скважин.
Максимальный горизонтальный радиус эллипсоида свидетельств не должен превышать радиус
горизонтальной вариограммы, рассчитанной по скважинным данным. В противном случае на
участках с малой плотностью скважин мы получим бессмысленные однородные области. Наличие
предельного радиуса приводит к тому, что на большом удалении от скважин максимальным
оказывается свидетельство в пользу диагноза Θ. Как мы должны поступать, когда при расчете
реализаций случайное число выпадает в пользу Θ? Здесь возможны два варианта. Первый –
решение можно просто откладывать (и точку не заполнять). В результате области, наиболее
удаленные от скважин, будут получать значения в последнюю очередь, то есть их заполнение
будет идти по мере расширения заполненных областей от скважин. Второй вариант –
свидетельства в пользу Θ можно перераспределять в соответствии с гистограммой скважинных
данных (или с гистограммой скважинных данных по пласту).
100
6.3.5. Расчет реализаций нечеткой модели для примера со скважинными данными APS
Рис. 65. Вертикальное и горизонтальное сечение двух реализаций куба APS, рассчитанных
как реализации нечеткой модели.
101
Сравнение гистограммы и вариограммы для скважинных данных и для реализации нечеткой
модели показано на рис. 66. Максимальный горизонтальный радиус распространения свидетельств
составлял (в соответствии с горизонтальной вариограммой скважинных данных) 750 м.
Свидетельства в пользу Θ не перераспределялись, что касалось в основном только левого верхнего
угла площади, где плотность скважин несколько ниже. Можно видеть, что и горизонтальная
изменчивость, и гистограмма значений по скважинным данным воспроизведены в реализации
нечеткой модели достаточно хорошо. Вспомним, что точно такой же результат в отношении
гистограммы и вариограммы мы получили для реализации, рассчитанной методом «Normal Score»
(рис. 57).
102
6.3.6. Сравнение реализации нечеткой модели и реализации «Normal Score»
Сравним реализацию нечеткой модели с реализацией метода «Normal Score». Для наглядности
поместим сечения одной и другой реализации рядом (рис. 67).
Рис. 67. Вертикальное и горизонтальное сечение реализации «Normal Score» (вверху слева и
внизу) и нечеткой модели.
103
На что здесь надо обратить внимание? Первое – в реализациях метода «Normal Score» мы видим
плавные переходы от больших значений параметра к малым. В реализациях нечеткой модели те же
самые переходы резкие, контрастные. Второе – однородные области в реализации нечеткой
модели имеют большие размеры, чем в реализации «Normal Score», поэтому реализация нечеткой
модели выглядит менее хаотичной. При этом вариограммы обеих реализаций одинаковые! Что это
означает? Это означает, что больший контраст значений параметра (который сам по себе ведет к
более крутой вариограмме) компенсируется большим размером однородных областей (который
сам по себе ведет к более пологой вариограмме). Другими словами, мы обнаружили два разных
типа моделей, которые соответствуют скважинам, и которые нельзя различить по гистограмме и
вариограмме. Они отличаются только характером изменения свойств. В одной модели свойства
меняются резко, в другой – плавно. Но почему мы считаем, что изменения свойств в
геологической среде должны быть плавными? Вопрос о том, какая из этих двух моделей ближе к
реальности, остается открытым.
104
Рис. 69. Сравнение реализации «Normal Score» (слева) и реализации нечеткой модели
(справа) в одном и том же горизонтальном сечении пласта AV1. Цветовые палитры
одинаковы. На левой картине все красные и зеленые области находятся
исключительно между скважинами.
105
7. Стохастическая сейсмическая инверсия
Пусть коротко (без деления на параграфы), но мы должны рассмотреть такое важное приложение
геостатистики, как стохастическая сейсмическая инверсия. Сейсмической инверсией называют
задачу, когда из куба сейсмических трасс (плюс данные по некоторому числу скважин) хотят
получить куб пространственных свойств – скорости Vp, Vs, импеданс, пористость и т.д. (рис. 70).
Главная проблема сейсмической инверсии состоит в том, что задача обращения сейсмической
трассы является некорректной (в математическом смысле). Это означает, что малые
(микроскопические) различия в значении амплитуды на времени T ведут к большим (огромным)
различиям в значении свойств на глубине Z. В результате после инверсии двух соседних и очень
похожих трасс мы получаем два сильно различающихся вертикальных разреза (импеданса или
другого параметра). Мы полностью теряем горизонтальную непрерывность свойств. Понятно, что
такой результат нас не устраивает. Обычные средства регуляризации решения обратной задачи
(устранения некорректности) основаны на значительном понижении вертикального разрешения
модели, то есть на фактическом приближении его к разрешению сейсмических данных.
106
Суть алгоритма стохастической инверсии состоит в том, что вместо решения обратной задачи мы
много раз решаем прямую. Все шаги алгоритма показаны на рис. 71. Расчет начинается с того, что
в кубе исследуемого пространства случайным образом выбирается некоторая вертикаль. С
использованием разрезов импеданса по скважинам и вариограмм на выбранной вертикали
рассчитывается набор реализаций импеданса (допустим, 20 реализаций). Далее, применяя формулу
для коэффициента отражения от границы двух сред, по реализациям импеданса рассчитывают
трассы коэффициентов отражений. Затем эти трассы сворачиваются с сейсмическим импульсом, в
результате чего получаются 20 реализаций модельной трассы. Реализации модельной трассы
сравниваются (по тому или иному критерию) с соответствующей реальной трассой, после чего из
них выбирается наиболее близкая к реальной. Эта лучшая модельная трасса заносится в куб
модельных трасс, а породивший ее вертикальный разрез импеданса помещается в куб прогнозных
значений импеданса. Определенный таким образом разрез импеданса получает статус «разреза по
скважине». Дальше выбирается следующая случайная вертикаль, на которой все повторяется с тем
отличием, что при расчете на вертикали реализаций импеданса используется на одну скважину
больше.
После того, как мы обойдем все точки на плане XY, у нас будет куб модельных сейсмических
трасс и куб импеданса. Горизонтальная непрерывность куба импеданса обеспечивается
использованием горизонтальной вариограммы. Однако полученный куб импеданса мы не будем
рассматривать как окончательный прогноз – мы будем рассматривать его лишь как первую
реализацию куба импеданса. Затем мы точно так же рассчитаем вторую реализацию куба
импеданса и т.д. Имея несколько реализаций, мы будем представлять степень неопределенности
нашего прогноза.
107
Отметим еще одно обстоятельство, связанное с горизонтальной вариограммой. При отходе от
скважин вертикальные реализации импеданса получают большую свободу и их изменчивость
возрастает. Увеличивая число этих реализаций (до ста и более), на удалении от скважин мы можем
добиться сколь угодно высокой степени сходства между модельной и реальной сейсмикой. Но
большого смысла в этом не будет. Почему? Дело вот в чем. Даже имея разрез импеданса по
скважине (куда уж лучше), мы не можем точно воспроизвести зарегистрированную здесь же
реальную сейсмическую трассу. Главная причина понятна – разрез импеданса на скважине
определяется в другом частотном диапазоне и характеризует другой объем среды. Есть и
дополнительные причины – мы не очень хорошо знаем форму сейсмического импульса, не
учитываем ее изменение, не можем исключить влияние обрабатывающих процедур и т.д. Из этого
вытекает, что при сейсмической инверсии не следует стремиться к точности воспроизведения
сейсмики, более высокой, чем это возможно на скважине.
108
8. Использование стохастических реализаций
8.1. Использование стохастических реализаций при прокладке траектории скважины
Сейчас мы приведем еще один довод в пользу того, что множество стохастических реализаций
лучше одной детерминированной модели. Он касается случая, когда модель используется для
прокладки траектории новой скважины. Вероятность того, что одна из множества реализаций
окажется похожей на результаты бурения, несомненно выше.
109
Что мы видим на рис. 73? Сначала был произведен расчет большого числа реализаций модели и в
каждой из них подсчитаны запасы. Распределение полученных величин позволило дать
пессимистическую (P90), среднюю (P50) и оптимистическую (P10) оценку запасов. После этого из
множества реализаций модели были выбраны три, собственные значения запасов которых
находились вблизи оценок P90, P50 и P10. Выбранные реализации показаны на рис. 73. Цветовая
палитра отображает параметр NTG, голубой цвет соответствует минимуму NTG. Корректирующая
поправка к траектории скважины (выделена синим цветом) была рассчитана с учетом трех
выбранных реализаций.
⎡ ms ⎤
yk , j = ⎢⎢ md ⎥⎥
⎢⎣ d ⎥⎦ k , j
Здесь ms – статические параметры, значения в ячейках. Если у нас 20000 ячеек, то столбец ms
будет включать 20000 значений пористости и 20000 значений проницаемости. Однако если
считать, что между пористостью и проницаемостью имеется однозначная связь, то значения
проницаемости можно не включать. Далее, md – динамические параметры в ячейках (насыщения и
давления, плюс еще 40000 значений). Наконец d – характеристики дебита скважин (например,
110
коэффициенты обводнения, по числу скважин Nd). Индекс k есть индекс вектора состояния по
времени, индекс j есть индекс реализации. Мы полагаем, что всего у нас есть Ne реализаций
модели (допустим, Ne равно 100).
Индекс «f» означает «прогноз», про индекс «u» мы скажем чуть позже.
Поскольку у нас много реализаций, мы можем сосчитать ковариационную матрицу С fy,k (на
каждое время k). Это ковариация элементов вектора состояния друг с другом (рис. 74):
∑
Ne
1 f f
C yf,k = (Yk f, j − Y k )(Yk f, j − Y k )T
Ne − 1
j =1
Что можно сказать о показанной ковариационной матрице? На диагонали, как мы знаем, стоят
дисперсии (значений в реализациях). Блок «А» показывает ковариацию статических параметров
(пористости) в ячейках модели. Похожая матрица была у нас в разделе 3.2.1, но там шла речь о
точках данных, здесь – о всех ячейках модели. Если расстояние между ячейками меньше радиуса
вариограммы, соответствующий элемент матрицы C (блока «А») больше нуля, в противном
случае – равен нулю.
Элементы блока «Б» показывают ковариацию статических и динамических параметров в ячейках
модели. Элементы блока «B» показывают ковариацию статических параметров в ячейках модели и
111
дебитов скважин. Элементы блока «Г» показывают ковариацию дебитов скважин. И так далее. Все
элементы ковариационной матрицы (за исключением блока «A») связывают друг с другом
значения пористости, давления и насыщения в ячейках модели и значения дебитов скважин. Это
означает, что они являются аналогами уравнений гидродинамики. Но получили мы их
исключительно за счет статистики, то есть за счет того, что у нас есть 100 реализаций вектора
состояния.
Индекс «u» вектора состояния означает «исправленный». Матрица Cd, k есть ковариационная
матрица размера Nd x Nd, ошибок измерения реальных дебитов. Если названные ошибки
независимы, она является диагональной. Вспомогательная матрица Н имеет вид, показанный на
рис. 75. Она позволяет вырезать из ковариационной матрицы С fy, k и вектора y fk, j нужные
фрагменты.
112
В статье, которую мы разбираем (Bianco et al., 2007), приводятся результаты опробования
алгоритма на реальных данных. Они касаются площади, включающей 10 скважин, и имеющей
историю разработки продолжительностью 1065 дней. На рис. 76 показаны кривые отношения
газ/нефть по одной из скважин. Красные кривые представляют результаты гидродинамического
расчета по исходным реализациям геологической модели, синие кривые – по уточненным. Всего
использовалось 135 реализаций. Уточненными называются реализации, полученные на последнем
шаге процесса адаптации (16) – (17). Можно видеть, что кривые, рассчитанные по уточненным
реализациям, имеют меньший разброс и лучше соответствуют реальным данным.
Рис. 76. Отношение газ/нефть по скважине A1. Точки – реальные данные. Красные
кривые – расчет по исходным реализациям резервуара. Синие кривые – расчет по
уточненным реализациям резервуара. Bianco et al., 2007.
113
Рис. 77. Стандартное отклонение пористости в слое ячеек гидродинамической сетки.
Вверху – расчет по исходным реализациям. Внизу – расчет по уточненным
реализациям. Bianco et al., 2007.
Описанный пример вполне достоин того, чтобы закончить на нем нашу книгу. Но мы очень
коротко упомянем еще одну статью. Она описывает международный проект-соревнование в сфере
геологического и гидродинамического моделирования (Peters et al., 2009). Участникам проекта
были предложены данные в отношении площади «Brugge». Они включали результаты разработки
за первые 10 лет добычи (30 скважин, из них 10 нагнетательных и 20 добывающих), 104
стохастические реализации модели на гидродинамической сетке (60000 ячеек), а также давления и
насыщения по данным 4D сейсмики.
114
В таблице 2 перечислены участники проекта «Brugge» и методы адаптации модели к истории
разработки, которые они применяли. Что мы хотим показать, помещая эту таблицу? Во-первых,
мы хотим показать, кто сегодня является элитой в сфере геологического моделирования. Во-
вторых, мы хотим показать, что значительная часть участников проекта использовала подход к
адаптации на основе множественного фильтра Калмана (который мы только что разобрали).
Кто победил в проекте «Brugge»? Об этом вы при желании прочитаете сами. Скажу лишь то, что
разница между наиболее успешной и наименее успешной стратегиями разработки (по итогам 20-ти
лет, на одной площади с тремя десятками скважин) составила 0.4 миллиарда долларов. То есть мы
видим, какова цена знаний по геостатистике.
115
Заключение и благодарности
Подведем, наконец, окончательные итоги. Разумеется, работа не свободна от недостатков. Крайне
мал список литературы. Не упоминается имя основателя геостатистики Жоржа Матерона (и
многие другие достойные имена). Некоторым описаниям не хватает математической строгости.
Имеются пропуски. Отдельные вопросы изложены субъективно. Но мне самому, то, что
получилось, (субъективно) нравится.
Что еще я могу сказать в этой связи? На все остальные претензии я отвечу афоризмом нашего
директора А.С. Кашика: «Если я убеждаюсь, что чего-то не понимаю, я счастлив!»
У А.С. Кашика есть и второй афоризм: «Сделать за деньги не достижение, достижение – сделать
без денег!» Этот второй афоризм нравится далеко не всем. Тем не менее, он многое определяет в
атмосфере компании. Не думаю, что смог бы подготовить данную работу вне ЦГЭ. Хочу
высказать свою благодарность за многолетнюю поддержку (иногда – просто эмоциональную, но
очень часто – реальную) А.С. Кашику, Г.Н. Гогоненкову, С.Б. Денисову, С.И. Билибину,
Т.Ф. Дьяконовой.
Основная часть примеров, показанных в данной книге, подготовлена в программной системе DV-
Geo. Многолетнее упорство ЦГЭ в разработке собственной системы геологического
моделирования позволяет нам смотреть на мировых грандов (см. таблицу на предыдущей
странице) не снизу-вверх, а как на коллег-соперников. Считаю необходимым назвать тех, кто
делает систему DV-Geo. Руководитель разработки – М.В. Перепечкин, ответственная за
разработку интерфейсов – Е.А. Духанова, главный тестировщик – И.А. Глобенко, разработчик
геостатистического модуля – Д.И. Матросов. Я счастлив, что также являюсь членом этой группы.
116
Ссылки
1. Bianco, A., Cominelli, A., Dovera, L., Naevdal, G., Valles, B., 2007, History Matching and Production
Forecast Uncertainty by Means of the Ensemble Kalman Filter – A Real Field Application, SPE-107161,
10 p.
2. Chiles, J.P., Delfiner, P., 1999, Geostatistics. Modeling Spatial Uncertainty, Wiley Series in Probability
and Statistics, Wiley & Sons, 695 p.
3. Daly, C., Caers, J. 2010, Multi-point geostatistics – an introductory overview, First Break, Vol. 28, No.
9, p. 39-47.
4. Deutsch, C.V., and Journel, A.G., 1992, GSLIB, Geostatistical Software Library and User's Guide,
New-York, Oxford University Press, 340 p.
5. Doyen, P.M., 1988, Porosity from Seismic Data: A Geostatistical Approach, Geophysics, Vol. 53, No.
10, p. 1263-1275.
6. Dubrule, O., 2003, Geostatistics for seismic data integration in earth models: SEG Distinguished
Instructor Series No. 6. (В 2005 году вышел перевод данной книги на русский язык, 296 с.)
7. Gordon, J., Shortliffe, E., 1985, A method for managing evidential reasoning in a hierarchical
hypothesis space, Artificial Intelligence, Vol. 26, p. 323-357.
8. Kovalevskiy E.V., 2007, Fuzzy geological model. Petroleum Geostatistics, Cascais, Portugal.
9. Peters, E., Arts, R.J., Brouwer, G.K., Geel, C.R., 2009, Results of the Brugge Benchmark Study for
Flooding Optimization and History Matching, SPE-119094, 21 p.
10. Демьянов В.В., Савельева Е.А., 2010, Геостатистика, теория и практика. Москва, Наука, 327 с.
12. Ковалевский Е.В., Перепечкин М.В., 2011, Нечеткая геологическая модель. Препринт доклада
на конференции «Инновации в нефтяной геологии и геофизике», ОАО «ЦГЭ», 7-8 апреля 2011 г.
13. Ставинский П.В., Левин Д.Н., Прудников А.А., Бирун Е.М., 2011, Методика и результаты
анализа неопределенностей и рисков при оценке запасов и планировании бурения скважин. Тезисы
докладов геофизической конференции ЕАГО «Сочи-2011».
14. Шелков В.Г., Богачев К.Ю., 2010, Новый подход для реалистичного моделирования трещин
ГРП и техногенных трещин на полномасштабных гидродинамических моделях, SPE-138071,
Российская нефтегазовая конференция и выставка SPE, Москва.
117
14549-SLT RU handout.indd 2 09-09-11 10:20