Вы находитесь на странице: 1из 27

НАО КАРАГАНДИНСКИЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

УДК ___________

УТВЕРЖДАЮ
Руководитель УПО
___________ А.Т.Шахатова
«___» __________ 2022 г.

ОТЧЕТ
ПО НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЕ МАГИСТРАНТА
ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА
7M07305 - «ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ ЗЕМЛИ»

СОВЕРШЕНСТВОВАНИЕ МЕТОДА АВТОМАТИЗИРОВАННОГО


ГЕОИНФОРМАЦИОННОГО КАРТОГРАФИРОВАНИЯ НА ОСНОВЕ
ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ
(3 семестр, 6 кредитов)

Заведующий кафедрой
МДиГ, к.т.н. доцент __________________ Е. Н. Хмырова
(подпись, дата)

Научный руководитель
д.т.н., доцент __________________ С.Г. Ожигин
(подпись, дата)

Магистрант
гр. ДЗЗМ-21-2 _________________ Д.Р. Валеев
(подпись, дата)

Караганда 2022 г.
Содержание

Введение 3
1. История становления ГК . 65
1.1 Методы геоинформационного картографирования 7
2 Анализ применения математической основы в ГК 8
2.1 Использование нейронных сетей для целей анализа данных ДЗЗ……11
2.2 Основные идеи метода анализа данных в ГИС с помощью
искусственных нейронных сетей
12
2.3 Искусственные нейронные сети (ANNs) 13
2.3.1 Функции активации 14
2.3.2 Использование ИНС в дистанционном зондировании 15
2.3.3 Классификация растительного покрова 15
2.3.4 Важнейшие вопросы применения ANNS 15
2.4 Проблема интеграции НС и ГИС 22
2.5 Реализация программн. комплекса для НС-анализа данных в ГИС 22
2.6 Структура и функции программной системы 24
3. Разработка методов создания автодорожных карт и их проблемных мест
на территории Карагандинской области 26

2
Введение

Дистанционное зондирование предполагает получение информации о


поверхности Земли путем изучения данных, полученных устройством, которое
находится на расстоянии от поверхности земли. Специальные камеры собирают
изображения с дистанционным зондированием, которые помогают
исследователям “чувствовать” вещи на Земле.
Дистанционное зондирование – это метод съемки и сбора данных,
используемый для обследования и сбора данных об объекте, в то время как
ГИС - это компьютерная система, состоящая из программного обеспечения,
используемого для анализа собранных данных, и аппаратного обеспечения, в
котором программное обеспечение будет работать.
Геоинформационное картографирование (ГК) – отрасль картографии, его
суть составляет информационно-картографическое моделирование геосистем.
Главная задача ГК – создание карт как образно-знаковых моделей
действительности; ее решение связано с применением стандартных и
разработкой специализированных ГИС- технологий и новых методов
картографирования на их основе.
Для ГК важно не только автоматизированное воспроизводство
картографического изображения, но и автоматизация использования карт,
например в ГИС, для создания новых карт, автоматизации исследований по
картам. Устройства графического вывода данных – экраны мониторов –
позволяют автоматизировать процесс проектирования и составления карт.
ГИС-система в основном используется для анализа сложных данных и
интерпретации огромных наборов данных в более значимую информацию; в то
же время технология дистанционного зондирования используется для сбора
данных, которые затем анализируются с помощью ГИС. Эти данные
предоставляют необходимую информацию.
Технология дистанционного зондирования имеет более сложный
пользовательский интерфейс, чем ГИС-система, поскольку она в основном
используется в качестве инструмента сбора данных. Для интерпретации
интерфейса требуется более квалифицированный персонал. ГИС использует
более упрощенный пользовательский интерфейс, который позволяет любому
научиться интерпретировать тонны данных в системе.
ГИС-система самодостаточна и может использоваться для анализа больших
наборов данных с гораздо меньшими затратами времени, денег и ресурсов.
Один человек может анализировать огромные объемы данных для получения
более сложной информации об объекте или явлении на поверхности земли.
Благодаря своей способности анализировать обширную и сложную
информацию одновременно, ГИС-система поддерживает огромные объемы
данных одновременно, а также может допускать неограниченное
редактирование данных без риска коллапса или повреждения. Данные
дистанционного зондирования ограничены конкретной изучаемой областью,

3
они имеют ограниченные возможности для интерпретации данных, а также
более восприимчивы к повреждениям.
Исходя из вышесказанного, дистанционное зондирование можно
рассматривать как движущую силу для ГИС. Он предоставляет данные, для
анализа которых мы используем ГИС (географическую информационную
систему).
Целью исследования является совершенствование методики
автоматизированного геоинформационного картографирования на основе
данных дистанционного зондирования Земли.
Предметом исследования является процесс формирования наборов
пространственных данных по материалам ДЗЗ для целей автоматизированного
геоинформационного картографирования.
Новизна исследования заключается в изменении правил цифрового
описания пространственных объектов, что позволяет создавать и обновлять
геоинформационную картографическую основу в сжатые сроки без ухудшения
качественных и количественных характеристик конечного продукта.

4
1 История становления ГК

Начальный этап становления автоматизированной картографии как нового


направления в картографии относится к концу 50-х годов. Он обусловлен
несколькими факторами, связанными с совершенствованием аппаратных
средств, особенно графических, и с открытием доступа к ЭВМ, в первую
очередь на Западе, не только для пользователей-математиков и системных
программистов. Так в институте географии Вашингтонского университета
период наиболее активных исследований – 1958-1961 гг. ознаменовался
развитием статистических методов, программирования в целях компьютерной
картографии. В. Тоблером (Tobler W.) были разработаны компьютерные
алгоритмы для картографических проекций.
В 60-х и начале 70-х годов персональные интересы определяли направление
и приоритеты исследований в области машинной картографии. Стремление к
переменам зародилось в двух сообществах:
среди специалистов разных научных областей, стремившихся к ускоренному
составлению карт для того, чтобы отразить результаты моделирования или
представить уже оцифрованные данные обширных архивов, при этом качество
карт не имело первостепенного значения;
среди картографов, стремившихся уменьшить затраты средств и времени на
создание и издание карт.
Первым значительным пакетом программ для этих целей стал SYMAP,
выпущенный в 1967 г. Гарвардской лабораторией машинной графики и
пространственного анализа. SYMAP разрабатывался с 1964 года как пакет
программ общегеографического картографирования. Вывод результатов
осуществлялся только на построчно-печатающее устройство, карты имели
низкое разрешение и плохое качество. Пакет был функционально ограничен,
однако прост в использовании, особенно для пользователей, не имеющих
картографической подготовки. Это была первая наглядная демонстрация
возможности автоматизированного картографирования, которая пробудила
огромный интерес к ранее неизвестным технологиям.
В конце 60-х годов появился пакет GRID – первый опыт растровых ГИС, в
котором для вывода растровых карт использованы способы, аналогичные
SYMAP, однако в нем уже были реализованы идеи ГИС- технологии оверлея.
Для работы с данными переписи населения в 1970 г. возникла потребность в
методах точной географической привязки данных переписей – адресное
геокодирование для перевода почтовых адресов в географические координаты
и привязки к переписным зонам. В результате впервые были созданы массивы
цифровой пространственной информации. Сразу после переписи 1970 года
стали создаваться атласы городов, несложные компьютерные карты которых
использовались для целей маркетинга, организации розничной торговли, но в
то же время стимулировали разработку современных программ статистического
картографирования.

5
В институт исследования систем окружающей среды (ESRI), который был
основан Джеком Данжермондом в 1969 году, шло постепенное развитие
растровых и векторных систем на базе теоретических идей и методов,
разработанных в Гарвардской лаборатории и других организациях. В начале 80-
х годов создана система ARC/INFO, в которой удачно реализованы идеи
Канадской ГИС о разделении информации о пространственной и атрибутивной
составляющих данных. ARC/INFO стала первым ГИС- и картографическим
пакетом, использующим преимущества персональных компьютеров.
На начальных этапах становления (во второй половине 80-х годов)
геоинформационное картографирование воспринималось как процесс
автоматизированного воспроизводства карт. Дальнейший этап развития связан
с разработкой теории и методов создания картографических баз данных и
математико-картографического моделирования, создания картографических
моделей как физических явлений, например, цифровых моделей рельефа
(ЦМР), так и моделей картографического изображения для представления карт
на стандартных листах АЦПУ универсальных ЭВМ. С этим периодом связаны
разработки первых автоматизированных картографических систем (АКС), к
числу которых относится и система "АКС-МГУ", созданная на кафедре
картографии географического факультета МГУ в 1987 г.
Основной причиной прогресса в ГК с начала 90-х годов явилось бурное
развитие электронно-вычислительной техники, и особенно персональных
компьютеров (ПК), а также возрастание ее доступности во всем мире. Если
прежде основные усилия были направлены на получение цифровых карт и
обработку больших объемов информации, то теперь, освободившись от
необходимости программирования рутинных процедур управления вводом и
выводом данных, картографы переключились на методы анализа,
проектирования и составления, создания и использования карт в ГИС, базах
данных и знаний, экспертных системах.
Основные отличительные особенности систем геоинформационного
картографирования и ГИС содержатся в подсистемах хранения, обработки и
вывода информации. Они связаны с содержанием базы данных и набором
программ для моделирования, анализа и отображения информации с целью
создания карт. Цифровая картографическая информация организуется в
картографические БД (КБД). Они представляют упорядоченное множество
взаимосвязанных цифровых карт – цифровая модель карты, созданная путем
цифрования картографических источников, фотограмметрической обработки
данных дистанционного зондирования, цифровой регистрации данных полевых
съемок или иным способом; в отличие от цифровых пространственных данных
в ГИС и цифровых моделей местности.

6
1.1 Методы геоинформационного картографирования

Многие методы и ГИС-технологи создания карт базируются на


использовании баз пространственных данных и алгоритмических процедур,
применяемых в ГИС для выполнения пространственного анализа и
моделирования.
Создание общегеографических карт наиболее сложно поддается
автоматизации. Общегеографические карты (топографические, обзорно-
топографические и обзорные), имеющие многоцелевое применение, должны
отображать совокупность всех видимых элементов местности, обладать
заданной точностью при выбранном масштабе, иметь унифицированное
зарамочное оформление и показывать объекты унифицированными символами
и цветом. Основные ГИС- технологии создания таких карт – жестко
топологически контролируемый оверлей и запросы к данным. Большинство же
операций обеспечивается грамотной интерактивной работой пользователя.
Картографические возможности создания тематических карт,
отображающих структуру распределения и взаимосвязи объектов или явлений,
существенно шире.
Одним из быстро развивающихся направлений ГК стало оперативное
картографирование, которое трактуется, как создание и использование карт в
реальном или близком к реальному времени с целью быстрого
(своевременного) информирования пользователей и воздействия на ход
процесса. Оперативные карты предназначены не только для изучения
динамики, но и для решения более широкого спектра задач, включая
инвентаризацию объектов, предупреждение о неблагоприятных или опасных
процессах, слежение за их развитием, составления рекомендаций и прогнозов,
выбор вариантов контроля, стабилизация или изменение хода процесса в самых
разных сферах - от экологических ситуаций до политических событий.
Организации, работающие в области ГИС- технологий, стали усиленно
использовать Интернет для того, чтобы сделать геоинформацию, включающую
цифровые снимки и карты, доступной для широкого круга профессионалов.
Обилие геоизображений, обращающихся в Интернет, делает очевидным для
многих специалистов возможность интеграции ГИС- технологий и
высокоскоростных электронных сетей для создания и модернизации ГИС, баз
данных и картографирования. Введены новые термины "Веб-ГИС", "Интернет-
ГИС", "Интернет-картографирование". На многочисленных сайтах в Интернет
можно найти:
 карты и целые атласы, полученные сканированием печатных оригиналов;
 аэро- и космические снимки, в том числе в цифровом формате,
пригодные для использования в ГИС;
 карты, атласы, трехмерные модели и др. геоизображения, созданные
специально для Интернета;
 интерактивные геоизображения, составляемые и обновляемые по
запросам пользователей.

7
2 Анализ применения математической основы в геоинформационном
картографировании
Геоинформационное картографирование – это есть результат
взаимодействия общей информатики и картографии (рисунок 1). Точнее она
новое интегрированное научное направление, которое находится на
перекрестке таких направлений как автоматизированная картография и
дистанционное зондирование, аэрокосмические снимки, включая цифровую
фотограмметрию и дешифрирование и геоинформатика.

Рисунок 1 – Схема геоинформационной картографии

Причины, которые оказывают сильное влияние на геоинформационной


картографии следующие:
 Внедрение в практику и научное исследование новых геоизображений
таких, как электронные карты, фото-карты, космические снимки.
 Внедрение компьютерного составления карт и автоматизированной
системы (АК) в картографию, поскольку это и есть ядро ГИС.
 Основой выщесказанных двух является изучение геосистем и системы
моделирования картографии.

Временное изменение любого явления можно охарактеризовать как


функцию:
F=f(x, y, t). (1)
При данной функции в случае фенологического и экологического
картографирования, если определенный момент времени t отметим t=const,
тогда пространственные координаты x, y, z переводится на плоскость (x,y)
следующим выражением: z= f(x, y) (2)

8
Выразим z с помощью матриц:

z 11 z 12 z 13 … … … … … . z 1 n
Z = z 21 z 22 z 23 … … … … . z 2 n
zm1 zm2 zm 3 … … … zmn

Если учесть, что координаты целых чисел i = 1, 2, 3,….., m j = 1, 2, 3,….., n


тогда координаты x, y можно выразить как следующие функции, воспринимая
коэффициенты Sx, Sy: x=Sxi ; y= Syj ; (4)
В случае Sx=Sy это и есть карта в картографической проекции
прямоугольной сетки.
Когда мы создаем карту с множеством разных тематических элемент,
матрицы (3) можем выразить как функции: Z1=f1(x,y), Z2=f2(x,y), (5) ………….
Zr=fr(x,y)
Выражения (1-5) и есть алгоритм традиционной картографии.
Геоинформафионное картографирование аналогично проходит эти этапы.
Например:
1. Преобразование аналоговых данных в цифровые.
2. Обработка цифровой модели рельефа (ЦМР).
3. Составление цифровой карты с помощью ЦМР.
4. Обработка геоинформационных баз данных.

Когда мы обрабатываем геоинформационные баз данных (процесс


кодирования множество объектов географическими координатами), четвертый
этап мы выражаем с помощью следующих функций:
F1=f(x,y,z,) и F2=f(x,y,z,E), (6)
где =const - название объекта, E=const - характеристика объекта.
Отсюда следуют: z1= (x, y) (7) z2=E (x,y) (8)
Если z изобразить через следующие матрицы:
z 11 z 12 z 13 … … … … … . z 1 n
Z1 = z 21 z 22 z 23 … … … … . z 2 n
zm1 zm2 zm 3 … … … zmn

z 11 z 12 z 13 … … … … … . z 1 n
Z2 = 21
z z 22 z 23 … … … … . z 2 n
zm1 zm2 zm 3 … … … zmn

где координаты целых чисел


i = 1, 2, 3,….., m
j = 1, 2, 3,.., n
(z11 z 12 z 13 … z 1n – это и есть члены матриц, но каждый член мы
выражаем как функция Z1=f1(x,y) и т.д.).

9
Следовательно, координаты x, y можем выразить как следущие уравнения по
коэффициентам Sx, Sy:
x=Sxi ; y= Syj . (11)
Когда со использованием типичных информационных основ, как например,
топографической информационной основы определенного масштаба,
обрабатываем тематические информационные базы данных, то функция (5)
примет вид:
Z1=1E1(x,y),
Z2=2E2(x,y),
Zr=rEr(x,y). (12)
Следовательно, выражения (6-12) и есть та новая функция, которая
применима в геоинформационной картографии, основываясь на традиционных
картографических алгоритмах.

X1

X2
Y

Xn

Рисунок 2 – Схема искусственной нейронной сети

10
2.1 Использование нейронных сетей для целей анализа данных
дистанционного зондирования земли

Дистанционное зондирование – это эффективный инструмент для


мониторинга Земли с низкими затратами и в короткие сроки. Тем не менее,
когда проводится строгая оценка точности (например, на основе непредвзятой
выборки и независимой классификации мест проверки), результаты,
полученные с помощью дистанционного зондирования, часто разочаровывают,
что делает любое улучшение методов анализа критически важным.
Идея нейросетей заключается в моделировании (повторении) поведения
различных процессов на основе исторической информации. Сама нейросеть
представляет собой набор специальных математических функций с множеством
параметров, которые настраиваются в процессе обучения на прошлых данных.
Затем обученная нейросеть обрабатывает исходные реальные данные и выдает
свой прогноз будущего поведения изучаемой системы. Суть нейросети
заключается в стремлении подражать происходящим процессам. По своей
структуре нейронная сеть аналогична мозгу человека и также способна к
обучению
Главное отличие нейросетевых моделей от кривых роста или регрессионных
методов состоит в том, что если указанные методы подгоняют реальный
процесс или явление под стандартную математическую функцию, то
нейронные сети подбирают параметры системы уравнений, приводя ее к
реальной жизни.
С начала 1990-х годов искусственные нейронные сети (Artificial neural
networks, ANNs/ИНС), также известные как нейронные сети, применяются для
анализа изображений дистанционного зондирования с многообещающими
результатами. Как показано на рисунке 1, использование ANNs
распространилось в сообществе дистанционного зондирования, что привело к
увеличению числа исследований, о которых сообщалось в литературе в
последние годы.

11
Рисунок 1. Количество исследований с использованием ANNs при анализе
изображений с дистанционным зондированием, о которых сообщалось в
литературе за период с 1990-2005 гг.
2.2 Основные идеи метода анализа данных в ГИС с помощью искусственных
нейронных сетей

Быстрое внедрение нейронных подходов в дистанционном зондировании


обусловлено главным образом их широко продемонстрированной
способностью изучать сложные паттерны, принимая во внимание любые
нелинейные сложные взаимосвязи между экспликативными и зависимыми
переменными, обобщать в шумных средах, что делает ANN надежными
решениями при наличии неполных или неточных данных (Hewitso, включить в
анализ априорные знания и реалистичные физические ограничения и (iv)
включать в анализ различные типы данных из-за отсутствия допущений
относительно используемого набора данных (например, нормально
распределенных данных).
Эта последняя характеристика позволяет объединять данные с различных
датчиков и вспомогательные данные, такие как высота, наклон, текстура или
категориальные данные, такие как тематические карты.
Дополнительным преимуществом подхода ANN является то, что ANN
выполняют контролируемую классификацию, используя меньше обучающих
данных, чем максимальная вероятность, поскольку правила распознавания
категории основаны на характеристиках не только обучающих данных этого
конкретного класса категории, но и других классов.
Более того, ANNS допускают нечеткие классификации, рассматривающие
значения активации как нечеткие показатели принадлежности к классу.
Эти нечеткие значения также могут быть интерпретированы с точки зрения
определенности классификации.
В результате этих качеств сообщалось, что ANNS работают более точно,
чем другие методы, такие как статистические классификаторы, особенно когда
пространство признаков является сложным, а исходные данные имеют
различное статистическое распределение. Сравнительные исследования
показали, что ANNS могут использоваться для классификации данных
дистанционного зондирования более точно, чем максимальная вероятность.
Однако сравнительные исследования между новым и традиционным
методом, как правило, предвзяты, поскольку ученые, предлагающие новый
метод, обычно лучше знакомы со своим собственным новым алгоритмом, чем с
тем, который используется для сравнения, и статьи, в которых представлен
новый метод, который работает лучше, чем обычные, с большей вероятностью
будут опубликованы. Уилкинсон (2005) провел сравнение более 500
результатов классификации, появившихся в литературе за последние 15 лет, и
обнаружил, что за этот период времени не произошло реального улучшения
точности классификации и что нет заметной разницы в точности
классификации между нейронными и не нейронными подходами. Наконец, в

12
нескольких исследованиях сообщалось, что ANNS превосходят другие методы.
Таким образом, превосходство подхода ANN не так очевидно, как ожидалось
при поверхностном рассмотрении, и требуется более глубокое изучение.

2.3 Искусственные нейронные сети (ANNs)

В этом разделе представлен обзор основных концепций, лежащих в основе


области ANNS, наиболее часто используемой в дистанционном зондировании.
Эти концепции включают в себя архитектуру и схемы обучения. Поскольку
обучение тесно связано с архитектурой, мы обсудим алгоритмы обучения,
соответствующие каждой из архитектур, представленных в этом разделе.
Область ANNs – это одна из техник в области искусственного интеллекта,
известная как nature inspired. Эта область была мотивирована вычислительным
механизмом человеческого мозга. Мозг выполняет очень сложные,
нелинейные, параллельные вычисления. Мозг обладает сложной структурой и
способностью к самоорганизации, создавая свой собственный массив знаний в
том, что мы обычно называем опытом. В первые два года жизни человеческий
мозг развивает набор связей, которые обеспечивают человека моделью
окружающего его мира.
ANN - это машина, которая моделирует способ, которым мозг выполняет
определенную задачу.
ANNS имеют много преимуществ перед традиционными вычислительными
методами. ANN, состоящий из нелинейных элементов, сам по себе нелинейен,
может учиться у учителя отображению ввода–вывода, способен адаптировать
свои синаптические веса для адаптации к окружающей среде, способен
работать с неполной информацией и обеспечивает ответы в условиях
неопределенности. Стоит отметить, что ANN мотивированы или вдохновлены
аналогией с мозгом, но мотивация создания искусственного мозга сильно
отстает. В настоящее время мы рассматриваем ANN как парадигму для
выполнения вычислений эффективным и действенным способом, а не как
попытку воспроизвести биологический мозг. Чтобы противопоставить
различную природу мозга и ИНС, мы можем упомянуть, что события в
кремниевых чипах происходят за наносекунды, в то время как реакции в
нейронах происходят за миллисекунды. Чтобы компенсировать скорость, мозг
использует массивные параллельные вычисления. В коре головного мозга
человека насчитывается около 10 миллиардов нейронов и 60 триллионов
соединений. Что касается энергопотребления, то мозгу требуется примерно 10-
16 Джоулей на операцию в секунду, в то время как соответствующее значение
для компьютеров составляет около 10-6 Джоулей на операцию в секунду.

13
Рисунок 2 – Анатомия искусственного нейрона.

Нейрон описывается в математических терминах следующими


уравнениями:

где w0 рассматривается как смещение, а x0 = 1.


Способ, которым нейроны расположены в нейронной сети, известен как
топология сети или архитектура. Тип архитектуры, используемой в ANNs,
тесно связан с алгоритмом обучения. Архитектуры ANN грубо разделены на
три категории: (i) однослойные сети с прямой связью, (ii) многослойные сети с
прямой связью и (iii) рекуррентные сети. Эти архитектуры обсуждаются в этом
разделе.

2.3.1 Функции активации


Функция активации, ϕ(v), определяет выходной сигнал нейрона в терминах
линейной комбинации входных сигналов, v. Существуют различные виды
функций активации: пороговая функция, кусочно‐линейная функция и
логистическая (сигмоидальная) функция (см. рисунок 3).

14
Рисунок 3. Функции активации: (а) пороговая, (б) кусочно‐линейная, (в)
логистическая (сигмоидальная) и (г) гиперболическая.

Наиболее часто используемой является логистическая функция активации,


определяемая уравнением (2)

где a>0 - параметр наклона; чем больше значение a, тем круче кривая.

2.3.2 Использование ИНС в дистанционном зондировании

Основными задачами анализа данных дистанционного зондирования, в


которых сообщается о применении ANNS, являются классификация, чаще
классификация растительного покрова, разделение и извлечение
биофизических параметров растительного покрова. Сообщается также о
применении ANNS для обнаружения изменений, объединения данных,
прогнозирования, предварительной обработки, привязки к географическому
положению и распознавания объектов.

2.3.3 Классификация растительного покрова


Классификация растительного покрова - это процесс, при котором пиксели
группируются в соответствии со сходством их спектральных свойств. Если
пиксель удовлетворяет определенному набору критериев, то он присваивается
классу растительного покрова, который соответствует этим критериям.
Это наиболее распространенная задача, решаемая с помощью
дистанционного зондирования, и существует множество приложений, в
которых используются как контролируемые, так и неконтролируемые ANN.

15
Из-за отсутствия предположений о данных, многие классификации
растительного покрова используют данные от различных датчиков, таких как
оптические и радарные изображения, текстуры и вспомогательные данные.
Текстура включается различными способами: (i) предварительно вычисленная
информация о текстуре для каждого пикселя, которая подается в ANN вместе
со спектральной информацией или (ii) включение соседней спектральной
информации с использованием скользящего окна.
Вспомогательной информацией, наиболее часто используемой в настоящее
время, являются топографические переменные, полученные из цифровой
модели рельефа. Другими переменными являются координаты
(широта/долгота) и расстояние до побережья и почвы. Были предприняты
некоторые попытки разработать классификаторы, основанные на синергизме
между ANNS и системами, основанными на знаниях.

2.3.4. Важнейшие вопросы применения ANNS


Хотя нет необходимости проверять, выполняются ли определенные
допущения, как в статистических методах (например, проверять нормальность
спектральных характеристик при классификации с максимальным
правдоподобием), использование ANNS может показаться более сложным, чем
статистические классификаторы, особенно для новых пользователей, из-за
проблем, связанных с их разработкой и внедрением. Производительность ANN
зависит от ее архитектуры и от метода представления данных и проведения
обучения. Правильно реализованный ANN, как правило, обеспечивает лучшую
производительность, чем стандартные статистические подходы. Тем не менее,
неправильно спроектированная или обученная сеть дает худшие результаты,
чем стандартные методы, такие как метод максимального правдоподобия. В
последние годы применение ANNS для классификации изображений стало
объектом многочисленных исследований (Openshaw 1994, Atkinson and Tatnall
1997). Однако до сих пор не существует общепризнанных стандартных методов
для реализации оптимальной сети. Остальная часть этого раздела касается
основных элементов, которые должны быть определены на этапе
проектирования и обучения ANN. Этими элементами являются характеристики
обучающих данных и предварительная обработка, структура и наиболее
подходящая архитектура ANN, используемый алгоритм обучения и настройка
параметров, а также способ остановки обучения.
За последние два десятилетия значительно увеличился объем доступных
пространственных данных (изображения с высоким пространственным или
временным разрешением, вспомогательные данные), и обычные методы
обработки не в состоянии проанализировать такие большие объемы данных.
Среди новых методов анализа ИНС продемонстрировали свою гибкость при
объединении данных из нескольких источников для улучшения обработки, и,
как следствие, использование ИНС в дистанционном зондировании неуклонно
расширяется. Большое количество исследований показало, что подход ANN
превосходит традиционные методы в широком спектре задач, таких как

16
классификация, размешивание, поиск биофизических параметров, обнаружение
изменений и объединение данных, среди прочего. Однако применение ANNS в
дистанционном зондировании сопряжено с некоторыми ограничениями,
которые не были полностью устранены.
Еще одна трудность, с которой сталкиваются при использовании многих
моделей ANN, заключается в определении подходящих характеристик для
обучающих данных, архитектуры сети (количество уровней и узлов) и метода,
позволяющего избежать перетренированности. Существует большое
количество правил, часто противоречивых, но нет стандарта, который помог бы
в выборе таких параметров. Часто требуется несколько экспериментов, чтобы
определить параметры, которые дают наилучшие результаты.
Несмотря на то, что был накоплен достаточный опыт в использовании
ANNS для обработки изображений с дистанционным зондированием, все еще
необходимы испытания, ориентированные на желаемую задачу, прежде чем
использовать их регулярно в оперативных проектах. Применение ANNS в
дистанционном зондировании все еще находится в стадии разработки;
необходимо протестировать больше типов сетей, стратегий проектирования и
обучения. В этом аспекте большой опыт можно получить из других областей
знаний, связанных с обработкой сигналов и изображений, таких как обработка
медицинских или промышленных изображений. Однако ограничения при
внедрении ANNS в программное обеспечение дистанционного зондирования
являются серьезным препятствием для разработки практического рутинного
применения ANNs в этой области.

2.3 Применение машинного обучения в ГИС и дистанционном зондировании

Машинное обучение (machine learning/ML) – это подразделение


искусственного интеллекта, в котором машина обучается на основе
машиночитаемых данных и информации (Verma & Verma, 2021). Он использует
данные изучает закономерности и прогнозирует новые результаты (Maxwell,
Warner, & Fang, 2018). Его популярность растет, потому что он помогает понять
тенденцию и предоставляет решение, которое может быть либо моделью, либо
продуктом. Существует четыре типа подходов к машинному обучению:
контролируемое, неконтролируемое, полууправляемое и обучение с
подкреплением. При контролируемом обучении предоставляются помеченные
обучающие данные; при неконтролируемом обучении предоставляются
немаркированные обучающие данные. Подход к обучению с полуконтролем
представляет собой гибрид как контролируемого, так и неконтролируемого
обучения, где для обучения предоставляется в основном маркированная
информация. Тем не менее, модель может самостоятельно определять
тенденцию в данных. В подкреплении обучаясь, агент учится методом проб и
ошибок принимать решения и справляться с интерактивной средой [4]. Проект

17
ML состоит из нескольких этапов, и каждый шаг должен быть тщательно
спланирован (рисунок 1).
В последние годы применение алгоритмов машинного обучения резко
возросло в Г.И.С. и дистанционном зондировании. Он имеет широкий спектр
применений, от разработки моделей, основанных на энергии, до оценки
разжижения почвы и установления связи между качеством воздуха и
смертностью.
Другие примеры включают качественную и количественную оценку данных
датчиков спутниковых снимков для оценки качества воздуха в региональном и
городском масштабе, машина опорных векторов подход к коэффициентам
продольной дисперсии в естественных потоках, кризисное управление,
стихийные бедствия, линейное программирование для планирования орошения,
глобальное изменение климата и прогноз погоды, состояние оценки точности
классификации растительного покрова, загрязнители воздуха и источники,
связанные с воздействием на здоровье, обнаружение поселений особенности
такие, как извлечение участков дорог/хайвеев и канав, выявление болезней
сельскохозяйственных культур и оценка их урожайности, построение индексов
растительности, реагирование на стихийные бедствия и вспышки болезней.
Кроме того, исследователи / пользователи получают выгоду от
общедоступных наборов данных дистанционного зондирования, используя
которые они могут разрабатывать, тестировать и запускать свои модели ML для
их исследования. Большинство наборов данных дистанционного зондирования
являются глобальными и беспристрастными это еще больше упрощает рабочий
процесс при построении точных моделей ML в этой области.
Кроме того, исследования на основе дистанционного зондирования не
прекращаются из-за стихийных бедствий или неожиданных аварий. Здесь, в
этой статье, мы обсуждаем наиболее популярные контролируемые модели ML
(классификация и регрессия) в G.I.S. и дистанционном зондировании.
Мотивацией для написания этой статьи является что модели машинного
обучения обеспечивают более высокую точность, чем традиционные
параметрические классификаторы, особенно для сложных данных со многими
предикторными переменными. Таким образом, статья может стать
руководством для тех, кто заинтересованв использовании моделей ML в своих
проектах, основанных на G.I.S. и дистанционном зондировании. В этом
документе представлен общий обзор 4 контролируемых непараметрических
моделей ML, которые могут быть использованы в большинстве проектов,
основанных на G.I.S. и дистанционном зондировании.
Мы обсуждаем классификацию (наивный Байес (NB), машина опорных
векторов (SVM), случайный Лес (RF), Деревья решений (DT)) и регрессионные
модели (Случайный лес (RF), поддержка Векторная машина (SVM), линейная,
Граф и Пуассон) здесь. Биномиальные и многоклассовые модели
классификации более распространены в проектах, основанных на ГИС и
дистанционном зондировании. Если классификация состоит из двух классов,

18
классификатор называется биномиальным; если существует более двух классов,
категория является многоклассовой.

Рисунок 4 - Разработка данных в мире G.I.S.

Контролируемые модели машинного обучения в Г.И.С. и дистанционном


зондировании
Собственные байесовские алгоритмы
Эти контролируемые модели наиболее просты в построении, менее сложны
и могут быть применены к массивным наборам данных. (Лю и др., 2017) Это
быстро. Однако наивная байесовская классификация не может быть
использована для непрерывных числовых значений (Ситти, Нагаи, Дейли и
Нинсават, 2016). Он игнорирует шум, следовательно, может привести к
неточным прогнозам.
Есть три типа наивного Байеса: гауссовский, многочленный, Бернулли.
Гауссов предполагает, что распределение является нормальным. Многочлен для
дискретных подсчетов и Бернулли для двоичных результатов. Эти
классификаторы эффективны для многоклассовых прогнозов. Эти модели
могут быть наилучшим образом использованы при создании моделей
наилучших методов управления (B.M.P.s), моделей пригодности среды
обитания, прогнозирования погоды.

Случайный лесной классификатор


Это контролируемая классификационная модель, которая может быть
применена к классификационным и регрессионным моделям. Он представляет
собой набор деревьев решений и прогнозирует результаты на основе
нескольких моделей / подмоделей. Поэтому он также известен как ансамблевый
классификатор. R.F. работает по принципу пакетирования при создании
моделей, что означает, что он создает различные модели на основе
подмножества данных обучающей выборки, и результат основан на

19
большинстве/среднем из подмоделей. Многочисленные исследования
показывают, что количество деревьев, как правило, не оказывает
существенного влияния на итоговую точность классификации R.F., если их
количество достаточно велико (Kulkarni & Lowe, 2016). Это связано с тем, что,
когда количество деревьев в классификаторе невелико, прогнозирование
точности увеличивается по мере добавления дополнительных деревьев.
Тем не менее, точность имеет тенденцию к снижению при большом
количестве деревьев. Некоторые общие примеры проектов, которые могут быть
решены с помощью R.F. алгоритм включает в себя: классификацию
растительного покрова землепользования, извлечение признаков, таких как
участки канав, дороги, поселения или объекты, представляющие интерес,
обнаружение объектов, таких как породы деревьев, транспортное средство,
идентификацию видов, таких как тигры, слоны, виды птиц, насекомые,
классификацию местообитаний и проекты, связанные с моделированием, такие
как подверженные наводнениям / засухе, основная среда обитания,
классификация типов почв, болезней, сорняков, модели, связанные с климатом
и погодой, и их прогнозирование.

Машина опорных векторов


Это модель ML, которая может быть применена к задачам классификации и
регрессии. Поскольку модель проста в построении и устойчива к выбросам, она
широко используется в области геофизики и дистанционного зондирования.
Построение модели опорного вектора ML требует использования для указания
типа ядра. Некоторыми популярными ядрами в дистанционном зондировании
являются полиномиальные ядра и ядро радиальной базисной функции (RBF).
Классификация спутниковых изображений, обнаружение таких объектов, как
дороги, водно-болотные угодья, луга, может быть решена с помощью SVM-
моделей.

Линейная регрессия
Эти модели являются наиболее популярными исследовательскими моделями
в Г.И.С. и дистанционном зондировании. Линейная регрессия помогает выявить
и оценить взаимосвязь между двумя или более факторами / ковариатами, когда
мы используем силу пространства в нашем анализе, используя характеристики
расстояния, например, влияние расстояния до воды при выборе среды
обитания. Существует 3 типа линейной регрессии, обычно используемые в
проектах, основанных на ГИС и дистанционном зондировании. Это
непрерывное (гауссово), логистическое распределение и распределение
Пуассона. Распределение должно быть нормальным для линейной регрессии
распределения по Гауссу. Его также называют непрерывным, потому что
зависимая переменная может принимать широкий диапазон значений, таких как
температура, количество осадков и диаметр дерева. Если зависимая переменная
распределена неправильно, мы можем изменить ее на двоичные значения с
помощью функции реклассификации. Бинарные также известны как модели

20
логистической регрессии, которые строят модели только с двумя выходами:
прохождение / сбой, наличие / отсутствие. Мы используем модели регрессии
подсчета/Пуассона, если зависимыми переменными являются
подсчеты/количество вхождений события. Зависимая переменная не может
иметь отрицательных или десятичных значений. Эти модели обычно
используются для моделирования распределения видов и понимания
закономерностей событий.

Факторы, которые следует учитывать при выборе моделей ML в проектах,


основанных на ГИС и дистанционном зондировании
 Нет эмпирического правила
 Поэкспериментируйте с несколькими классификаторами
 Параметры гипернастройки для обеспечения точности
 Используйте классификаторы случайных лесов для слабых наборов
данных и процесса принятия решений , когда необходимы простые
и быстрые модели .
 Значение по умолчанию для количества деревьев в R.F. может быть
равно 500; для размера ядра в SVM
 это могут быть полиномиальные ядра и радиальные базисные ядра
 Визуализируйте взаимосвязи между входными данными и
предикторами , чтобы оценить их взаимосвязь и найти , есть ли какая
- либо группа , которая может помочь в лучшем прогнозировании
событий
 Нормализовать редкие классы/ несбалансированные наборы данных
 Время вычисления также зависит от заданных пользователем
параметров, выбранного классификатора, размера выборки
 Если параметры не могут быть настроены, следует использовать R.F.,
установив количество деревьев равным 500
 , чтобы обеспечить
 Сбалансируйте наборы данных / нормализацию данных. Классы с
небольшим количеством образцов / редких классов
 могут быть затронуты
 Вычислительные сложности различных моделей ML, которые
представляют собой объем ресурсов для запуска модели ML.
В последние годы модели ML все чаще используются в проектах,
основанных на ГИС и дистанционном зондировании. Модели ML помогают в
решении задач ГИС и дистанционного зондирования путем определения
базовых закономерностей, например, классификации изображений на основе
спутников, обнаружения таких объектов, как дороги, водно-болотные угодья,
луга, сегментация изображений. Здесь мы обсудим несколько популярных
моделей ML и методы их применения в проектах, основанных на ГИС и
дистанционном зондировании.

21
22
2.4 Проблема построения и использования нейросетевых моделей в ГИС

Проблему применения нейросетевых компонент в ГИС, так же, как и в


любой прикладной информационной системе можно рассматривать как
совокупность следующих проблем:
• Проблема программной интеграции искусственных нейронных сетей и
геоинформационных систем. Определяет вопросы, связанные с разработкой
методов и схем взаимодействия нейросетевых компонент и ГИС, организацией
обмена данными и системы запросов между компонентами.
• Проблема создания нейросетевых моделей в составе геоинформационной
системы. Включает разработку технологии построения нейросетевых моделей,
разработку методов автоматизации процесса построения нейросети.
• Проблема использования нейросетевых моделей в составе
геоинформационной системы. К этой проблеме можно отнести обеспечение
устойчивого функционирования, повышение ´прозрачностиª работы нейросети,
получение дополнительной информации о модели, оценку качества работы
сети.
• Проблема технической реализации нейросетевых компонент. Проблема
технической реализации состоит в определении средств построения
нейросетевой компоненты, разработке программной системы и обеспечении
информационного, программного и технологического соответствия систем.

2.5 Реализация программного комплекса для нейросетевого анализа данных


в ГИС
Программную систему для нейросетевого анализа данных в ГИС
функционально можно разделить на три подсистемы.
• Подсистема взаимодействия с ГИС-компонентой.
• Подсистема получения и подготовки данных.
• Подсистема нейросетевой обработки данных

1 Подсистема взаимодействия с ГИС-компонентой обеспечивает интерфейс


между динамически подсоединяемой библиотекой, содержащей программный
ГИС-обьект и другими подсистемами.
Транслирует запросы системы и вызывает внутренние методы ГИС-объекта,
отслеживает события и обеспечивает получение и передачу данных. Позволяет
выполнять набор следующих операций:
1) картографические операции:
• Открытие слоев GeoDraw для DOS и GeoDraw для Windows,
косметических слоев ГеоГраф 1.5., растровых слоев. Все сторонние форматы,
поддерживаемые ГеоГраф 1.5 (SXF, DX90), могут использоваться только через
импорт карт ГеоГраф 1.5 [109].

23
• Импорт картографических композиций созданных в ГеоГраф 1.1 и
ГеоГраф 1.5.
• Функции векторного не топологического редактора для
косметических слоев ГеоГраф 1.5.
• Масштабирование карты.
• Варьирование объектным составом карты.
• Создание тематических слоев.
• Оверлейные операции.
• Изменение способа отображения объектов (цвет, тип линии и т.п.), в
том числе и определение символогии через значения атрибутов, то есть
синхронизация визуализации с изменениями в базах данных;
2) атрибутивные операции:
• Связь таблиц атрибутов со слоями карты.
• Работа с таблицами атрибутивных данных.
• Получение данных об объектах слоя.
• Возможность опрашивать через карту в режиме реального времени
базы данных. Формально состоит из блока работы с картой, блока работы
с таблицами и блока "легенды". Физически ГИС-объект встроен в
подсистему.
2. Подсистема получения и подготовки данных позволяет получать из
карты данные в удобном для нейросетевой обработки виде и производить
некоторую предобработку.
3. Подсистема нейросетевой обработки данных (нейроимитатор)
предназначена для построения моделей ИНС и решения с помощью ИНС
задач ГИС.
Задачи, решаемые нейроимитатором в рамках данной работы: 1)
автоматизированное решение задач ГИС на основе нейросетевой
парадигмы.

Построение нейросетевых моделей, решающих задачи:


• классификации;
• предсказания;
• регрессии;
• прогнозирования значений временных рядов;
2) обеспечение функционирования построенных моделей в составе
системы;
3) решение дополнительных информационных задач, в том числе
получение дополнительной информации о характере зависимости между
входными и выходными параметрами модели. Необходимость решения
этой задачи связана с необходимостью получения дополнительной
информации при анализе и оценке полученной модели, а также при
24
планировании принятия решений и исследовании моделируемого объекта
или процесса. Это позволяет выявлять информацию о том, как влияет
каждый компонент входного вектора нейросети на полученное решение в
данной точке пространства входных параметров. На основе этого эксперт
может сделать вывод о качестве полученной нейросетевой модели и
получить новую информацию об исследуемом объекте при нейросетевой
реализации информационной модели.

2.6 Структура и функции программной системы

Рисунок 6 – Схема подсистемы с ГИС-компонентой

Подсистема получения и подготовки данных состоит из нескольких


блоков (рисунок 6).
Предназначена для:
• получения данных из ГИС и преобразования в вид удобный для
нейросетевой обработки;
• предобработки полученных данных;
• работы с базами данных;
• обеспечения информационного взаимодействия между подсистемами;
• предварительной визуализации.
Подсистема нейросетевой обработки данных.
Потоки данных между блоками:
1. Таблица исходных данных (выборка).
2. Таблица обработанных данных.
3. Сохранение файлов параметров нейросети.
4. Чтение файлов параметров нейросети.
5. Заданные пользователем или прочитанные параметры процесса
обучения.
6. Сохранение параметров обучения.
7. Параметры формирования структуры нейросети.
8. Результаты в терминах поставленной задачи.
9. Данные в формате пригодном для использования блоком
обучения. После нормировки, центрирования, кодирования, разбиения на
обучающую и тестовую выборки.
10. Созданная (загруженная) нейросеть.
25
11. Обученная нейросеть.
12. Параметры процесса обучения

Рисунок 8 – Блоки подсистемы получения и подготовки данных

26
3. Разработка методов создания автодорожных карт и их проблемных мест
на территории Карагандинской области

Автодорожные карты – один из активно развивающихся видов электронных


карт в связи с потребностями автомобильных навигационных систем.
Использование данных ДДЗ, аэрофотограмметрии, глобальных банков рельефа
требует оптимизации организационно-технологических особенностей
подготовки современных типов цифровой пространственной информации.
Таким образом, возникает необходимость разработки методов и технологий
создания электронных автодорожных карт на основе современных
высокотехнологичных источников данных с учетом требований и специфики
дорожной отрасли.

Для реализации поставленной цели потребовалось решение следующих


задач:
- обобщить отечественный и зарубежный опыт разработки информационных
транспортных систем и их картографическое обеспечение с учетом анализа
- разработать требования, предъявляемые к пространственным данным в
отраслевых информационных дорожных системах и обосновать их
картографическое обеспечение;
- разработать методы автоматизации и оптимизации обработки цифровых
пространственных данных для создания электронных автодорожных карт на
основе ГИС-технологий и геоинформационных моделей данных;
- разработать методику обновления электронных автодорожных карт на
основе базы разномасштабных пространственных данных с использованием
современных высокотехнологичных источников - цифровых космических
изображений и детальных спутниковых GPS-съемок дорожной сети.
Объектом исследования является система электронных автодорожных карт
различных масштабов и пространственного охвата.
Предмет исследования – методы и технология создания базового и
специализированного картографического обеспечения проблемно-
ориентированной автодорожной ГИС.
Сюда относятся: цифровая топографическая основа разных масштабов (1: 10
000, 1: 200 000, 1: 500 000, 1: 1 000 000); специальные съемочные данные,
полученные по результатам высокоточных полевых GPS-измерений дорожной
сети Карагандинской области; дополнительная информация, имеющая важное
значение для электронной картографии: базы данных географических названий,
космические изображения высокого разрешения.

27

Вам также может понравиться