Планирование задач робота в детерминированных и вероятностных условиях с использованием семантической базы знаний

Планирование задач робота в детерминированных и
вероятностных условиях с использованием семантической базы

знаний
Ахмед Абдулхади Аль-Моадхен, Кардиффский университет,
Кардифф, Великобритания
Майкл Пакианзер, Инженерная школа, Кардиффский университет,
Кардифф, Великобритания Россица Сетчи, Инженерная школа,
Кардиффский университет, Кардифф, Великобритания
Жэньси Цю, факультет компьютерных наук и технологий, Университет
Бедфордшира, Бедфордшир, Великобритания
Аннотация
Предложен новый метод повышения надёжности генерации символьных
планов путём расширения генерации планов на основе баз семантического знания
(SKB) для учёта объёма информации и неопределённости, связанной с
существующими объектами, их типами и свойствами, а также их взаимосвязями
друг с другом. Этот подход строит планы в зависимости от вероятностных
значений, которые получены из изучения статистических реляционных моделей,
таких как логические сети Маркова (MLN). Модуль MLN создан для
вероятностного обучения и вывода вместе с семантической информацией, чтобы
обеспечить основу для правдоподобных услуг обучения и рассуждения для
поддержки робота в планировании задач. Модуль MLN конструируется с
использованием алгоритма преобразования знаний, хранящихся в SKB, в типы,
предикаты и формулы, которые представляют основные строительные блоки для
него. После этого знания семантической области используются для выведения
неявных ожиданий состояний мира и последствий действий, которые включены в
план задачи. Эти ожидания сравниваются с выходом MLN.
1. Вступление
Создание плана планировщиком автономного робота, действующего в
человеческой среде, является сложной задачей, поскольку включает в себя
рассмотрение неопределенностей и недетерминированных ситуаций.
Действительно, в таких ситуациях переменное количество объектов может быть
важным для его задач, и эти объекты могут быть связаны различными способами.
К сожалению, эта особенность сильно влияет на роботов, действующих в реальных
средах, и может иногда приводить к сбоям в их работе. Чтобы справиться с
непредвиденными обстоятельствами, планировщик робота использует
вероятностные процедуры вывода, основанные на методах рассуждения, чтобы
гарантировать, что его планы действий не сильно отклоняются от поставленной
задачи (Bouguerra, Karlsson & Saffiotti, 2007). В большинстве подходов к
формированию плана основное внимание уделяется детерминированной
информации о среде робота, такой как точные объекты и их свойства, а также
подробностям явных действий (предварительные и последующие состояния среды).
Например, явный эффект перемещения робота на кухню заключается в том, что
новым положением робота является кухня. Напротив, неявный эффект
заключается в том, что робот должен наблюдать холодильник и печь.
В реалистичной среде это не всегда так, поскольку планирование с
неопределенностью является сложным процессом. Для получения возможной
неявной информации, относящейся к существованию объектов, прогнозирования
их типов, свойств и взаимосвязей между этими объектами должны быть
предложены более совершенные формы вероятностного рассуждения, связанные с
семантическим знанием. Например, вероятность того, что робот, переезжающий в
гостиную, увидит телевизор и диван выше того, что он увидит кровать и раковину.
Если робот заходит на кухню, вероятность того, что он увидит холодильник
и раковину выше. Эти вероятности представляют собой детали, которые могут
усложнить планирование задач, если их обработка остается на роботе. В свете этого
важно создать отдельный модуль на основе семантических знаний и описаний
действий, используемых планировщиком. Действительно, планировщик имеет
возможность учиться из базы знаний и затем выводить вероятную информацию
о среде робота в зависимости от его наблюдений.
В данной статье структура системы планировщика робота основана на
семантической базе знаний и представлена логикой описаний (DL) (Baader,
McGuinness, Nardi & Patel-Schneider, 2010). Этот тип системы имеет возможность
выводить автоматическую классификацию вещей на основе их типов и свойств, по
итогам чего может разработать общий алгоритм для системы на основе DL.
Благодаря чему робот может извлекать новую информацию из имеющихся
знаний. Логический вывод чистого описания является полностью
детерминированным, поэтому часто желательно предоставлять неопределенную
информацию способом, который может быть более полезным для планировщика
робота.
Второй процесс разработан учитывающим вероятностную неопреде-
ленность в состоянии мира, т.е. неопределенность в отношении типа объектов и
мест в среде робота и отношений между ними. Этот процесс зависит от логических
сетей Маркова, которые допускают вероятностные выводы, сочетающие
выразительность логики первого порядка с представлением неопределенности
(Richardson & Domingos, 2006). Влияние таких реляционных структур,
включающих переменные наборы фактов, имеющих отношение к задачам
робота, должно быть явно опущено из рассмотрения модели, которая включает
фиксированный набор предположений. Как таковой, этап унификации между
принципами логики первого порядка имеет решающее значение, так как это делает
объекты и отношения основными строительными блоками представления, а
вероятностные графические модели, позволяющие рассуждать перед лицом
2
неопределенности, создают его единый формализм. Этот подход позволяет, путем
объединения соответствующей семантики, получить язык, который имеет уровень
выразительности, достаточный для коммуникации с роботом. Это необходимо для
того, чтобы он был способен обрабатывать неопределенные ситуации, когда
они возникают в реальном мире.
Эта статья опирается и расширяет предыдущую работу по обработке
неопределенности с использованием семантической базы знаний (Al-Moadhen,
Packianather, Setchi & Qiu, 2014). Кроме того, в этой статье сообщается о новой
обширной экспериментальной оценке двух подходов к формированию плана:
детерминированного процесса и вероятностного процесса. Эти эксперименты
показывают, что использование семантических знаний способствует более умному
формированию плана, поскольку планировщик задач может решать
детерминированные и вероятностные ситуации, с которыми возможно столкнется
робот. Они показывают, что детерминированная версия в основном оперирует
поиском противоположных доказательств, в то время как вероятностная версия лучше
способна учитывать истинные доказательства.
Основной вклад этого документа заключается в следующем: 1) его
семантическая база знаний используется в качестве основного источника для
построения шаблона MLN; (2) использует MLN в случаях, когда существует
неопределенность относительно состояния мира (о существовании объектов, их
типах и отношениях); (3) он представляет алгоритм, роль которого заключается в
создании MLN из семантической базы знаний; (4) алгоритм, учитывающий
семантику параметров действия, используется для проверки вставки действия в
план (в случае формирования детерминированного плана); (5) в случае
вероятностной версии процесс формирования плана использует ответы MLN для
формирования плана. Шаблон MLN будет изучаться с использованием учебных
данных SKB и соответствующих методов обучения. Эта изученная модель MLN
затем используется для ответа на запросы, сгенерированные из базы знаний, и
прогнозирования существования и типов объектов или мест, а также их
взаимосвязей.
Остальная часть настоящего документа организована следующим образом.
В разделе 2 описываются соответствующие работы в области планирования с
уделением особого внимания детерминированным и вероятностным подходам. В
разделе 3 описывается планирование в детерминированных условиях. В разделе 4
рассматривается процесс планирования в условиях неопределенности и излагается
предлагаемый подход к решению этой проблемы. В разделе 5 представлена
экспериментальная проверка. Наконец, в разделе 6 содержатся выводы и
предложения относительно будущей работы.
2. Связанные работы
В этом разделе рассматриваются исследования, касающиеся формирования
планов для задач мобильных роботов для перемещения из одной точки в другую.
Предыдущие подходы были сосредоточены на планировании при
детерминированным состоянием мира. Как правило, предварительно определенные
мировые модели используются для описания состояний среды после правильного
выполнения действий. Планирование в детерминированных условиях страдает от
меньшего числа проблем по сравнению с планированием в вероятностных
условиях. Области планирования могут быть созданы путем интеграции
семантических моделей действий с общей базой знаний (Al-Moadhen, Qiu,
Packianather, Ji & Setchi, 2013). Эти области зависят от фиксированной информации
из базы знаний и входящих напрямую в планировщик робота для создания
подходящего плана для заданных задач.
Семантические знания могут быть успешно использованы для
поддержки планирования задач робота. Исследования (Галиндо, Фернандес-
Мадригал, Гонсалес и Саффиотти 2008) определили конкретный тип
семантической карты, которая интегрирует иерархическую пространственную
информацию и семантические знания. Этот подход зависит от заявленной
информации и не учитывает неопределенность работы робота.
Дальнейшая работа (Eich, Dabrowska & Kirchner 2010) позволила преодолеть
разрыв между семантическим и пространственным представлением окружающей
среды. Фокусируясь на семантической стороне (Cipriano Galindo et al. 2008) и
(Galindo et al. 2005) описывают, как семантические карты используются для
планирования высокого уровня и пространственных рассуждений. В своей работе
мост между пространственной областью и семантической областью называется S-
Box (пространственный ящик) и T-Box (ящик таксономии). Семантическая
интерпретация физических объектов достигается посредством оптической
идентификации маркеров, хотя и не основана непосредственно на
пространственной интерпретации данных облака точек.
Другой подход (Bouguerra & Karlsson, 2004) предложил иерархическое
планирование задач, которое обрабатывает неопределенность как в состоянии мира, так
и в воздействии действий. Он ввел механизмы для урегулирования ситуаций, когда
имеется неполная и неопределенная информация о состоянии окружающей среды.
Действительно, это было сделано путем использования вероятностных состояний для
представления неполной информации о состоянии мира, в то время как действия могут
иметь более одного результата. Проблемой такого подхода (с использованием условного
планировщика) является его связь с условным ветвлением, которое зависит от
экзогенных событий, а именно взаимодействия агента.
Частично наблюдаемые марковские процессы принятия решений (POMDP)
(Papadimitriou & Citsiklis, 1987) обеспечили принципиально общую основу для
планирования движения роботов в неопределенных и динамических условиях.
Кроме того, POMDP использовались в исследовании (Ong & Hsu, 2010) для
планирования движения в условиях неопределенности. Семантическая информация
может использоваться в качестве инструмента для улучшения планирования задач
в сложных сценариях, когда другие планировщики могут легко оказаться в
трудноразрешимых ситуациях (Galindo, Fernández-madrigal & Saffiotti, 2007).
Подход предусматривал построение "семантического" плана, состоящего из
категорий объектов, мест и т.д., которые решали "обобщенную" версию
запрашиваемой задачи. Этот план был затем использован для того, чтобы отбросить
неактуальную информацию относительно окончательного планирования,
осуществляемого на символических экземплярах этих элементов (которые
соответствуют физическим элементам мира, в котором робот может работать).
Дальнейшая работа в этой области (Galindo, Fernández-Madrigal & Gonsález,
2004) включала в себя разработку формализма символьной модели окружающей
среды для решения вопросов обработки больших объемов информации при
4
планировании и эффективной коммуникации между человеком и машиной в
естественной форме с помощью человеческого механизма, который структурирует
знания в нескольких иерархиях. Планирование с использованием иерархической
модели может быть эффективным даже в тех случаях, когда отсутствие
иерархической информации делает ее трудноразрешимой. Однако, этот метод
зависит от детерминированной информации.
Для устранения неопределенностей можно использовать вероятностные
методы для связывания системных переменных друг с другом и построения сети
между этими переменными. Markov Logic Networks (Richardson & Domingos, 2006)
и Bayesian Logic Networks (Jain, Waldherr & Beetz, 2009) могут использоваться для
обработки вероятностной информации для поддержки многих приложений, таких
как планирование задач.
3. Семантическая база знаний (SKB) в системе планирования

Семантическое знание относится к знаниям об объектах, их классах и
свойствах, а также к отношениям между этими объектами. Представление, которое
относится к этой структуре, называется онтологией. На фиг.1 показана онтология
среды робота. Например, гостиная представляет собой понятие (класс) и относится
к комнате, которая имеет, по меньшей мере, телевизор и диван. Объекты телевизор
и диван определяются как предметы мебели.
Как видно из предыдущих исследований (Al-Moadhen et al., 2013),
семантическая база знаний (SKB) может использоваться для поддержки
планирования задач робота, для генерации семантических планов для данных задач.
Семантические знания используются в процессе формирования символьных
планов, т.е. символы используются для обозначения физических объектов,
которыми будут манипулировать действия. Семантические знания могут
использоваться мобильными роботами для построения своих карт (Galindo et al.,
2008; Tenorth, Kunze, Jain & Beetz, 2010), чтобы проанализировать их сцены (Hois,
Wünstel, Bateman & Röfer, 2007) и помочь им общаться с людьми (Theobalt et al.,
2002).
В данном документе семантические знания используются в процессе
генерации символьных планов, т.е. последовательности действий, которые
используют символы для ссылки на физические объекты в среде робота, с которыми
связанными роли действий. Примером такого действия является (захват m), где m
является символом, который относится к ящику для молока. Робот может
использовать свои знания, чтобы выразить молочный ящик как контейнер, который
должен быть на кухне. Эта база знаний использует логику описания (DL) (Baader et
al., 2010) для представления и управления знанием семантической области,
поскольку она обеспечивает хороший компромисс между способностью
представления и прослеживаемостью рассуждений. Важной характеристикой DL
являются ее возможность рассуждения, в частности вывод неявного знания из явно
представленного знания. Знания хранятся в виде файла языка веб-онтологии
(OWL), который представлен как онтология ("OWL Web Ontology Language
Reference", 2004).
Различные модули, участвующие в формировании символьных планов с
использованием семантических знаний, показаны на рис. 2.
Модуль создания плана создает планы для данной задачи робота, а также
отслеживает текущие состояния мира робота и статус планировщика для генерации
запросов базы знаний в случае невозможности создания плана. Он также
контролирует текущее расчетное состояние (в зависимости от наблюдений),
включая, например, текущее ожидаемое местоположение робота. Он отвечает за
интеграцию SKB с семантическими моделями действий (Samantic Action Models,
SAM) для создания файла области планирования, который подается в планировщик
во время процесса планирования (перевод семантического стиля SKB и SAM в
формат языка определения области планирования (pddl), который подходит для
ввода большей части плановика). Блок "Наблюдение/Доказательства" содержит
наблюдения относительно нынешних состояний мира, вытекающие из модуля
восприятия. Они предоставляют системе планирования необходимую информацию
о среде робота. Информация наблюдения выражается в символической форме,
которая описывает объекты и их наблюдаемые свойства (например, цвет, форму,
метки и относительное положение).
Модуль SAM предоставляет модулю формирования плана модель
действий, которая представляет возможности робота. Эта модель определяет
предварительные условия, которые должны существовать в состояниях мира
для того, чтобы действие было применимо. Модель также определяет явные
эффекты действия, которые должны возникнуть при успешном выполнении
процесса. Явные эффекты делятся на отрицательные и положительные.
Отрицательные эффекты выражают состояния, которые должны быть удалены
из состояний мира, в то время как положительные эффекты кодируют
состояния, которые должны быть добавлены к мировым государствам, когда
действие выполнено успешно. Функция семантической базы знаний (SKB)
заключается в хранении общих знаний и знаний области утверждения. В нем
также рассматриваются запросы, создаваемые из модулей создания плана, и
ответы на эти запросы в соответствии с их содержимым. Наконец, сам модуль
поддержки планирования отвечает за предоставление SKB недостающей
информации для восстановления системы планирования из ситуаций, когда для
данной задачи не могут быть созданы подходящие планы. Он содержит методы
и процедуры обучения и рассуждения для вывода новой информации из
текущего SKB и данных наблюдений.
6
Рисунок 1. Онтология мира для робота
Рисунок 2. Различные модули, участвующие в генерации плана
3.1. Онтология среды робота
Большой объем знаний об объектах и их свойствах в среде робота может
помочь роботу узнать о структуре своей среды. Эти знания можно представить как
онтологию, которая содержит классы всех соответствующих типов объектов и их
свойств и отношений. Логика описаний (DL) используется как формализм для
представления знаний робота о его мире.
Язык веб-онтологии (OWL) ("OWL Web Ontology Language Reference",
2004) имеет формат представления знаний, подходящий для описания знаний
робота о своей среде. Он используется для хранения формул логики описания
в формате файла на основе XML. Существует два типа знаний в логике
описания. Первое называется терминологическим знанием, так называемым
TBOX, в то время как второе известно, как знание утверждения, ABOX. TBOX
содержит определения понятий, например "Комната", "Действие" или
"Объект". Эти концепции расположены иерархически, что классифицируется с
использованием определений подкласса, которые описывают, например,
подкласс мебели как таблицу. ABOX содержит отдельные объекты, которые
созданы на основе концепций TBOX, например, Таблица 1 является
экземпляром такой таблицы. Свойства отдельных структур в базе знаний
можно описать ролями, которые отражают отношения между двумя
структурами, и может также использоваться в определениях класса, чтобы
ограничить им степень класса, имеющим определенные свойства, например,
8
понятие, GrasspingABottle может быть описан как подкласс GraspSomething с
ограничением, что objectActedOn должен быть некоторой разновидностью
класса Bottle.
Следующие примеры (которые основаны на фиг.1) описывают определение
атомарных классов и определенных классов. Роли используются для ограничения
расширения определенных классов.
Таблица 1. Результаты детерминированной генерации плана для
действий захвата и перемещения.
Th = 3 objects Th = 5 objects Th = 7 objects

M U A M U A M U A
Navigation M 3 0 10 4 0 10 5 0 8
U 0 55 12 0 56 10 0 60 7
Manipulation M 1 0 8 2 0 7 2 0 6
U 0 6 25 0 10 21 0 13 19
Атомарный класс: Комната, Объект.

Определенные классы: Кухня это Комната и содержит ОбъектыКухни
ОбъектыКухни это Объект и расположен на Кухне
Расположение уровней онтологии, состоящее из множества классов, их

иерархии и свойств, было принято из онтологий OpenCyc (Lenat, 1995) и
KNOWROB (Mori Tenorth & Beetz, 2009) и эта адаптация описывает способ,
которым можно объяснять вещи.
На фиг.1 показаны иерархические уровни онтологии среды робота.
Наиболее важными ветвями являются комнаты, содержащие описания типов
комнат, и объекты, содержащие описания типов объектов. Большинство объектов в
среде робота вместе с предметами мебели или частями тела относятся к классу
Object. К другим заметным ветвям относится класс Place, который описывает
местоположения и позиции на карте робота.
После создания общей семантической базы знаний можно утверждать, что
конкретные экземпляры классов существуют в реальном мире. Например:
SELECT ?k1 ?f1

WHERE {?k1 rdf:type Kitchen
?f1 rdf:type Object
?k1 contains ?f1}
утверждает, что k1 является экземпляром кухни, а f1 - экземпляром объекта.

В результате свойства "содержит" между этими двумя экземплярами f1
классифицируется как один из кухонных объектов. Экземпляр k1 также
автоматически классифицируется как экземпляр комнаты класса. Классификация
выполняется на основе определений понятий и отношений для создания доменной
иерархии. Иерархия структурирована в соответствии с отношениями
суперкласс/подкласс, существующими между сущностями. Когда утверждаются
новые экземпляры (добавляются в базу знаний), они классифицируются в
соответствии с тем, что было утверждено ранее.
3.2. Процесс создания семантического плана
Процесс формирования плана на основе семантических знаний описан в
алгоритме 1. Процесс обычно проверяет, соответствует ли объект
планирования описанию ожидаемого объекта. Например, если действие,
которое должно быть вставлено в план, представляет собой захват b1, то для
захвата объекта b1 (ожидаемого объекта), то объект, которым фактически будет
манипулировать это действие, проверяется, является ли он объектом
планирования; это необходимо, чтобы проверить, соответствует ли он
описанию b1. Добавление операции навигации (перемещение r1 r2)
подразумевает, что объектом планирования является помещение, в котором
должен находится робот, которое необходимо проверить по описанию r2
(ожидаемый объект).
Процесс начинается с установления типа ожидаемого объекта (obj), который
исходит из семантической модели действия; (obj) является производным от
положительных эффектов выбранного действия. После этого процесс продолжается
путем запроса SKB относительно гарантированных классов ожидаемого объекта
(obj) (шаг 1). Рассматриваются только наиболее специфические классы, так как
семантическая база знаний может выводить, что экземпляр конкретного класса
также является экземпляром всех более общих классов. Например, если r2
гарантированно является комнатой и кухней, то рассматривается только класс
кухни.
Алгоритм 1. Псевдокод семантического процесса создания плана на

основе знаний
PlanGen(obj)
1. classes <== SKB[type(obj)]
2. temp-obj <==Evidence[obj]
3. α <== Evidence [properties-and-relations(temp-obj)]
4. create- instance-of (temp-obj, α)
5. if ∀ c ∈ classes: is-instance-of(temp-obj, c) then success
6. else if ∃ c ∈ classes: is-not-instance-of(temp, c) then failure
7. else ambiguous outcome End
На шаге 2 блоку наблюдения/подтверждения предлагается вернуть

объект планирования, которому этот процесс присвоил временное имя. Затем
блок подтверждения запрашивается связанные свойства и отношения
относительно этого объекта в соответствии с другими наблюдаемыми
объектами (шаг 3). На этапе 4 наблюдаемая информация, относящаяся к
объекту планирования, используется для построения временного экземпляра в
SKB. Например, если база данных наблюдений содержит элемент типа room,
содержащий ch1 и bed b1, то процесс планирования проверяет эти факты в SKB
10 путем ввода следующей команды SPARQL:
SELECT ?temp ?ch1 ?b1 WHERE {?temp rdf:type Room
?ch1 rdf:type Chair
?b1 rdf:type Bed
?temp contains ?ch1
?temp contains ?b1
}
ASK { ? temp rdfs:subClassOf LivingRoom }
ASK NOT EXISTS { ? temp
rdfs:subClassOf LivingRoom }
3.3. Deterministic Planning System Process
Способ планирования, описанный в (Al-Moadhen et al. 2013) занимается
детерминированной информацией, хранящейся в семантической базе знаний. Он
используется планировщиком в качестве статической информации для создания
планов. В следующем разделе этот подход к планированию расширен за счет
поддержки системы планирования с вероятностными возможностями.
Этот процесс семантического планирования основан на запуске
планировщика, такого как, например, Metric- FF (Hoffmann & Nebel, 2001), с
использованием информации, хранящейся в семантической базе знаний, для
повышения эффективности планирования в реляционных моделях, содержащих
большое количество объектов и/или отношений.
Модуль формирования плана получает в качестве входных данных
спецификацию цели для достижения, заданную с использованием символов
пространственной информации и объектов в среде робота.
Процесс планирования состоит из следующих шагов:
1. Для планирования запрашивается задание, например, "принеси мне

молочный ящик". Эта задача определяется как цель достижения (состояние
мира, которое должно быть достигнуто) с использованием только символов, т.е.
milkbox-1.
2. Все символы в цели переводятся через семантическое определение, таким
образом задача "принеси мне молочный ящик" переводится в "принеси
МОЛОЧНЫЙ ЯЩИК".
3. Для цели "принеси мне молочный ящик", рассматривая семантическую
сеть, изображённую на рис. 3, и предполагая, что робот находится в гостиной,
построенный план был бы: "переезд из LIVINGROOM в HALL", переезд из
HALL в KITCHEN "," Open FRIDGE "и" Pickup MILKBOX. " Если план
существует, задача решается, в противном случае задача должна решаться с
использованием недетерминированного подхода планирования задач. Этот
подход будет разъяснен в следующем разделе.
Рисунок 3. Пример нижнего уровня семантической иерархии для
домашнего сценария. Стрелки обозначают отношения "isConnectedTo"
между комнатами.
4. Все символы в онтологии робота, которые не соответствуют классам,
задействованным в семантическом плане, отбрасываются для последующего
процесса планирования. В приведенном выше примере рассматриваются только
отличительные места, а именно кухня, гостиная, холодильник и молочный ящик,
при этом другие элементы домена отбрасываются.
4. Планирование в условиях неопределенности

Процесс формирования плана, представленный в предыдущем разделе,
ограничен детерминированными состояниями мира. Этот процесс также имеет
ограничения, заключающееся в том, что мировые ожидания рассматриваются
логически, т.е. оцениваются как истинные, ложные или неизвестные. Эти
ограничения обусловлены главным образом тем, что процесс не представляет
неопределенности, свойственные реальному миру.
В этом разделе описывается другой процесс создания плана, который может
вызвать неопределенность. Действительно, разработана модель, учитывающая
количественную неопределенность в виде вероятностей в состояниях и для
интерпретации ожиданий использующая семантическое знание.
Более конкретно, состояния мира могут кодировать различные
возможные результаты, каждый с заданной вероятностью возникновения,
основываясь на эффектах действий и базе знаний. В результате использования
вероятностей можно выйти за рамки логической проверки ожиданий. Другими
словами, процесс планирования может вычислить вероятность того, произошло
ли определенное ожидаемое мировое состояние. Примером может служить
"робот находится в спальне с вероятностью 0,90" вместо "неизвестного
положения" в результате планирования. Более того, тот факт, что
апостериорная вероятность каждого возможного мирового состояния может
быть оценена, позволяет принимать более осознанное решение о том, как
действовать, рассматривая план, сгенерированный с помощью успешной,
12 неудачной или отсутствующей информацией. Действительно, это превосходит
логический (истинный или ложный) подход. Процесс вероятностного
планирования работает следующим образом:
• Для каждого возможного результата мирового состояния,
связанные объекты и места которого вовлечены в процесс планирования,
определяется набор неявных ожиданий.
• Эти ожидания используются для оценки распределения вероятности по
фактическому состоянию мира. Например, неявное ожидание найти духовку на
кухне подразумевает, что вероятность иметь кровать равна нулю, в то время как
вероятность иметь одну, две или более кроватей в спальне строго больше нуля. Хотя
рассуждения в условиях неопределенности в логике описания являются текущей
исследовательской деятельностью (Lukasiewicz, 2008), к сожалению, нет доступной
системы DL, которая поддерживает вероятностного вычисления. Таким образом,
распределения вероятностей ожидаемого состояния мира вычисляются
статистическими реляционными моделями, такими как MLN.
Кроме неопределенности относительно мирового состояния,
неопределенность в наблюдении учитывается моделью, которая выражает
вероятность того, что наблюдается для данного мирового состояния. В общем виде
наблюдаемая модель позволяет:
• Указать, виден ли объект, существующий в реальном мире.
• Способ классификации видимого объекта, т.е. модель учитывает
неправильную классификацию объектов при их просмотре. Например, ошибка
может произойти, когда кровать классифицируется как диван.
Семантическая база знаний предлагается для поддержки системы

планирования роботов путём рассмотрения вопросов неопределенности
относительно существования объектов в определённом месте или прогнозирования
типов объектов или мест, а также отношений между ними. Например, чтобы
вставить в план робота такое действие, как (move boreom1 kitchen1), может
потребоваться предоставить планировщику робота описание следующей комнаты,
в которую должен переместиться робот. Если задача требует, чтобы робот взял
молочный ящик и нет никаких утверждений о местоположении молочного ящика,
то планировщик должен получить поддержку от вероятностного модуля, чтобы
обеспечить его наиболее вероятным расположением молочного ящика. Если
вероятностный модуль отвечает, с большой вероятностью, что наиболее вероятным
расположением молочного ящика является кухня, потому что это кухонный объект,
то лучшим следующим расположением в действии перемещения является кухня.
Планирование, включающее неопределенность в прогнозировании типов объектов
или мест, осуществляется в пространстве весов, связанных с формулой, которая их
описывает.
Для эффективной поддержки планировщика задач необходимы
вероятностные модели для представления вероятностных распределений
неопределенной информации в области планирования. Существует несколько
статистических реляционных моделей, представленных как расширения
неориентированных (Richardson & Domingos, 2006) или направленных графических
моделей (Multi-Entity Bayesian Networks (Laskey, 2008) или Bayesian Logic Networks
(Jain et al., 2009). Эти модели могут использовать методы обучения и вывода,
которые были разработаны для их базовых представлений. Логические сети
Маркова используются в данном документе в качестве статистической реляционной
модели для поддержки процесса планирования задач. Рис.4 представляет
вероятностную архитектуру системы планирования, предложенную в этом
исследовании.
Процесс планирования использует предварительное распределение
вероятности по возможному статусу состояния мира вместе с семантическими
основанными на знаниях оценок вероятности и наблюдаемой моделью для
вычисления апостериорной вероятности статуса.
Метод накладывает ограничения на атомарные классы наблюдаемых
объектов. Можно легко добавить ограничения над значениями других атрибутов,
например, colour ∈ {красный, желтый, белый}.
Пример: Предположим, что система планирования должна добавить

операцию навигации (move loc1 loc2), состояние мира которой имеет два
возможных статуса. Первое состояние, т.е. S = 1, является тем, когда робот остается
непреднамеренно в локусе 1, в то время как второе состояние, т.е. S = 2, является
тем, когда робот эффективно перемещается в лок2. Если единственными классами
наблюдаемых объектов, которые могут существовать в любом местоположении,
являются кровати и раковины, то S1 и S2 соответственно указывают, существуют
ли фактические кровати и раковины, которые существуют в одном из loc1 или loc2.
O1 и O2 соответственно определяют наблюдаемые пласты и раковины в текущем
месте.
4.1. Логические сети Маркова (MLNs)

Формальное определение MLN L задаётся набором пар < Fi, wi >, где Fi
- формула в логике первого порядка и wi - вещественно-значимый вес. Для
каждой конечной области констант D MLN L определяет основную марковскую
сеть ML,D = < X,G > следующим образом (подробнее см. (Jain 2011)):
Рисунок 4. Вероятностная система планирования

• X - набор логических переменных. Для каждого возможного
основания каждого предиката, появляющегося в L, добавьте логическую
переменную (основной атом) к X.
14
* G - набор взвешенных основных формул, т.е. набор пар < Fj, "wj" >,
где Fj "- формула заземления, а wj '- действительный вес.
Основная маркова сеть ML, D определяет распределение вероятности по
множеству возможных миров X следующим образом:
4.2. Обучение MLN
Изучение статистической реляционной модели включает построение
модели на основе наблюдаемых изученных данных. Структура модели может
быть либо известна априори, оставляя только параметры, подлежащие
определению, как показано на (Kok & Domingos, 2005), либо может быть
частью проблемы обучения. Следовательно, различают параметрическое
обучение от более сложной проблемы структурного обучения. Первый подход
к изучению структуры MLN был представлен (Kok & Domingos 2005), в то
время как структурное обучение явно важно, если системы искусственного
интеллекта (ИИ) должны создавать вероятностные модели с как можно
меньшей помощью человека. Таким образом, обучение параметрами является
наиболее важным аспектом для инженеров в области знаний, которые обычно
качественно оценивают свойства распределения и указывают зависимости
между переменными, но не могут количественно определить степень, в которой
эти переменные зависят друг от друга.
В логической сети Маркова целью изучения параметров является
установка весов формул модели таким образом, чтобы они отражали
наблюдения, которые были сделаны в отношении конкретной части мира,
которой касается модель. Сделанные замечания отражают конкретные аспекты
мира, которые должны быть охвачены моделью, так что они позволяют модели
точно определить общие принципы. Наблюдения, используемые для обучения,
могут храниться в базе данных обучения, которая использует тот же язык, что
и модель.
Поскольку MLN используют логические предикаты, база данных, таким
образом, должна содержать истинные значения ряда атомов земли. Объекты,
появляющиеся в базе данных обучения, неявно определяют набор X атомов земли.
Любые атомы земли в X, истинные значения которых не приведены в
тренировочной базе данных, считаются ложными (предположение о замкнутом
мире). Таким образом, в этом предположении база данных обучения определяет
полное назначение X = x.
Максимальное псевдо-правдоподобие обучения: Этот метод может

быть решен путем максимизации псевдо-правдоподобия.
где Xk - нулевой атом, xk - истинное значение Xk в x, и MBx (Xk) -

назначение Xk-марковского одеяла в x (Richardson & Domingos, 2006). Псевдо-
правдоподобие аппроксимирует P (X = x), делая сильные предположения
независимости, таким образом избегая дорогостоящего процесса вывода.
Дискриминационное обучение: наиболее привлекательной
особенностью неориентированных моделей и, следовательно, MLN является то,
что они также могут быть обучены дискриминационно, т.е. они могут быть
обучены представлять не полное совместное распределение, а условное
распределение. Предполагая, что существует строгое разделение между
наблюдаемыми и ненаблюдаемыми переменными в рассматриваемом
приложении (например, задача классификации, где только классы всегда
неизвестны, но дается все остальное), дискриминирующее обучение может дать
модели с превосходной производительностью. Методы дискриминационного
обучения МЛН были внедрены (Singla & Domingos 2005). На рис. 5 поясняются
компоненты фазы обучения MLN.
Во многих приложениях априори известно, какие предикаты будут
доказательством и какие из них будут запрошены, и цель состоит в том, чтобы
правильно предсказать последнее, учитывая первое. Если размолотые атомы в
домене разделены на набор атомов доказательства X и набор атомов запроса Y,
условная вероятность Y, заданного X, равна:
Рисунок 5. Этап обучения MLN
16 где FY - набор всех предложений MLN по крайней мере с одним заземлением с

участием атома запроса, ni(x, y) - число истинных оснований i-го предложения,
включающего атомы запроса, GY - набор предложений основания в ML, C,
включающий атомы запроса, и gj (x, y) = 1, если свойство jth ground имеет
значение true в данных и 0 в противном случае. Когда некоторые переменные
скрыты (т.е. ни запрос, ни доказательство), условная вероятность должна быть
вычислена путем их суммирования, хотя для простоты все переменные, не
являющиеся доказательствами, рассматриваются как переменные запроса.
Градиент условного логарифмического правдоподобия (CLL):
4.3. MLN как механизм вывода.

Вероятностная семантика логических сетей Маркова определяется через
наземные случайные поля Маркова, поэтому вывод может быть по существу
обработан применением стандартных методов вывода для сетей Маркова.
Марковская цепь Monte Carlo (MCMC) (Koller & Friedman, 2009) по

существу является приближенным методом выборки, в котором отдельные
образцы не берутся независимо, а берутся из марковской цепи, т.е. модели,
описывающей последовательности состояний. На рис. 6 показаны компоненты
фазы запроса MLN.
Формально цепь Маркова над пространством состояний X задаётся
начальным распределением состояний security0: X ∈ [0, 1] и вероятностной
моделью перехода, делающей предположение Маркова первого порядка: Для
любого заданного состояния x ∈ X распределение вероятности над состояниями-
преемниками x0 задаётся T (x → x'): = P (x' | x).
MC-SAT применяет выборку среза к логике Маркова, используя

SampleSAT для выборки нового состояния, заданного вспомогательными
переменными. В марковской сети, полученной путем применения MLN к
набору констант, каждое наземное предложение ck соответствует потенциаль-
ной функции φk(x) = exp(wkfk(x)), которая имеет значение ewk, если ck
удовлетворяется, и 1 в противном случае. Дополнительную информацию см. в
Poon & Domingos (2006).
Рисунок 6. Фаза вывода (запроса) MLN

4.4. Алгоритм от SKB до MLN
Для создания MLN из SKB разработан алгоритм 2:
Algorithm 2.
Input: SKB Classes (C), Properties (P), Roles (R) Output: MLN
Types=null Domain = null Predicate = null Formulas = null For every c in C
If c is atomic class
Type = Type + c
Domain = Domain + Individuals(c) For every p in P
Parameter = (Domain (p), Range (p)) Predicate = Predicate + p(Parameter)
For every r in R
Formulas = Formulas + Create formula (r) MLN = combine (Predicate +
Formulas)
Return MLN
4.5. examples
1. Предположим, что планировщик должен вставить действие

перемещения (move r2 r1) (где r2 является гостиной, а r1 может быть спальней или
офисом), поэтому существует два возможных значения r1. Тогда предположим, что
значение r1 зависит от результата запроса, который возвращается из изученной
модели MLN. Если результат показывает, что r1 может быть спальней с
вероятностью 0,2 или офисом с вероятностью 0,8, то действием перемещения
должно быть перемещение r2 r1 с r1 = офис.
2. Продолжая приведенный выше пример (перемещение r2 r1), неявные
ожидания нахождения в r2 определяются на основе типа r2. Если r2 считается
спальней, а спальни определяются как комнаты с кроватью (S1) и без раковины (S2),
то подразумеваемые ожидания могут быть E1 = с кроватью и E2 = без раковины.
Условные вероятности переменных состояния при условии, что робот находится в
спальне, могут быть определены следующим образом: наличие кровати, т.е. S1 в
спальне может быть P (S1 = true 'bedroom) = 1, в то время как вероятность отсутствия
раковины в спальне P (S2 = 0 | bedroom) = 1.
5. Тестовый сценарий
В этом разделе будут представлены эксперименты по моделированию для
сбора больших объемов данных с целью статистической оценки эффективности
предлагаемой структуры. Из-за отсутствия эталонных систем при составлении
символьных планов оценка основывается на показателях ложноположительной
ставки (FPR, отношение между количеством ложных срабатываний и общим
18
количеством фактических отрицательных случаев) и истинный положительный
показатель (TPR, отношение между количеством истинных положительных и
общим количеством фактических положительных случаев).
Сценарий тестирования включает выполнение задач навигации и
манипуляции в домашней среде. Этот дом состоит из девяти комнат, а именно:
кухня, офис, спальня, ванная комната, библиотека, служебная комната,
гостиная, зал и столовая, как показано на рисунке 7. Эти помещения еще не
идентифицированы и робот зависит от модуля MLN для их идентификации.
Рисунок 7. Среда робота
5.1. Результаты симуляции

В этом разделе для обучения модели MLN и вывода из неё новой
информации в экспериментах использовалось программное обеспечение ProbCog
Cognition for Technical Systems (ProbCog) ("Интеллектуальные автономные системы
- ProbCog Toolbox", 2013). Были собраны данные создания плана действий по
манипулированию и навигации внутри домашней среды. Планировщик известен
как Metric-FF (Hoffmann & Nebel, 2001). Этот планировщик стал очень популярен в
течение последних нескольких лет. Операция, описанная в данной статье, не
ограничивается данным планировщиком, но может быть использована любая
операция в стиле STRIPS. Планировщик Metric-FF может уже иметь некоторые
другие методы повышения своей вычислительной эффективности планирования,
поэтому общее улучшение предлагаемой структуры может быть высоким.
5.2. Метрики для оценки эффективности
Оценка эффективности предлагаемых методов в этой статье основана на
метриках истинный положительный уровень (TPR) и ложноположительный
уровень (FPR). С каждой метрикой связаны следующие формулы:
5.3. Сценарий манипуляции

В первом сценарии робот захватит предметы внутри печи и поместит их
на свое основание, чтобы их можно было перенести в другое место внутри
дома. Существует общий класс объект, которому принадлежат все подклассы
объекта. Некоторые объекты имеют специфические свойства с точки зрения
ограничений по отношению к другим атомарным объектам, таким как
дескриптор. В этой среде имеется 18 объектов, 4 из которых могут быть
отобраны.
5.4. Сценарий навигации
В этом сценарии робот действует в домашней среде, которая состоит из 9
комнат различных типов (кухня, офис и т.д.). В каждом номере имеются предметы
мебели, типичные для данного типа помещений.
Например, на кухне есть духовка, раковина и т.д. Всего в комнате может
существовать 18 различных типов объектов. Семантические знания,
используемые в этом сценарии, более сложны, чем в предыдущем сценарии.
Определения содержат больше ограничений, и существует больше связанных
объектов, которые необходимо учитывать для классификации комнаты.
Действительно, существуют определенные типы объектов, которые при
наблюдении не влияют на процесс классификации, например, источники света.
5.5. Пороговое значение для принятия решений
Количество связанных с комнатой или другими объектами объектов
определяется переменной (Th). Степень выбора желаемых предикатов зависит от
стандартного отклонения (stddev), которое может быть вычислено на основе
ответов, полученных из механизма вывода, изображенного на фиг.6. Существует
три типа ответа: успех, когда вероятность, связанная с каждым предикатом,
закончилась (среднее + stddev), сбой, когда вероятность, связанная с каждым
предикатом, ниже (среднее - stddev) и неизвестен, когда вероятность, связанная с
каждым предикатом, находится между ними.
5.6. Создание детерминированного плана
Производительность процесса генерации детерминированного плана была
протестирована в обоих сценариях. Для сценария манипуляции каждый
эксперимент состоял из генерации высокоуровневого действия (pick-up obj) рукой
для захвата объекта (obj), который находился внутри холодильника.
Высокоуровневое определение действия захвата дается следующим образом:
Процесс генерации плана был вызван после того, как процесс планировщика
сообщил о том, что он успешно создал действие (pickup obj). Камера на роботе
использовалась для получения визуальной информации о захваченном объекте,
которая затем хранилась в базе данных доказательств.
Эксперимент "(pickup obj)" проводился так, что obj утверждалось 10 раз
как один из четырех типов: чашка, чаша, стеклянная вода и молочная коробка,
давая в общей сложности 40 прогонов. В каждом прогоне тип объекта, который
был захвачен, был правильно выбран из 4 доступных типов в зависимости от
20 его описания в базе данных доказательств.
Аналогично, навигационный сценарий состоит из действия (move from
to) по перемещению робота из холла в другое помещение, идентифицированное
символом (to) и тип которого утверждался как один из доступных типов
помещений, т.е. спальня, гостиная и т.д. Каждый тип комнаты рассматривался
10 раз, поэтому общее количество пробежек составляет 80. Для каждого
прогона тип конечного местоположения робота был успешно выбран из 8
доступных типов. Мировое состояние, содержащее объекты, которые
соответствовали фактическому местоположению, затем создавалось с
использованием того же порога из раздела 5.5. Объекты, которые можно было
наблюдать в базе данных наблюдения робота, определялись согласно
пороговому параметру. Наблюдаемые объекты были добавлены в базу данных
наблюдений, в то время как остальные были скрыты.
Таблица 1 показывает полученные результаты для трех различных
значений (Th). Строки таблицы представляют сопоставленные результаты
между ожидаемым объектом (полученным из модели действий в плане) и
фактическим объектом (доказательством) (полученным из базы данных
доказательств). Первая строка для каждого сценария представляет
положительный результат сопоставления, т.е. прогоны, в которых ожидаемый
результат действия совпадает с фактическим результатом. Вторая строка
представляет отрицательный результат сопоставления, т.е. прогон, в котором
ожидаемый результат действия отличается от фактического результата.
Столбцы, с другой стороны, представляют результаты проверки неявных
ожиданий ожидаемого объекта, поэтому результаты являются совпадающими
(Matched), несопоставленными (Unmatched) или неоднозначными (Ambiguous).
В этих результатах детерминированное планирование способно показать
высокий процент истинных положительных результатов (положительные
экземпляры, которые правильно классифицированы) и нулевой процент ложных
положительных результатов (отрицательные экземпляры, которые ошибочно
классифицированы как положительные). Истинные негативы (ситуации отказа)
обнаруживаются с различным процентом между сценариями навигации и
манипуляции. Они имеют высокий уровень в навигационном (82%, 85%, 90%) и
небольшой уровень в манипуляционном сценариях (20%, 32%, 40%) (таблица 2).
Различие в обнаружении ошибок между этими сценариями обусловлено
различием в определениях концепций в каждом сценарии. В случае манипуляции
для определения каждой концепции в этом сценарии используется небольшое
количество ограничений, поэтому большое количество условий будет
рассматриваться как отрицательное доказательство и неоднозначные результаты
будут высокими. В то время как в случае навигации концепции в этом сценарии
сильно ограничены, несколько условий будут рассматриваться как негативные
доказательства, а неоднозначные результаты будут низкими.
5.7. Вероятностная генерация плана
В этом разделе та же экспериментальная установка используется для оценки
производительности вероятностной семантической системы планирования знаний.
Однако состояния мира для системы имеют более одного возможного значения,
каждое с заданной вероятностью возникновения. Для захвата первое состояние
выражает возможность подбора нужного объекта, в то время как другое состояние
выражает возможность подбора другого объекта. Для сценария навигации
рассматривается действие (перемещение из в) для перемещения робота из
начальной комнаты в целевую комнату. Первое состояние отражало ситуацию,
когда робот оставался бы непреднамеренно в начальной комнате, в то время как
другое состояние выражало случай, когда робот фактически оказался бы в целевой
комнате. Также было обеспечено вероятностное планирование, с наблюдаемой
моделью, указывающей вероятности не наблюдения или неправильной
классификации объекта (предикаты, имеющие знаки минус перед ними).
The probability of selecting the desired predicates from the learned MLN is
depended on standard deviation (Stddev), which is a statistic used as a measure of the
dispersion or variation in a distribution. Stddev is calculated from the weights associated
with all the formulas in MLN model. Then, it is used with mean value of the formula
weights in the comparison with the value associated with the answer about queried object
in the action related to the current plan. This answer is derived from the MLN model in
inference engine phase as depicted in Figure 6. There are three types of answer: matched
(M) when the probability associated with a predicate is over (mean + stddev), unmatched
(U) when the probability associated with a predicate is below (mean- stddev) or ambiguous
when the probability associated with a predicate between (mean + stddev) and (mean-
stddev). In the case of ambiguous, it needed more evidences (either positive or
negative) in order to be (M) or (U). There are 3 casesconsidered to obtain the value of
(Stddev) which are depended on the variable (Th). This variable is represented as the
number of related objects in the room or in relation to other objects. The considered cases are
when the number of related objects are 3, 5 and 7 objects.
Вероятность выбора желаемых предикатов из усвоенного MLN зависит
от стандартного отклонения (Stddev), которое является статистикой,
используемой в качестве меры дисперсии или вариации в распределении. Stddev
рассчитывается по весам, связанным со всеми формулами в модели МЛН. Затем
его используют со средним значением весов формулы при сравнении со
значением, связанным с ответом о запрашиваемом объекте в действии,
связанном с текущим планом. Этот ответ получен из модели MLN в фазе
двигателя вывода, как показано на фиг.6. Существует три типа ответа:
совпадающий (M), когда вероятность, связанная с предикатом, закончилась
(mean + stddev), несопоставленный (U), когда вероятность, связанная с
предикатом, ниже (mean + stddev) или неоднозначный, когда вероятность,
связанная с предикатом между (mean + stddev) и (mean - stddev). В случае
двусмысленности она нуждалась в большем количестве доказательств
(положительных или отрицательных), чтобы быть (M) или (U). Существует 3
случая для получения значения (Stddev), которые зависят от переменной (Th).
Эта переменная представляет собой количество связанных объектов в комнате
или по отношению к другим объектам. Рассматриваемыми случаями являются
случаи, когда число связанных объектов равно 3, 5 и 7.
Эксперименты проводились там, где два объекта (вовлеченные в
22 результаты действия) могли быть любого из доступных типов. Модель
действий для обоих сценариев имеет два возможных результата с
соответствующими вероятностями. Эти вероятности представляют возможное
влияние действия на следующее порожденное мировое состояние. Вероятные
результаты действий представлены в виде out_1 и out_2. "out_1 представляет
неверный эффект действия, в то время как out_2 представляет правильный
эффект действия". К этим результатам относятся два распределения
вероятности: для первого распределения p (out_1) = 0,3, p (out_2) = 0,7, тогда
как для второго распределения p (out_1) = 0,7, p (out_2) = 0,3. Например, если
распределения вероятности результата действия (переместить r1r2) для
перемещения робота из гостиной (r1) в кухню (r2) равны p (out_1) = 0,3 и p
(out_2) = 0,7, то эффект действия таков: робот на кухне. Этот эффект
сравнивается с ответом, возвращенным из MLN, когда система планирования
запрашивает MLN о типе r2. Если он сопоставлен, система планирования
продолжит генерировать другие действия для выполнения задачи. Если он не
соответствует друг другу, то будет рассмотрен другой возможный результат и
будет запущена та же последовательность проверки.
Для каждой комбинации типов объектов или комнат и возможных
распределений вероятностей эффектов действия эксперимент повторялся 10
раз, поэтому общее количество запусков составляет 320 как для манипуляции,
так и для навигации.
В таблице 3 обобщены результаты вероятностного планирования обоих видов
действий, то есть манипуляции и навигации. Строки представляют выбранный
результат действия с наибольшей вероятностью в модели действия, в то время как
столбцы показывают результаты ответов MLN, которые были вычислены путем
выбора ответа с наибольшим весом из MLN. Затем значения ответа Совпадают,
Несопоставлены или Неоднозначны.
Истинный положительный уровень (TPR) и ложный положительный
уровень (FPR) для вероятностного планирования были рассчитаны путем
рассмотрения результата 2, то есть out_2 как положительный случай, а out_1
как отрицательный случай. В таблице 4 приведены значения TPR и FPR для
обоих типов действий. Результаты указывают на хорошую
производительность, так как TPR имеет тенденцию быть высоким и FPR имеет
тенденцию быть низким. Как и в случае детерминированного планирования,
можно заметить, что производительность становится лучше, когда вероятность
(Th) выше. Аналогично, можно заметить, что производительность в сценарии
навигации намного лучше, чем в сценарии манипуляции. Это связано с
количеством зависимостей и количеством связанных объектов в среде.
Сравнивая таблицу 2 и таблицу 4, можно заметить, что
детерминированная система планирования имеет высокую (100%)
производительность при классификации всех правильных сопоставлений (TPR)
между ожидаемым объектом и фактическим (доказательным) объектом как
положительных. Но он имеет высокий процент ошибок при классификации
несовпадающих случаев как положительных (FPR), особенно в сценарии
манипуляции. Это связано с ограниченным количеством ограничений в
определении объектов в этом сценарии.
С другой стороны, вероятностная система планирования имеет меньший
процент производительности (от детерминированного планирования) при
классификации правильного сопоставления как положительного (TPR), но имеет более
высокий процент правильного определения (от детерминированного планирования) при
обнаружении случаев ошибки (FPR).
Таблица 2. Частота истинных срабатываний (TPR) и ложных
срабатываний (FPR)
Th = 3 objects Th = 5 objects Th = 7 objects

TPR FPR TPR FPR TPR FPR
Navigation 100 17.91 100 15.15 100 10.45
Manipulation 100 80.65 100 67.74 100 59.38
Таблица 3. Результаты выполнения вероятностного плана

формирования навигационных и манипуляционных действий
Th = 3 Objects Th = 5 Objects Th = 7 Objects

U M A U M A U M A
Перемещение out_1 120 7 5 128 5 3 132 2 2
out_2 16 160 12 12 163 9 4 171 9
Манипулирова out_1 100 39 13 112 30 10 124 16 8
ние out_2 56 102 10 44 117 7 32 135 5
Таблица 4. Показатели истинных срабатываний (TPR) и ложных

срабатываний (FPR), приведенные в процентах, вероятностной системы
планирования действий навигации и манипуляции
Th = 3 Objects Th = 5 Objects Th = 7 Objects

TPR FPR TPR FPR TPR FPR
Navigation 91.49 9.09 93.48 5.88 97.83 2.94
Manipulation 66.67 34.21 73.81 26.32 81.4 16.21
6. Заключение и будущая работа

В настоящем документе разработаны два процесса формирования
планов. Первый процесс подходит для доменов с детерминированными
мировыми состояниями, в то время как второй процесс предназначен для
обработки доменной неопределенности в состояниях мира.
Новизна первого подхода заключается в формировании семантических
24 планов с использованием семантических знаний для вычисления неявных
ожиданий. Эти ожидания используются для проверки созданных планов при
успешном создании действий плана. Эти неявные ожидания затем проверяются
на основе доказательной информации, собранной роботом.
Во втором процессе был разработан новый метод, позволяющий роботу
справляться с неопределенностью. Шаблон модели MLN создается на основе
информации, хранящейся в семантической базе знаний. Эта модель имеет
возможность обучения с использованием данных, для формирования
усвоенного MLN, который имеет возможность отвечать на запросы при
генерации из системы планирования. Усвоенный MLN обладает способностью
выводить (вероятностным образом) типы и существование объектов или мест в
среде робота. Значения ответов MLN могут совпадать, не совпадать или
неоднозначны в зависимости от распределения весов формул MLN и
вероятности, связанной с каждым ответом. Экспериментальные результаты
показывают, что знание семантической области может эффективно помочь
роботам достичь хорошей производительности, когда оно используется для
создания планов для их задач.
Использование семантических знаний при формировании плана помогает
обнаружить неверные случаи, которые не могут быть обнаружены традиционными
подходами к планированию, поскольку планирование в зависимости только от
явных эффектов действий не может быть достаточным для выявления неожиданных
ситуаций.
При учете неопределенности производительность лучше, как показывают
результаты TPR и FPR формирования плана двух различных видов действий.
Причина такого повышения производительности может быть объяснена тем, что
ожидания не обрабатываются логическим способом, т.е. согласованными,
непревзойденными или неоднозначными. Кроме того, решения в отношении того,
было ли возбуждение иска сорвано или успешно, основываются на том, насколько
вероятно, что каждое ожидание будет проверено или нарушено с учетом
доказательной информации.
Основное внимание уделяется созданию планов робота путем проверки его
(явных и неявных) состояний: эти состояния могут включать местоположение
робота в случае навигационных действий, но также включают другие аспекты
мирового состояния для дополнительных действий, таких как захват объектов.
Будущая работа включает в себя получение большего количества
обучающих данных для того, чтобы охватить большинство ситуаций, которые
могут столкнуться с операциями робота, и использование их для изучения модели
и восстановления после ситуаций, когда параметры домена не являются
детерминированными. Также будет рассмотрено использование других типов
статистических реляционных моделей, таких как байесовские логические сети, для
поддержки планировщика задач.
СПИСОК ИСТОЧНИКОВ
Al-Moadhen, A., Packianather, M., Setchi, R., & Qiu, R. (2014). Automation
in Handling Uncertainty in Semantic-knowledge based Robotic Task-planning by
Using Markov Logic Networks (Vol. 35, pp. 1023–1032). Procedia Computer Science.
Al-Moadhen, A., Qiu, R., Packianather, M., Ji, Z., & Setchi, R. (2013).
Integrating Robot Task Planner with Common-sense Knowledge Base to Improve the
Efficiency of Planning (Vol. 22, pp. 211–220). Procedia Computer Science.
Baader, D. C., McGuinness, D. L., Nardi, D., & Patel-Schneider, P. F. (2010).
The Description Logic Handbook: Theory, Implementation and Applications.
Second Edi.
Bechhofer, S., van Harmelen, F., Hendler, J., Horrocks, I., McGuinness,
D. L., Patel-Schneider, P. F., & Stein,
L. A. (2004). OWL Web Ontology Language Reference. W3C. Retrieved
December 15, 2013, from http://www. w3.org/TR/owl-ref/
Bouguerra, A., & Karlsson, L. (2004). Hierarchical task planning under uncertainty.
Proceedings of the 3rd Italian Workshop on Planning and Scheduling, 9th National
Symposium of Associazione Italiana per l’Intelligenza Artificiale, Perugia, Italy.
Bouguerra, A., Karlsson, L., & Saffiotti, A. (2007). Handling uncertainty in
semantic-knowledge based execution monitoring. Proc. of the International Conference
on Intelligent Robots and Systems (IROS), (pp. 437-443).
doi:10.1109/IROS.2007.4399317
Eich, M., Dabrowska, M., & Kirchner, F. (2010). Semantic labeling: Classification
of 3d entities based on spatial feature descriptors. IEEE International Conference on
Robotics and Automation (ICRA 2010).
Galindo, C., Fernández-Madrigal, J. A., González-Jimenez, J., & Saffiotti, A.
(2007). Using semantic information for improving efficiency of robot task planning.
in: ICRA Workshop on Semantic Information in Robotics, in IEEE ICRA 2007, Rome,
Italy.
Galindo, C., Fernández-Madrigal, J. A., González-Jimenez, J., & Saffiotti, A.
(2008). Robot task planning using semantic maps. Robotics and Autonomous Systems,
56(11), 955–966. doi:10.1016/j.robot.2008.08.007
Galindo, C., González-Jimenez, J., & Fernández-Madrigal, J. A. (2004).
Interactive Task Planning through Multiple Abstraction: Application to Assistant
Robotics. 16th European Conference on Artifical Intelligence. (pp. 1015-1016).
Galindo, C., Saffiotti, A., Coradeschi, S., Buschka, P., Fernandez-Madrigal, J.
A., & Gonzalez, J. (2005). Multi- hierarchical semantic maps for mobile robotics. In
IEEE/RSJ International Conference on Intelligent Robots and Systems (pp. 2278–
2283).
Hoffmann, J., & Nebel, B. (2001). The FF Planning System: Fast Plan
Generation Through Heuristic Search.
Journal of Artificial Intelligence Research, 14(1), 253–302.
Hois, J., Wünstel, M., Bateman, J. A., & Röfer, T. (2007). Dialog-Based 3D-
Image Recognition Using a Domain Ontology. Lecture Notes in Computer Science,
4387, 107–126. doi:10.1007/978-3-540-75666-8_7
26
Intelligent Autonomous Systems - ProbCog Toolbox. (2013). Retrieved March 21,
2014, from http://ias.in.tum. de/software/probcog
Jain, D. (2011). Knowledge engineering with markov logic networks: A review.
DKB 2011: Proceedings of the Third Workshop on Dynamics of Knowledge and
Belief.
Jain, D., Waldherr, S., & Beetz, M. (2009). Bayesian logic networks.
Technical report, IAS Group, Fakultät für Informatik. Technische Universität
München.
Kok, S., & Domingos, P. (2005). Learning the structure of Markov logic
networks. Proceedings of the 22Nd International Conference on Machine Learning.
(p. 441-448). doi:10.1145/1102351.1102407
Koller, D., & Friedman, N. (2009). Probabilistic Graphical Models:
Principles and Tecniques. MIT Press.
Laskey, K. B. (2008). MEBN: A language for first-order Bayesian knowledge
bases. Artificial Intelligence, 172(2-3), 140–178. doi:10.1016/j.artint.2007.09.006
Lenat, D. B. (1995). CYC: A large-scale investment in knowledge
infrastructure. Communications of the ACM, 38(11), 33–38.
doi:10.1145/219717.219745
Lukasiewicz, T. (2008). Expressive probabilistic description logics. Artificial
Intelligence, 172(6-7), 852–883. doi:10.1016/j.artint.2007.10.017
Ong, S. C. W., & Hsu, D.Shao Wei Png; Wee Sun Lee. (2010). Planning under
Uncertainty for Robotic Tasks with Mixed Observability. The International Journal
of Robotics Research, 29(8), 1053–1068. doi:10.1177/0278364910369861
Papadimitriou, C. H., & Tsitsiklis, J. N. (1987). The Complexity of Markov
Decision Processes. Mathematics of Operations Research, 12(3), 441–450.
doi:10.1287/moor.12.3.441
Poon, H., & Domingos, P. (2006). Sound and efficient inference with probabilistic
and deterministic dependencies, In: Proceedings of the Twenty-First National
Conference on Artificial Intelligence. (pp.458–463).
Richardson, M., & Domingos, P. (2006). Markov logic networks. Machine
Learning, 62(1-2), 107–136. doi:10.1007/s10994-006-5833-1
Singla, P., & Domingos, P. (2005). Discriminative training of Markov logic
networks, Proceedings of the 20th National Conference on Artificial Intelligence, Vol.
2, (pp.868–873).
Tenorth, M., & Beetz, M. (2009). KNOWROB — knowledge processing for
autonomous personal robots. In 2009 IEEE/RSJ International Conference on
Intelligent Robots and Systems (pp. 4261–4266). doi:10.1109/ IROS.2009.5354602
Tenorth, M. Kunze, L., Jain, D., & Beetz, M. (2010). KNOWROB-MAP -
knowledge-linked semantic object maps. In 2010 10th IEEE-RAS International
Conference on Humanoid Robots (pp. 430–435). IEEE.
Theobalt, C., Bos, J., Chapman, T., Espinosa-Romero, A., Fraser, M., Hayes,
G., & Reeve, R. et al. (2002). Talking to Godot: dialogue with a mobile robot. In
IEEE/RSJ International Conference on Intelligent Robots and System: Vol. 2, (pp.
1338–1343). doi:10.1109/IRDS.2002.1043940

Планирование задач робота в детерминированных и вероятностных условиях с использованием семантической базы знаний

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Планирование задач робота в детерминированных и вероятностных условиях с использованием семантической базы знаний

Загружено:

Авторское право:

Доступные форматы

Планирование задач робота в детерминированных и

вероятностных условиях с использованием семантической базы

3. Семантическая база знаний (SKB) в системе планирования

Th = 3 objects Th = 5 objects Th = 7 objects

Атомарный класс: Комната, Объект.

Расположение уровней онтологии, состоящее из множества классов, их

SELECT ?k1 ?f1

утверждает, что k1 является экземпляром кухни, а f1 - экземпляром объекта.

Алгоритм 1. Псевдокод семантического процесса создания плана на

На шаге 2 блоку наблюдения/подтверждения предлагается вернуть

1. Для планирования запрашивается задание, например, "принеси мне

4. Планирование в условиях неопределенности

Семантическая база знаний предлагается для поддержки системы

Пример: Предположим, что система планирования должна добавить

4.1. Логические сети Маркова (MLNs)

Рисунок 4. Вероятностная система планирования

Максимальное псевдо-правдоподобие обучения: Этот метод может

где Xk - нулевой атом, xk - истинное значение Xk в x, и MBx (Xk) -

Рисунок 5. Этап обучения MLN

16 где FY - набор всех предложений MLN по крайней мере с одним заземлением с

4.3. MLN как механизм вывода.

Марковская цепь Monte Carlo (MCMC) (Koller & Friedman, 2009) по

MC-SAT применяет выборку среза к логике Маркова, используя

Рисунок 6. Фаза вывода (запроса) MLN

1. Предположим, что планировщик должен вставить действие

Рисунок 7. Среда робота

5.1. Результаты симуляции

5.3. Сценарий манипуляции

Th = 3 objects Th = 5 objects Th = 7 objects

Таблица 3. Результаты выполнения вероятностного плана

Th = 3 Objects Th = 5 Objects Th = 7 Objects

Таблица 4. Показатели истинных срабатываний (TPR) и ложных

Th = 3 Objects Th = 5 Objects Th = 7 Objects

6. Заключение и будущая работа

Вам также может понравиться