Вы находитесь на странице: 1из 420

Москва, 2008

УДК 681.3.06
ББК 66.33 (2Рос), 123c51w

Когаловский М.Р., Хохлов Ю.Е.


K74 Стандарты XML для электронного правительства. – М.: Институт развития
информационного общества, 2008. – 416 с.

ISBN 978-5-901907-02-03

Впервые на русском языке достаточно полно и систематически представлены функциональные


возможности новой технологической платформы XML, которые в последнее время нашли
широкое применение в проектах электронного правительства и других областях. Предпринята
попытка упорядочить русскоязычную терминологию в данной области.
Обсуждаются основные понятия и опыт реализации проектов электронного правительства,
роль стандартов XML в разработках электронного правительства, содержится общее описание
комплекса стандартов платформы XML, метаописания основных стандартов, глоссарий ис-
пользуемых терминов, новые переводы на русский язык действующих версий спецификаций
базовых стандартов платформы - языка Extensible Markup Language (XML), XML Infoset и
Namespaces in XML.
Издание предназначено для руководителей, экспертов и разработчиков информационных
систем электронного правительства, а также для специалистов, использующих стандарты новой
технологической платформы Веб.

УДК 681.3.06
ББК 66.33 (2Рос), 123c51w
Онлайновая версия глоссария по XML
размещена в Энциклопедии
информационного общества по адресу:
http://wiki.iis.ru

ISBN 978-5-901907-02-03 © Институт развития информационного общества, 2008


Содержание
1. Основные представления об электронном правительстве   ������������������������������������������� 11
1.1. Электронное правительство: основные понятия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2. Модель и стадии развития электронного правительства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3. Архитектура электронного правительства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4. Опыт создания электронного правительства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5. Стандарты XML в разработках электронного правительства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2. Общая характеристика комплекса стандартов XML  ��������������������������������������������������������� 27
2.1. Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2. Предпосылки создания технологий XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3. Истоки XML-технологий . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4. Организация и функциональные возможности платформы XML . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5. Назначение и функциональные возможности языка XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.6. Преемственность с технологиями HTML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.7. Стандарты веб-сервисов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.8. Технологии семантического Веб . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.9. Особенности XML-данных и их моделирование . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.10. XML-ориентированные базы данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.11. Новые направления и перспективы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.12. Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3. Краткие метаописания стандартов  ��������������������������������������������������������������������������������������� 57
4. Глоссарий основных терминов    ����������������������������������������������������������������������������������������� 139
4.1. Организация глоссария . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
4.2. Пометы в заголовках статей глоссария . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
4.3. Русскоязычные термины и их определения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
4.4. Глоссарий . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
4.4. Англоязычные термины глоссария . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
4.5. Часто используемыеанглоязычные аббревиатуры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
4.6. Спецификации стандартов,охваченных глоссарием . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
5. Указатель метаописаний стандартов XML  ������������������������������������������������������������������������� 307
ПРИЛОЖЕНИЕ. Переводы базовых стандартов XML  ������������������������������������������������������������311
П.1. Расширяемый язык разметки XML 1.1(вторая редакция)  ����������������������������������������������������������311
П.2. Пространства имен в XML 1.1 (вторая редакция)   ��������������������������������������������������������������������377
П.3. Набор единиц информации XML (вторая редакция)  ��������������������������������������������������������������� 393
Благодарности  ������������������������������������������������������������������������������������������������������������������������������411

5
Введение

Введение
Стандарты играют все возрастающую роль в современном информационном обществе.
Многочисленные проекты электронного правительства сталкиваются со сложной
проблемой обеспечения интероперабельности элементов информационной инфра-
структуры и отдельных приложений, разрабатываемых, как правило, различными
коллективами на основе разнообразных технологий. Решить эту проблему позволяет
использование информационно-коммуникационных технологий (ИКТ), основанных
на широко распространенных открытых стандартах де-факто. Значительное место
среди них занимает большой комплекс взаимосвязанных стандартов, составляющих
новую технологическую платформу Всемирной паутины (World Wide Web), которую
мы называем здесь платформой XML.
Особая роль стандартов платформы XML в разработках электронного правитель-
ства обусловлена двумя причинами. Первая из них заключается в том, что интернет и
Всемирная паутина сегодня образуют ключевую инфраструктуру современного инфор-
мационного общества, а органы власти стали использовать интернет в качестве одного
из основных каналов для взаимодействия с гражданами и бизнесом. Многочисленные
информационные системы электронных правительств функционируют в среде Веб
и, следовательно, не могут не учитывать и не использовать ИКТ, создаваемые для
нового поколения этой среды. Всемирная паутина обеспечивает комфортный доступ
к информации о деятельности органов власти и сервисам электронного правительства
всем категориям пользователей в любом месте, где имеется доступ к интернету. При
этом нет необходимости специально обучать пользователей – они могут обходиться
традиционными средствами доступа к Веб, не требуются существенные инвестиции
в создание специальной инфраструктуры доступа.
Другая причина – это возможность использования при разработке инфор-
мационных систем электронных правительств новых чрезвычайно развитых функ-
циональных возможностей технологий, основанных на стандартах платформы XML.
Такие технологии воплощены в настоящее время во многих продуктах крупнейших
поставщиков программного обеспечения. Среди них – веб-сервисные технологии,
позволяющие реализовать новые архитектурные подходы в разработках крупных

7
распределенных систем, технологии XML-ориентированных баз данных, технологии
семантического Веб, позволяющие оперировать информацией с учетом ее семан-
тики, технологии, которые позволяют поддерживать целостность и безопасность
информации, и многое другое.
Платформа XML включает в настоящее время несколько сотен стандартов.
Спецификации ключевых стандартов уже разработаны, жизненный цикл ряда
из них уже включает несколько версий. Многие стандарты находятся в стадии
разработки.
В деятельности, направленной на создание и развитие функциональных возмож-
ностей платформы XML, принимают участие многие организации. Основной вклад в
развитие этой платформы вносит образованный в 1994 году консорциум W3C (World
Wide Web Consortium), созданный для проведения единой технической политики
развития Всемирной паутины. Именно консорциумом W3C были разработаны и
рекомендованы базовые стандарты XML.
Значительный вклад в создание новых стандартов, обеспечивающих исполь-
зование технологий XML в приложениях, прежде всего, связанных с веб-сервисной
архитектурой и электронным бизнесом, принадлежит основанному в 1993 году
международному консорциуму OASIS (Organization for the Advancement of Structured
Information Standards). Консорциум OASIS активно включился в разработку новых
стандартов платформы XML после принятия базового стандарта языка XML.
В развитии рассматриваемого комплекса стандартов принимают также участие
различные ассоциации компаний, лидирующих в индустрии программного обе-
спечения – IBM, Microsoft, Oracle, Bea и ряд других. Разделение труда в развитии
платформы XML обеспечивается модульностью самой платформы и принципами ее
организации, обеспечивающими расширение функциональных возможностей, не
затрагивающее базовых стандартов.
В 2007 году консорциум W3C непосредственно включился в деятельность, связанную
с разработками в области электронного правительства. Первым крупным шагом консор-
циума в этом направлении стал симпозиум (http://www.w3.org/2007/eGov/eGov-policy),
проведенный в июне 2007 года W3C совместно с организацией WSRI (Web Science
Research Initiative). Основанием для проведения симпозиума стало признание того
факта, что органы государственной власти ориентированы на использование Веб и
других ИКТ для взаимодействия с гражданами, бизнесом и друг с другом.
Цель симпозиума состояла в том, чтобы найти способы упрощения разработки
стандартов для сайтов органов власти и очертить программу предстоящих исследо-
ваний в сфере создания веб-технологий и государственной политики, которые бы
позволили использовать потенциал Веб для доступа и использования правитель-
ственной информации. На симпозиуме обсуждались, в частности, такие вопросы,
как социальная и экономическая динамика потоков информации государственного
сектора в Веб, технологии интеграции данных и семантического Веб, поддержка в
Веб информации о местоположении (например, пространственные базы данных),
сервисы-посредники третьей стороны для граждан, вызовы времени в области
интероперабельности и соответствия стандартам.
Большое внимание, которое привлек к себе прошедший симпозиум, дает осно-
вания предполагать, что консорциум W3C будет конструктивизировать свои усилия

8
Введение

в области электронных правительств, инициировать новые стандарты, в которых


нуждается эта область применения, и способствовать их активному использованию
в практических разработках. Основой этих новых стандартов, несомненно, будут
являться базовые стандарты платформы XML. Краткий отчет о симпозиуме можно
найти по адресу http://www.w3.org/2007/06/eGov-dc/summary.
Технологии XML активно используются в нашей стране, как и во многих других
странах, в разработках информационных систем органов власти федерального и
регионального уровней, а также во многих других сферах приложений. Эти технологии
широко используются в ряде проектов Института развития информационного обще-
ства для проектирования и реализации различных прикладных систем электронного
правительства. Однако все еще имеется весьма ограниченное количество публикаций
концептуального характера на русском языке, посвященных указанному пласту ИКТ,
хотя таких публикаций крайне мало и в зарубежной литературе. Другая серьезная
проблема - пока еще не устоялась русскоязычная терминология в этой области.
Авторы надеются, что предлагаемая книга будет способствовать решению указанных
проблем.
Содержание книги построено следующим образом.
В первом разделе обсуждаются основные понятия, стадии развития и архитек-
тура электронного правительства, приводится краткое описание международного и
российского опыта построения электронных правительств, особое внимание уделено
роли и месту стандартов XML в разработках электронного правительства.
Во втором разделе приводится общая характеристика стандартов платформы
XML, принципов организации платформы, обеспечивающих ее расширяемость,
основных функциональных возможностей комплекса стандартов, составляющих
данную технологическую платформу.
Третий раздел содержит описания основных стандартов платформы в формате,
основанном на стиле набора метаданных Дублинского ядра.
В четвертом разделе содержится глоссарий терминов, используемых в специфи-
кациях основных стандартов платформы XML (около 1000 терминов). Большинство
определений терминов глоссария принадлежит авторам, некоторые определения
заимствованы из текстов спецификаций стандартов. Глоссарий включает список
использованных в нем англоязычных аббревиатур с их расшифровками, а также
перечень описываемых англоязычных терминов с предлагаемыми в глоссарии их
русскоязычными эквивалентами. Этот своеобразный словарик может использоваться
для перевода на русский язык англоязычных материалов по стандартам XML.
Указатель стандартов, приведенный в последнем, пятом разделе, облегчит
читателю нахождение в книге метаописаний соответствующих стандартов.
В книге содержится также список использованных авторами источников, а в
Приложении представлены новые переводы действующих версий спецификаций
трех базовых стандартов платформы XML, которые с полным правом можно назвать
фундаментальными стандартами платформы. К числу этих стандартов мы относим
спецификации языка XML, стандарты XML Infoset и Namespaces in XML. Они обе-
спечивают синтаксис для всех других языковых стандартов платформы, набор
примитивных компонентов архитектуры XML-данных, используемых в стандартах
платформы, а также механизм расширения функциональных возможностей платформы.

9
Именно перечисленные функции определяют фундаментальный характер указанных
стандартов. Приведенные в Приложении переводы стандартов выполнены авторами.
Они не имеют официального характера и включены в книгу для удобства читателя.
Представленные в книге материалы частично подготовлены авторами в рамках
методических проектов Института развития информационного общества (ИРИО),
выполнявшихся в течение ряда лет при поддержке РФФИ (проекты 01-07-90444 и
04-07-90184) и РГНФ (проект 03-02-12008).
Книга предназначена для руководителей, экспертов и разработчиков ин-
формационных систем электронного правительства, а также для специалистов,
использующих стандарты новой технологической платформы Веб.

10
1. Основные представления об
электронном правительстве

В данном разделе обсуждаются основные понятия, стадии развития и архитектура


электронного правительства, приводится краткое описание международного и рос-
сийского опыта построения электронных правительств, особое внимание уделено
роли и месту стандартов XML в разработках электронного правительства.

1.1. Электронное правительство: основные понятия


Что такое электронное правительство. Решение задач государственного управ-
ления с помощью информационно-коммуникационных технологий (ИКТ) имеет
продолжительную историю с момента выхода электронных вычислительных машин
из исследовательских лабораторий и их превращения в эффективные инструменты
решения практических задач. Следующим качественным этапом в использовании
ИКТ государственными органами стало развитие телекоммуникационных сетей, в том
числе ориентированных только на нужды государственных структур, позволивших
обеспечить взаимодействие отдельных информационных систем или их компонентов,
расположенных на значительном удалении друг от друга. Эти периоды характе-
ризовались, как правило, автоматизацией отдельных управленческих процессов,
накоплением и использованием реестров и баз данных необходимых для поддержки
принятия управленческих решений. Наконец, качественно новый этап в применении
ИКТ в процессах государственного управления наступил с массовым распростране-
нием персональных компьютеров и широким развитием публичных сетей, особенно
интернета. Произошла смена парадигмы: теперь не граждане и бизнес-структуры
взаимодействовали «лицом к лицу» с государственными органами, у которых за спиной
функционировали автоматизированные системы, облегчающие работу чиновников,
а пользовательские информационные системы (например, выполненные в клиент-

11


серверной архитектуре с тонким клиентом) взаимодействовали с государственными


информационными системами.
Современный этап широкомасштабного использования ИКТ для эффектив-
ного государственного управления, ориентированного на более качественное
предоставление услуг гражданам и бизнесу, начался в 80‑е и 90‑е годы прошлого
века. В это время возникла новая парадигма «управления, ориентированного на
граждан» как синтез парадигм «нового государственного управления» и «улучшенного
управления» в ходе реализации программ модернизации государства. Откликом
на это стала концепция «электронного правительства», появившаяся в результате
переосмысления модернизации государственного сектора и административной
реформы в эпоху развития информационного общества, в которой государственные
органы рассматривается в первую очередь как поставщик услуг населению, пред-
приятиям и государственным служащим на основе ИКТ. Электронное правительство
содействует радикальной смене отношении между государством и его гражданами,
которые рассматриваются как клиенты, заслуживающие уважения и доверия [1], что
позволяет установить равноправные партнерские отношения между государством
и гражданами.

Определения электронного правительства. Существует несколько определений


электронного правительства, получивших широкое распространение. Например,
Организация экономического сотрудничества и развития определяет электронное
правительство как использование ИКТ, в частности интернета, для улучшения
качества государственного управления [1], а Всемирный банк понимает электрон-
ное правительство как использование ИКТ (таких как глобальные сети передачи
данных, интернет, мобильный компьютинг) государственными органами с целью
трансформации отношений между гражданами, бизнесом и различными ветвями
государственной власти [2]. В Европейском Союзе принято близкое определение,
характеризующее электронное правительство как использование ИКТ в органах
власти в сочетании с организационными изменениями и формированием новых
навыков с целью улучшить государственные услуги и демократические процессы
и усилить поддержку государственной политики [3]. Департамент по экономическим
и социальным вопросам Организации Объединенных Наций под электронным пра-
вительством понимает правительство, которое применяет ИКТ для преобразования
внутренних и внешних связей с целью оптимизации процессов исполнения своих
функций [4]. Некоторые используют широкое определение электронного правитель-
ства как любое применение ИКТ в государственном секторе. Наконец, существует
и узкое определение электронного правительства только как способа онлайнового
предоставления государственных услуг. В частности, консорциум W3C понимает под
электронным правительством использование Веб или других ИКТ органами власти
различных (местного, регионального, национального и межнационального) уровней
для организации взаимодействия с гражданами, между структурными подразделениями
и самими органами власти друг с другом [5].
Перевод английского термина Electronic Government (e-Government, eGov-
ernment) как «электронное правительство» иногда приводит к неоправданному
сужению данной проблематики до уровня деятельности государственных органов

12
Модель и стадии развития электронного правительства 

исполнительной власти, так как «правительство» в русском языке традиционно


соответствует исполнительной ветви государственной власти. Тем не менее, в между-
народной практике понятие «электронного правительства» охватывает все уровни
и ветви власти, включая законодательную и судебную. Более того, в своей наиболее
широкой трактовке концепция «электронного правительства» охватывает весь спектр
государственных услуг, оказываемых в общественном секторе, включая образование,
медицинское обслуживание, культуру.

1.2. Модель и стадии развития электронного


правительства

Модель электронного правительства. Для дальнейшего обсуждения используется


следующее представление (рис. 1) об электронном правительстве и связанных с ним
основных процессов и отношений между заинтересованными сторонами [6], [7].
В основе данной модели лежит сформировавшееся представление о государстве
как поставщике услуг для населения и бизнеса. Понятие «услуга электронного
правительства» (или «электронная государственная услуга», «услуга, предоставляемая
на основе ИКТ»), является ключевым в проблематике электронного правительства.
Под государственной услугой далее понимается результат непосредственного или
дистанционного взаимодействия исполнителя (в данном случае — органа власти)
и потребителя, а также выполнения исполнителем административных функций по
удовлетворению потребности потребителя.
Рисунок 1.
Другие Модель
Муниципалитеты
ведомства электронного
правительства

э-Граждане
(информационная
Неправительственные G2N э-Администрация Граждане вовлеченность)
организации (модифицированные
управленческие G2C
процессы)

Потребители
э-Общество Правительство
(внешние
взаимодействия) G2G э-Сервисы
G2B Бизнес (улучшенная
поставка)
Правительство

При предоставлении услуг электронного правительства выделяют три основные


категории взаимодействий: органов власти или их структурных подразделений
друг с другом (Government to Government, G2G), при предоставлении услуг органов

13
власти для бизнес-структур (Government to Business, G2B), при предоставлении
услуг органов власти гражданам (Government to Citizens, G2C). Наряду с этим иногда
рассматриваются взаимодействия в ходе предоставления государственных услуг
для организаций гражданского общества (Government to Non-for-Profit, G2N) или
взаимодействия органов власти с самими государственными служащими (Government
to Employee, G2E).
Подобный сервисно-ориентированный подход предполагает наличие целепо-
лагания, прежде всего, социально-экономического характера, выбор приоритетов
и последовательность действий при проектировании и реализации услуг электронного
правительства.
Весьма важным при оценке воздействия электронного правительства на про-
цессы социально-экономического развития является представление о том, с какой
целью граждане и бизнес-структуры обращаются за государственными услугами
в электронном виде. Международная практика показывает, что основные потребности
потребителей услуг электронного правительства завершаются удовлетворением их
информационных нужд, лишь меньшая часть пользователей переходит к двусторон-
нему и, тем более, транзакционному взаимодействию.

Стадии развития электронного правительства. В последние годы стала обще-


признанной пятиуровневая модель стадий развития электронного правительства,
предложенная Департаментом по экономическим и социальным вопросам Организации
Объединенных Наций [8]. Данная модель предусматривает следующие этапы развития
электронного правительства в соответствии со сложностью видов взаимодействия
и предоставляемых услуг:
I. Начальное присутствие (Emerging Presence).
II. Продвинутое присутствие (Enhanced Presence).
III. Интерактивное присутствие (Interactive Presence).
IV. Транзакционное присутствие (Transactional Presence).
V. Интегрированное присутствие (Seamless / Networked / Connected Presence).
Начальное присутствие представляет собой первую стадию развития электрон-
ного правительства и характеризуется наличием веб-сайта органа власти и базовой
информации на нем, ссылок на другие органы власти, на подразделения самого
правительства и неправительственные организации. По сути дела, эта стадия ха-
рактеризует собой первоначальную открытость информации о деятельности органа
власти.
Продвинутое присутствие представляет собой вторую стадию развитого
информационного присутствия органа власти, характеризуемого наличием на веб-
сайте архивов документов (законов, постановлений и т. п.), текущей информации,
баз данных (статистической и другой информации), новостного раздела, раздела,
посвященного электронному правительству, раздела часто задаваемых вопросов,
наличия поисковых сервисов, сервисов помощи, возможности скачивания файлов
и карты сайта. Это стадия одностороннего взаимодействия, предполагающего потоки
информации от органа власти к гражданам.
Интерактивное присутствие представляет собой третью стадию, которая
характеризуется возможностями скачивать и заполнять формы для различных услуг,

14
Архитектура электронного правительства

числом этих форм, наличием контактной информации и возможностями связаться


с представителями органа власти, использованием аудио и видео файлов для
информирования общественности.
Транзакционное присутствие представляет собой четвертую стадию двухсто-
роннего взаимодействия органа власти с гражданами и бизнесом, характеризуемую
использованием веб-представительства для осуществления всех этапов транзакции,
которые в принципе могут осуществляться через интернет — оплаты налогов и штра-
фов, запроса и получения документов, оплаты услуг с использованием различных
платежных систем и т. п.
Интегрированное присутствие представляет собой пятую стадию, которая
характеризуется действиями органа власти как единого целого, откликающегося
на потребности граждан. Эта наиболее продвинутая стадия развития электронного
правительства характеризуется горизонтальными связями между ведомствами; верти-
кальными связями между федеральными и региональными органами власти; наличием
интегрированной бэк-офисной инфраструктуры, обеспечивающей интероперабель-
ность; взаимодействиями между органами власти и гражданами; партнерскими
отношениями между всеми заинтересованными сторонами (государством, бизнесом,
гражданским обществом и научно-образовательным сообществом). Наконец, эта
стадия характеризуется включенностью и вовлечением граждан в процессы принятия
решений с использованием ИКТ.

1.3. Архитектура электронного правительства


Назначение архитектурного подхода. Как отмечалось выше, электронное
правительство представляет собой комплексную социально-экономическую
и человеко-машинную систему, предназначенную для реализации полномочий
органов государственной власти, функций и государственных услуг для граждан
и хозяйствующих субъектов. Общепринятым в практике развитых стран стал со-
временный, закрепленный в международных стандартах, архитектурный подход,
обращенный к социально-экономическим системам любого размера и сложности,
в которых центральная роль отводится ИКТ. Суть архитектурного подхода заключается
в обобщенном представлении структуры моделируемых систем предметной области
на различных уровнях, а также в формировании и использовании принципов
и руководящих материалов, определяющих управление развитием архитектуры во
времени (см. например [9] – [10]).
Основной целью построения архитектуры электронного правительства является
предоставление возможности для более эффективного обеспечения реализации
полномочий органов государственной власти, функций и государственных услуг
для граждан и бизнеса за счет использования общих подходов к созданию государ-
ственных информационных систем и определения возможностей по совместному
использованию информационных систем и ресурсов, технологической инфраструк-
туры и передового опыта.
Архитектура электронного правительства позволяет представить структуру
сегодняшнего и будущего электронного правительства как целостной системы, с его

15
компонентами и их взаимосвязями, равно как и представить основополагающие
компоненты, детализированные в достаточной мере для управления процессами их
формирования, а также сформировать набор нормативно-справочных, нормативно-
правовых, методических документов и эталонных моделей, определяющих согласо-
ванное и взаимоувязанное развитие государственных информационных систем.
Формирование базовых принципов, рекомендаций и приоритетов в построении
архитектуры электронного правительства во многом зависит от набора социальных,
экономических особенностей и потребностей, так как архитектурный подход пред-
полагает одновременное развитие и увязку сразу нескольких уровней:
•• деятельности (государственных функций и услуг, которые предлагается реа-
лизовать с помощью ИКТ);
•• прикладных систем;
•• технологической платформы.
Не менее важным является рассмотрение отдельных аспектов архитектуры электрон-
ного правительства, которые «пронизывают» архитектурные уровни:
•• аспект информации и данных, определяющий состав информации, необходимой
для поддержания административных процессов и используемой, например,
в процессах межведомственного взаимодействия; какие информационные
объекты (сущности) нужны при моделировании системной архитектуры; на-
конец, какие структуры данных и метаданных должны реализовываться на
уровне технологической архитектуры для их долговременного использования
в прикладных системах;
•• аспект эффективности и результативности, характеризующий набор ключевых
показателей эффективности выполнения государственных функций и предо-
ставления услуг гражданам, бизнесу, другим органам государственной власти на
основе ИКТ, а также показатели эффективности использования самих ИКТ;
•• аспект информационной безопасности и доверия, учитывающий необходимость
адекватной защиты информации и данных от попыток искажения, кражи
и других способов неавторизованного использования и обеспечивающий
доверие пользователей к использованию ИКТ;
•• аспект интеграции и взаимодействия, обеспечивающий электронное взаимо-
действие между различными информационными системами и учитывающий
организационную, семантическую и технологическую совместимость.
Наряду с перечисленными аспектами иногда рассматриваются и другие, отражающие
тот или иной конкретный взгляд на архитектуру электронного правительства.

Развитие архитектуры электронного правительства. Как отмечалось, архитектурный


подход предполагает обобщенное представление о структуре существующего и бу-
дущего электронного правительства как системы, включая комплекс архитектурных
моделей и требований к структуре в целом и к отдельным его компонентам (иногда это
называют «архитектурой типа 1»). Не менее существенно в архитектурном подходе
наличие порядка и методики развития архитектуры электронного правительства во
времени, определяющих дальнейшую детализацию и актуализацию обобщенной
архитектуры, дополнение конкретными архитектурными шаблонами, описаниями
типовых элементов, репозиториями типовых элементов и примерами их применения.

16
Архитектура электронного правительства

Наконец, третьей составляющей архитектуры электронного правительства является


набор нормативно-справочных, нормативно-правовых и методических документов,
классификаторов и эталонных моделей, определяющих согласованное и взаимоу-
вязанное развитие государственных информационных систем (иногда это называют
«архитектурой типа 2»).
При построении электронного правительства необходимо не только выделение
различных архитектурных уровней или аспектов, но и понимание связей между
Аспект Рисунок 2
Архитектурные информации Представление
аспекты и данных
об архитектуре
электронного
правительства
Уровень
деятельности
Архитектурные
уровни Уровень
прикладных систем
Уровень
технологической
платформы

ними. В частности, государственные услуги, функции, административные процессы


и регламенты, являющиеся частью соответствующего архитектурного уровня, за-
дают требования к другим уровням или аспектам, таким как информация и данные,
прикладные системы, безопасность, которые, в свою очередь, определяют выбор
конкретных технологий или платформ (см. рис. 2).
Развитие архитектуры электронного правительства сочетает в себе два параллельных
процесса:
•• представление существующего и будущего состояния архитектуры электронного
правительства, которое предполагает выработку эталонных моделей различных
уровней и аспектов архитектуры (например, формирование портфеля при-
кладных систем, требующихся для реализации функций органов государственной
власти на региональном уровне или уровне отдельных ведомств, разработка
стандартов, и т. д.);
•• разработка и уточнение общей методологии представления единой архитектуры
электронного правительства (например, создание эталонных моделей государ-
ственных функций, моделей прикладных систем, моделей эффективности).
Архитектурный подход также поддерживает многократное использование типо-
вых компонентов (технологических решений, рекомендаций по стандартизации
и информационному взаимодействию и т. д.), что особенно применимо в проектах
электронного правительства, отличающихся большой сложностью и распределенным
характером.
Особое значение для применения архитектурного подхода при построении
электронного правительства играют международные и национальные стандарты,
такие как «Системы промышленной автоматизации. Концепции и правила для моделей
промышленных предприятий» [11] и «Системы промышленной автоматизации.
Требования к архитектуре эталонных предприятий и методологии» [12], которые
должны действовать наряду с нормативными правовыми актами, определяющими

17
регламенты и процедуры предоставления услуг и осуществления функций органов
власти или органов местного самоуправления. В рамках проектов по региональной
информатизации, выполненных Институтом развития информационного общества
начиная с 2001 по программам электронного развития Москвы, Мордовии, Татарстана
и других регионов, широко применяется архитектурный подход, который нашел свое
отражение в Типовой программы развития и использования ИКТ в субъекте РФ [13],
разработанной в составе программных мероприятий ФЦП «Электронная Россия».

1.4. Опыт создания электронного правительства


Международная практика. В настоящее время движение в сторону электронного
правительства является общемировой практикой, и, начиная с 90‑х годов прошлого
столетия, в подавляющем большинстве стран мира выполняются разные по масштабу
и содержанию проекты в этой области. Они весьма разнообразны, направлены на
достижение различных социальных и технических задач и достаточно трудно под-
даются классификации. Тем не менее, можно отметить, что построение электронного
правительства в отдельной стране тесно связано с государственным политико-
экономическим устройством и общественным менталитетом. Это позволяет выделить
несколько основных моделей развития электронного правительства, получивших
практическое воплощение в Северной Америке (США, Канада), Европе (страны
Западной, Центральной и Восточной Европы), Азиатско-тихоокеанском регионе
(Южная Корея, Сингапур) и других регионах и странах (см. обзоры [14] – [18] и сайт
«Электронный опыт Европы» [19]).
Практика внедрения и использования онлайновых сервисов в странах Европы
и Северной Америки показывает, что одним из действенных способов проведения
организационных изменений в государственном управлении должно стать углубление
партнерства государства с бизнесом и аутсорсинг ряда государственных услуг путем
передачи прав на их предоставление специализированным частным компаниям.
Например, в Финляндии обслуживание передачи данных от населения и бизнеса до
органов власти было передано специальным операторам, которые гарантировали
удешевление работ, связанных с обеспечением безопасности приема и передачи
данных, их хранения. В Германии частным компаниям были переданы на обслужи-
вание некоторые виды транзакционных взаимодействий, например, обслуживание
платежей за услуги.
Значительную роль в построении электронного правительства играет организация
взаимодействия и определение обязанностей и ответственности отдельных органов
государственной власти наряду с созданием централизованных систем, например
обеспечивающих хранение и обработку данных, необходимых для большинства
ведомств. Подходы к такой организации дел, как показывает опыт, могут сильно
различаться. Например, во Франции и в Сингапуре центральная государственная
организация приняла на себя функции, которые исполнялись несколькими раз-
личными организациями, тогда как в Дании был централизован только бэк-офис
электронного правительства, а соответствующие сервисы остались закрепленными за
различными ведомствами. В Словении централизована регистрационная деятельность,

18
Опыт создания электронного правительства

так что услуга регистрации предоставляется клиентам через единую точку доступа,
а в Нидерландах процесс предоставления льгот и субсидий домашним хозяйствам
реорганизован таким образом, что за предоставление данного сервиса полностью
ответственно одно министерство. При этом все промежуточные государственные
структуры, занимавшиеся составлением заявок и форм, были упразднены.
Внедрение сервисно-ориентированного подхода к построению электронного
правительства приводит к закономерному уменьшению количества точек доступа
к государственным услугам, в идеале до одной — единого портала государственных
услуг для граждан, бизнеса, некоммерческих организаций, иностранцев и других
категорий пользователей. Наряду с этим не должны быть забыты и альтернативные
возможности (каналы) предоставления государственных услуг на основе ИКТ — тра-
диционная фиксированная и мобильная связь, цифровое телевидение и т. д.
В зависимости от сложившихся условий, страны использовали различные
стратегии построения технологических платформ электронного правительства. В не-
которых странах, например, в Эстонии и Германии (Бремен) реализация электронного
правительства началась с «чистого листа», поэтому проектировались изначально
технологически совершенные и интегрированные системы электронного правитель-
ства. В некоторых региональных правительствах (землях) Германии избрали путь
одновременного построения систем обеспечения доступа к услугам, разработки новых
приложений и развития информационной инфраструктуры, а необходимые доработки
унаследованных систем проводили исходя из практики их эксплуатации. Отдельные
страны предпочли пошаговую стратегию использования имеющихся технологических
и программных средств и их постепенную интеграцию в современную платформу
электронного правительства.
Важно отметить, что во всех проектах электронного правительства особое
внимание уделяется открытым стандартам, обеспечивающим как независимость
самой платформы электронного правительства, так и входящих в нее компонентов
и систем. Опыт многих стран показывает, что внедрение электронного правитель-
ства также сопровождается принятием отдельных законодательных актов или
на основе целенаправленной политики, осуществляемой правительством (но и в
этом случае в законодательство вносятся необходимые изменения). Вместе с тем,
законодательное обеспечение во многих случаях отстает от темпов развития ИКТ
и внедрения электронного правительства. Поэтому соответствующие технические
стандарты часто принимаются самими органами исполнительной власти, не дожидаясь
законодательных актов.

Российский опыт. Работы по использованию ИКТ в социально-экономической сфере


и органах государственной власти активно велись в Советском Союзе практически
в то же время и с тем же размахом, что и в других развитых странах. Хорошо из-
вестны разрабатывавшиеся в 60–70 годы прошлого века проекты, а в некоторых
случаях — успешные реализации информационных систем национального или
отраслевого масштаба, таких как Общегосударственная автоматизированная система
(ОГАС), Единая государственная сеть вычислительных центров (ЕГСВЦ, позднее ГСВЦ),
Единая автоматизированная сеть связи (ЕАСС), отраслевые автоматизированные
системы управления (ОАСУ).

19
Почти двадцатилетняя история информатизации в России, начавшаяся после
распада СССР, также была связана сначала с разрозненными, а затем все более
целенаправленными действиями по распространению и использованию ИКТ в раз-
личных сферах, включая государственное управление. Начиная с конца 80‑х годов
прошлого века, предпринимались неоднократные попытки сформировать государ-
ственную политику в условиях развития информационного общества [20], успешно
завершившиеся в феврале 2008 года утверждением Президентом России Стратегии
развития информационного общества в Российской Федерации [21].
Целенаправленная деятельность по построению электронного правительства
в России в современном понимании может быть связана с запуском федеральной
целевой программы «Электронная Россия» в 2002 году [22].
В ней впервые на федеральном уровне была предпринята попытка комплексного
подхода к использованию ИКТ для социально-экономического развития и запуска
национальной программы электронного развития. Несмотря на свой во многом
компромиссный характер и очевидные недостатки, ФЦП «Электронная Россия»
содержала ряд полезных новаций и программных мероприятий, ряд из которых
был направлен на развитие электронного правительства в России, ориентацию
на предоставление государственных услуг населению и бизнесу, преодоление
информационного неравенства. Особое место в программе отводилось организации
эффективного межведомственного взаимодействия и взаимодействия власти с на-
селением и бизнесом на основе ИКТ путем внедрения стандартов, создания среды
электронного взаимодействия и формирования соответствующей нормативной
правовой базы. За первые пять лет выполнения программы были апробированы
отдельные подходы и решения в области организации межведомственного информа-
ционного обмена, предоставления отдельных государственных услуг в электронном
виде, обеспечивающих начальную и продвинутую стадии присутствия федеральных
органов государственной власти, частично подготовлены необходимые методические
и нормативные правовые документы.
В то же время, программа «Электронная Россия», по сути дела, представляла
собой скорее программное заявление и механизм распределения бюджетных средств
между государственными заказчиками, чем четко структурированный план действий
по последовательному и целенаправленному внедрению ИКТ в государственном
управлении. Самым слабо проработанным местом в программе оказался механизм
управления и координации деятельности многочисленных государственных за-
казчиков, что, в конце концов, сказалось на ее существенном недофинансировании
(по сравнению с планируемыми объемами), дублировании, отмене или приостановке
ряда программных мероприятий. Это привело к радикальному пересмотру ФЦП
«Электронная Россия» и принятию в 2006 году новой редакции программы [23],
которая из программы электронного развития России превратилась в программу
формирования электронного правительства на уровне федеральных органов ис-
полнительной власти, хотя сам термин «электронное правительство» в тексте
программы и отсутствует.
Основными целями «Электронной России 2.0» стали организация межведом-
ственного информационного взаимодействия, доступа граждан к информации для
реализации своих конституционных прав, обеспечение защиты и безопасности данных,

20
Стандарты XML в разработках электронного правительства

используемых для целей государственного управления, повышение оперативности


предоставления государственных услуг, внедрение единых стандартов обслуживания
населения при предоставлении государственных услуг по принципу «одного окна»,
придание официального статуса электронным формам взаимодействия.
Ключевым политическим документом, определяющим создание электронного
правительства в России как один из приоритетов, является уже упоминавшаяся
Стратегия развития информационного общества в России [20]. Правительством
Российской Федерации вслед за Стратегией была одобрена Концепция формирования
в Российской Федерации электронного правительства до 2010 года [24], где основной
акцент также сделан на предоставление государственных услуг в электронном виде
и принятие необходимой для этого нормативной правовой и нормативно-технической
базы (включая стандарты).
Особенностью развития электронного правительства в Российской Федерации,
является высокая активность регионов в этом процессе, зачастую опережающих
действия органов власти на федеральном уровне. Многие субъекты Российской
Федерации одновременно с ФЦП «Электронная Россия» или даже раньше приняли свои
концептуальные или программные документы и начали их реализацию (см. например
[25] – [26]). Состояние развития и использования ИКТ в российских регионах, в том
числе электронного правительства регионов, стало предметом детального анализа,
проводимого в последние годы Институтом развития информационного общества
в рамках ФЦП «Электронная Россия» (см. [27] – [29]).

1.5. Стандарты XML в разработках электронного


правительства

Среда электронного взаимодействия. Развитие электронного правительства пред-


полагает создание прикладных информационных систем, которые используются для
предоставления государственных услуг или реализации административных функций
в электронном виде. Многие жизненные ситуации, с которыми сталкиваются граждане
или организации, носят сугубо межведомственный характер и для предоставления
подобных услуг органы власти должны взаимодействовать друг с другом. Это означает,
что многочисленные приложения электронного правительства, разрабатываемые,
как правило, различными органами власти на основе разнообразных технологий
и в разное время, должны образовывать целостную систему (с эффективными, и,
как часто говорят, «бесшовно» взаимодействующими компонентами), нацеленную
на удовлетворение потребностей граждан, бизнеса да и самих органов власти. Для
обеспечения подобного взаимодействия и совместного использования подобных
приложений в течение всего их жизненного цикла, нет иного пути, как соблюдать
согласованные требования интероперабельности.
Под интероперабельностью понимается возможность информационных
систем, которые поддерживают управленческие процессы, обмениваться данными
и быть готовыми к обмену информацией и знаниями. Полноценной проверкой на
интероперабельность может служить наличие возможности согласованного обмена

21
информацией и сервисами между системами, при этом любая система или ее отдель-
ные компоненты с интерфейсом требуемой (или аналогичной) спецификации должны
допускать замену без ущерба для процессов взаимодействия. Обеспечение интеропе-
рабельности имеет несколько основных аспектов: организационный, семантический
и технологический. Организационный аспект интероперабельности подразумевает
выработку соглашений для формулирования задач, решаемых в предметной области,
и моделирования происходящих процессов, включая информационное взаимодей-
ствие между организациями с различными внутренними структурами и процессами.
Обеспечение интероперабельности в организационном плане также направлено на
гарантии доступности, простоты, удобства и ориентированности на пользователей
предоставляемых услуг. Семантическая интероперабельность означает возможность
понимания содержания информации, участвующей в процессах взаимодействия,
любым другим приложением, которое изначально не разрабатывалось для подобных
целей. Семантическая интероперабельность предоставляет возможность системам
комбинировать получаемую информацию из различных источников и содержательно
ее обрабатывать. Технологический аспект интероперабельности включает ключевые
вопросы обеспечения взаимодействия информационных и телекоммуникационных
систем, такие как открытые интерфейсы, взаимоувязанные сервисы (interconnected
services), интеграция данных и программное обеспечение промежуточного слоя,
представление и обмен данными, доступ и информационная безопасность, и многое
другое.
В последние годы одним из основных моментов развития электронных прави-
тельств в ряде стран стала разработка согласованных на национальном или регио-
нальном (или даже наднациональном) уровнях требований интероперабельности,
предъявляемых к создаваемым государственным информационным системам (см.
примеры в [30] – [36]). Как правило, эти требования организуют так называемую
среду электронного взаимодействия органов государственной власти (e-Government
Interoperability Framework, e-GIF), под которой понимается набор стандартов,
руководств и методик, которые описывают способы взаимодействия, о которых
договорились (или должны договориться) организации, взаимодействующие друг
с другом. Целью создания среды электронного взаимодействия (СЭВ) является
задание процедур и правил, способствующих рациональному и эффективному
взаимодействию государственных информационных систем не только между собой,
но и с внешними системами, принадлежащими гражданам или бизнесу.
Политика формирования СЭВ состоит в тщательном отборе минимально не-
обходимого набора стандартов, которые являются открытыми и подробно доку-
ментированными, широко представлены на рынке, обеспечивают интероперабель-
ность и масштабируемость создаваемых приложений. Как правило, при выборе
приоритет отдается подходящим международным, затем — национальным, и лишь
при их отсутствии — отраслевым или коммерческим стандартам. Среда электронного
взаимодействия не является раз и навсегда зафиксированным набором документов
и должна адаптироваться во времени по мере изменения технологий, стандартов или
административных процессов. При этом разработчики СЭВ обязуются и стремятся
сохранить преемственность используемых стандартов, сохраняя при этом здоровый
консерватизм по поводу постоянно возникающих новых стандартов и технологий.

22
Стандарты XML в разработках электронного правительства

Роль стандартов XML. Одним из основных механизмов обеспечения интероперабель-


ности систем электронного правительства является использование при их реализации
открытых стандартах де-факто. Как правило, для этих систем необходимо принять
или выработать общие спецификации, обеспечивающие взаимосвязанность систем,
интеграцию данных, работу с метаданными и доступ к электронным сервисам. Все
это в полной мере обеспечивает широко распространенный сегодня комплекс
взаимосвязанных стандартов платформы XML, особое место которого обусловлено
двумя причинами.
Первая причина заключается в том, что интернет и Всемирная паутина сегодня
образуют ключевую инфраструктуру современного информационного общества,
а органы власти стали использовать интернет в качестве одного из основных
каналов для взаимодействия с гражданами и бизнесом. Многие информационные
системы электронных правительств функционируют в среде Веб и, следовательно,
не могут не учитывать и не использовать ИКТ, создаваемые для нового поколения
этой среды. Всемирная паутина обеспечивает комфортный доступ к информации
о деятельности органов власти и сервисам электронного правительства всем ка-
тегориям пользователей в любом месте, где имеется доступ к интернету. При этом
нет необходимости специально обучать пользователей — они могут обходиться
традиционными средствами доступа к Веб, не требуются существенные инвестиции
в создание специальной инфраструктуры доступа. Веб-технологии могут также ис-
пользоваться системным персоналом и государственными служащими для пополнения
и актуализации информации в системах электронного правительства.
Другая причина — это возможность использования при разработке инфор-
мационных систем электронных правительств новых чрезвычайно развитых функ-
циональных возможностей технологий, основанных на стандартах платформы XML.
Такие технологии воплощены в настоящее время во многих программных продуктах,
прежде всего в продуктах крупнейших поставщиков программного обеспечения. Среди
них можно назвать технологии XML-ориентированных баз данных, веб-сервисные
технологии, позволяющие реализовать новые архитектурные подходы в разработках
крупных распределенных систем, технологии семантического Веб, позволяющие
оперировать информацией с учетом ее семантики, технологии, которые позволяют
поддерживать целостность и безопасность информации, и многое другое.
Большая часть данной книги посвящена описанию основных стандартов
платформы XML и их всевозможным приложениям, что предоставит читателю
возможность вместе с авторами многократно убедиться в их значимости для по-
строения современных информационных систем, в том числе — для электронного
правительства.

23
Литература
1. The E-Government Imperative. – Paris: OECD, 2003. – 199 pp.
2. The World Bank. Definition of E-Government.
http://go.worldbank.org / M1JHE0Z280
3. The role of Government for Europe’s future. – COM (2003) 567
final of 26 September 2003. – Brussels: CEC, 2003.
4. UN Department of Economic and Social Affairs, Division for Public
Administration and Development Management. Electronic & Knowledge
Governments: Definitions //
http://unpan1.un.org / intradoc / groups / public 
/ documents / un / unpan008633.pdf
5. eGovernment at W3C: improving access to government through
better use of the Web. http://www.w3.org / 2007 / eGov / 
6. S. Ntiro. eGovernment in Eastern Africa. – Dar-es-Salaam, KPMG, 2000.
7. R. B. Heeks. e-Government in Africa: promise and practice
// Information Policy, 2002, 7 (2-3), 97–114.
8. Benchmarking E-government: A Global Perspective. – New
York: United Nations, 2002. vi + 74 pp.
9. Данилин А.В., Слюсаренко А.И. Архитектура и стратегия. «Инь»
и «Янь» информационных технологий предприятия. – М.: Интернет-
университет информационных технологий, 2005. – 504 с.
10. Зиндер Е.З. Архитектурный подход на пространстве от по-
литики и стратегии до тактики // В кн. Управленческий
консультант 2005. – Киев: Издательство БУК, 2005. С. 44–71.
11. Системы промышленной автоматизации. Концепции и правила
для моделей промышленных предприятий. ISO 14258:1998
12. Системы промышленной автоматизации. Требования к архитектуре
эталонных предприятий и методологии. ISO 15704:2000
13. Типовая программа развития и использования информационных
и телекоммуникационных технологий субъекта Российской
Федерации (утверждена распоряжением Правительства
Российской Федерации от 3 июля 2007 г. № 871‑р)
14. UN Global E-government Survey 2003. – New York:
United Nations, 2003. – i + 112 pp.
15. UN Global E-government Readiness Report 2004: Towards Access for
Opportunity. – New York: United Nations, 2004. – xii + 166 pp.

24
Литература

16. UN Global E-government Readiness Report 2005: From E-government


to E-inclusion. – New York: United Nations, 2005. – xii + 253 pp.
17. UN Global E-government Readiness Report 2008: From e-Government to
Connected Governance. – New York: United Nations, 2008. – viii+ 226 pp.
18. Грашина М.Н., Гузик С.В., Дрожжинов В.И., Зиндер Е.З., Когаловский
М.Р, Штрик А.А. Международный опыт создания систем для
электронных правительств. Концепция наполнения комплексного
методического материала Фонда ФОСТАС // В кн. Сборник трудов IV
Всероссийской практической конференции «Стандарты в проектах
современных информационных систем». – М.: ФОСТАС, 2003.
19. www.ePractice.eu http://www.epractice.eu
20. Черешкин Д.С., Смолян Г.Л. Нелегкая судьба российской
информатизации // Информационное общество. 2008, № 1.
21. Стратегия развития информационного общества в Российской
Федерации // Российская газета. 16 февраля 2008 г.
22. Федеральная целевая программа «Электронная Россия
(2002–2010 годы)» (утверждена постановлением Правительства
Российской Федерации от 28 января 2002 г. № 65)
23. Федеральная целевая программа «Электронная Россия
(2002–2010 годы)» (изменения, утвержденные постановлением
Правительства Российской Федерации от 15 августа 2006 г. № 502)
24. Концепция формирования в Российской Федерации
электронного правительства до 2010 года (одобрена
распоряжением Правительства РФ от 6 мая 2008 г. N 632‑р)
25. Концепция движения Москвы к информационному обществу
(утверждена распоряжением Мэра Москвы 20 июля 2001 г. № 715‑РМ) //
В кн. Концепция движения Москвы к информационному обществу. – М.:
Институт развития информационного общества, 2001. – 128 с.
26. О Городской целевой программе «Электронная Москва» (утверждена
Законом города Москвы от 9 июля 2003 года № 47) // В кн. Электронная
Москва. – М.: Институт развития информационного общества, 2003. – 128 с.
27. Индекс готовности регионов России к информационному обществу.
2004–2005 / Под ред. Т.В. Ершовой, Ю.Е. Хохлова и
С.Б. Шапошника. 2‑е издание исправленное и дополненное. – М.:
Институт развития информационного общества, 2005. – 224 с.
28. Индекс готовности регионов России к информационному обществу.
2005–2006  – М.: Институт развития
информационного общества, 2007. – 244 с.

25
29. Анализ развития и использования информационно-коммуникационных
технологий в регионах России: Аналитический доклад. – 
М.: Институт развития информационного общества, 2008. – 240 с.
30. European Interoperability Framework for Pan-European
e-Government Services. – Luxembourg: Office for Official
Publications of the European Communities, 2004. – 26 pp.
31. Federal Enterprise Architecture. USA Government. http://www.egov.gov
32. e-Government Interoperability Framework.
Version 6.1. – London: UK Crown Copyright, 2005. – 32 pp.
33. e-Government Interoperability Framework: Technical Standards
Catalogue. Version 6.2. – London: UK Crown Copyright, 2005. – 58 pp.
34. SAGA: Standards and Architectures for eGovernment Applications.
Version 3.0. – Berlin: Federal Ministry of the Interior, 2006. – 185 pp.
35. The Interoperability Framework. Danish Government.
http://www.oio.dk / standarder / 
36. The HKSARG Interoperability Framework.
Version 5.0.  –  Hong Kong: The Government of the Hong Kong
Special Administrative Region, December 2006. – 42 pp.

26
2. Общая характеристика
комплекса стандартов XML

В этом разделе кратко рассматриваются предпосылки создания комплекса стандартов


XML, составляющего новую технологическую платформу Всемирной паутины, обсуж-
даются особенности ее организации и функциональные возможности, важнейшие
перспективы развития.

2.1. Введение
Прошло немногим менее полутора десятилетий со времени создания системы, на-
зываемой Всемирной паутиной (или более кратко Веб). За сравнительно короткий
период своего существования эта глобальная распределенная гипермедийная
информационная система впитала в себя гигантские объемы информации, обрела
многие сотни миллионов пользователей на всех континентах и продолжает интенсивно
расти. Веб стал одним из важнейших элементов информационной инфраструктуры
информационного общества. Веб-технологии активно вторгаются в другие сферы
информационно-коммуникационных технологий.
Такая популярность Веб обеспечивается многими его достоинствами. Это — от-
крытый характер системы, демократичная ее организация, привычная архитектура
«клиент — сервер», возможность свободного «безлимитного» доступа к большин-
ству ресурсов системы, наличие различных средств свободно распространяемого
клиентского и серверного программного обеспечения, прозрачность глобального
распределения информационного наполнения Веб для пользователя, независимость
используемых технологий от аппаратно-программных платформ, простота языка
разметки HTML, легкость подготовки и публикации документов, простая техника
идентификации информации, низкий уровнем требований к квалификации пользо-
вателя и к конфигурации его технических средств, простой клиентский интерфейс

27
с возможностью доступа к информации с помощью естественной навигации по ее
структуре и т. д.
Немаловажным фактором, определяющим чрезвычайно высокую социально-
экономическую значимость Веб, служит также использование интернета в качестве
ареала его «обитания», обеспечивающее теледоступ пользователей к распределенным
информационным и вычислительным ресурсам, благоприятные возможности для их
интеграции. Благодаря этому Веб представляет собой не только гигантскую информа-
ционную систему, но и эффективную платформу для разработки и функционирования
многочисленных новых приложений и технологий — систем электронного прави-
тельства, электронного бизнеса, виртуальных предприятий, крупных корпоративных
информационных систем, электронных библиотек.
Однако уже в первые годы триумфального роста Веб проявился ряд ограни-
чений, свойственных используемым в нем технологиям, которые стали сдерживать
дальнейшее его развитие. В связи с этим уже во второй половине 1990‑х годов
начали осуществляться радикальные перемены в веб-технологиях. Новые под-
ходы были направлены, прежде всего, на преодоление выявившихся ограничений
и создание новой технологической платформы, способной обеспечить потенциал
для успешного развития Веб на длительную перспективу и создание Веб новых
поколений, разработку технологий семантического Веб [22, 24]. Основополагающую
роль в технологическом переоснащении Веб стал играть новый язык разметки XML,
разработанный консорциумом W3C [35], ответственным за техническую политику
развития Веб.
Новую технологическую платформу Веб, которую мы называем платформой
XML, составляет обширный комплекс взаимосвязанных и совместимых стандартов
консорциума W3C, основой которого является язык XML. Ряд из этих стандартов
быстро приобрел статус стандартов де-факто. Сфера их применения вышла за рамки
непосредственных потребностей Веб. Они оказывают существенное влияние на
стандартизацию в других областях применения ИКТ, как в горизонтальной, так и в
вертикальной сферах, стали основой новых подходов в технологиях баз данных,
хранилищ данных, в CASE-технологиях, в области интеграции данных, в электронных
библиотеках, электронном бизнесе. Им отводится важное место в технологиях
электронного правительства. Активно развиваются тенденции интеграции технологий
XML с другими пластами информационно-коммуникационных технологий.
Далее в этом разделе обсуждаются предпосылки рождения технологий XML и их
истоки, рассматриваются принципы организации и функциональные возможности
платформы XML, особенности XML-данных и их моделирования в стандартах W3C,
а также важнейшие перспективы развития платформы.
Более подробное обсуждение рассматриваемых вопросов, связанных с новой
технологической платформой Веб, можно найти в наших работах [4–15].

2.2. Предпосылки создания технологий XML


Создание Веб безусловно является одним из крупнейших научно-технических
достижений последнего десятилетия XX века. Благодаря реализации этого проекта

28
Истоки XML-технологий

возникло множество новых ИКТ, имеющих весьма значимые социально-экономические


последствия. В короткие сроки Веб стал беспрецедентно интенсивно развивающейся
глобальной открытой бесконечно масштабируемой распределенной гипермедийной
системой. Количество пользователей и объем представленной в ней информации
продолжают чрезвычайно быстро расти.
Вместе с тем, всего лишь за несколько начальных лет интенсивного развития
потенциал качественного совершенствования веб-технологий оказался в значи-
тельной мере исчерпанным.
Сдерживающее влияние на дальнейшую эволюцию веб-технологий и на рас-
ширение сфер их применения стали оказывать, прежде всего, слабые стороны языка
HTML — основного выразительного и структурообразующего средства представленной
в Веб гипермедийной информации, а также ограниченные функциональные возмож-
ности среды поддержки этого языка в Веб. Язык HTML обладает весьма скромными
средствами представления метаданных, описывающих содержание информационного
наполнения Веб. Следствием этого является отсутствие возможности верификации
логической целостности данных, содержащихся в HTML-страницах, высокий уровень
информационного шума в результатах обработки пользовательских запросов по-
исковыми машинами Веб. Ряд проблем связан с идентификацией веб-страниц
и составляющих их данных по местоположению содержащих их файлов в интернете.
Протокол доступа HTTP не обеспечивает удаленного вызова процедур, что значительно
ограничивает возможности разработки веб-приложений.
Огромный объем накопленной в среде Веб информации требует для ее эффек-
тивного использования новых подходов, позволяющих возложить на вычислительную
технику значительно большую, чем в действующем Веб, нагрузку по анализу, обработке,
поиску и интерпретации содержания. При этом чрезвычайно важно обеспечить
преемственность в новой технологической среде для действующих технологий Веб,
что позволит сохранить возможность использования накопленной информации.
Разработка радикально новых подходов, которые обеспечат дальнейшее
развитие Веб, и конструктивное воплощение их в виде комплекса взаимосвязанных
стандартов стали важнейшей стратегической задачей консорциума W3C, ответствен-
ного за техническую политику развития Всемирной паутины. Создание расширяемого
языка разметки XML и основанного на этом языке комплекса других стандартов,
составляющих технологическую платформу Веб новых поколений, являются важным
результатом деятельности консорциума. Работы по формированию и развитию новой
технологической платформы XML, интенсивно продолжаются.

2.3. Истоки XML-технологий


XML-технологии начали создаваться не «с чистого листа». В них обеспечивается преем-
ственность с Веб первого поколения. Использованы некоторые его ключевые подходы,
например, организация информации в форме гипертекста, навигационный доступ
к информации, взаимодействие пользователей со средствами управления инфор-
мационным наполнением Веб на основе архитектурного принципа «клиент-сервер».
Наряду с новыми возможностями сохранена также идентификация информации по

29
месту ее хранения в интернете. С точки зрения семиуровневой эталонной модели
взаимосвязи открытых систем (OSI), новые средства Веб по-прежнему относятся
к прикладному уровню.
Однако для обеспечения новых возможностей потребовались и другие решения.
Ряд из них заимствован или, по крайней мере, уже использовался ранее в технологиях
баз данных. В спецификациях стандартов XML существенное место занимают такие
понятия, рожденные в области баз данных, как модель данных, схема, язык запросов,
самоописываемость данных. Концепция схемы базы данных, отчужденной от самих
данных, была введена еще CODASYL (1969). Принцип самоописываемости баз данных
был впервые использован в реляционной СУБД проекта MacAims (1970), а впоследствии
узаконен в стандартах языка SQL. Интересно заметить, что основная структурная
единица XML-данных, называемая XML-документом, имеет иерархическую структуру
и включает в качестве элементов повторяющиеся группы с фиксированным или пере-
менным числом экземпляров. В точности такую структуру имеет запись базы данных
в модели данных CODASYL.
Создатели XML остались на позициях подхода к представлению информационного
наполнения Веб в форме гипертекста, идеи которого возникли еще в конце 40‑х
годов и начали практически использоваться в 60‑е годы. При этом для определения
гипертекстовой структуры стали использовать языки разметки, одним из ранних пред-
ставителей которых является разработанный американским математиком Д. Кнутом
в 70‑е годы язык TeX. Авторы новой технологической платформы вновь обратились
к истокам — к языку разметки SGML, уже использовавшемуся ранее в качестве основы
разработки языка HTML. Однако они пошли иным путем — путем создания метаязыка,
позволяющего пользователю самому определять нужные наборы тегов разметки, а не
определяя в соответствии с правилами SGML некоторый конкретный набор тегов, как
это было сделано при создании языка HTML. Именно метауровень языка XML дал
основание его разработчикам назвать язык расширяемым.
Радикально новой целью создания платформы XML является обеспечение стан-
дарта представления метаданных, описывающих информационное наполнение Веб.
Принятый многоуровневый подход позволяет определять содержание информации
на нескольких уровнях — от структурных свойств типов с разной степенью глубины
(XML DTD, XML Schema и Relax NG) до семантических их свойств (RDF) в терминах
определенных с различной степенью формализованности понятий предметной области
и их взаимосвязей (RDFS, OWL).
Здесь уместно заметить, что поддержка метаданных средствами платформы
XML — отнюдь не новое слово в информационных системах. Еще во второй половине
60‑х годов, как уже отмечалось выше, предложенный CODASYL принцип поддержки
отчужденной от базы данных схемы базы данных как самостоятельного ресурса стал
неотъемлемым принципом управления данными в базах данных. Этот принцип получил
развитие в концепции словаря / справочника данных, предложенной в 70‑х годах.
Метаданные, описывающие содержание информации, изначально поддерживались также
в информационно-поисковых системах, начиная с ранних дескрипторных систем.
Другие направления научных исследований и ИКТ, которые косвенным образом
или непосредственно оказали влияние на развитие рассматриваемых функций
Веб — это концептуальное моделирование предметной области, языки представления

30
Организация и функциональные возможности платформы XML 

знаний в области искусственного интеллекта; семантические модели данных в техно-


логиях баз данных, системы баз знаний, средства описания и поддержки онтологий,
в особенности проекты Ontolingua (Стенфордский университет), DAML (Мэрилендский
университет), OIL (проект, выполнявшийся в рамках 6‑й рамочной программы
Европейского союза по технологиям информационного общества) и др.
Таким образом, главная задача разработчиков новой технологической платформы
Веб состояла в формировании сбалансированного, эффективного и функционально
развитого инструментария на основе использования и развития идей многих ис-
пытанных временем подходов и технологий.

2.4. Организация и функциональные возможности


платформы XML

В отличие от действующей версии Веб, в которой все основные функции представления


информационного наполнения системы базируются на едином языке HTML, платформа
XML строится на иных принципах. Разработаны «фундаментальные» стандарты (XML, XML
Information Set, Namespaces in XML), составляющие концептуальную и синтаксическую
основу платформы.
Главным из них является стандарт XML, обеспечивающий представление основных
структурных единиц информационного наполнения нового Веб — XML-документов.
Стандарт Namespaces in XML определяет для заданного XML-документа или множества
документов допустимые теги разметки и их атрибуты, ассоциируя с ними по умолчанию
некоторую семантику. Зарезервированные консорциумом W3C пространства имен
используются в синтаксисе языка XML и других языковых стандартах платформы.
Namespaces in XML предоставляет, таким образом, механизм расширения функциональ-
ности платформы. Стандарт XML Information Set определяет набор абстрактных ин-
формационных элементов (Information Item), используемых в качестве «строительных
блоков» для создания правильно построенных XML-документов.
Средствами указанных фундаментальных стандартов определяется модульный
комплекс многочисленных других стандартов, определяющих языковые средства,
которые обогащают функциональность языка XML дополнительными возможностя-
ми. Все эти языки используют единый синтаксис — синтаксис языка XML. Именно
такая модульность организации платформы XML обеспечивает ее открытый характер
и возможность ее расширения путем введения новых стандартов, не затрагивая уже
существующих. Полная функциональность платформы XML определяется в настоящее
время многими десятками взаимосвязанных стандартов, спецификации которых
состоят более чем из 350 документов. Каждый из них по отдельности проходит
процедуру стандартизации, установленную в W3C. Часть из указанных стандартов
уже принята W3C и называется рекомендациями консорциума, другие имеют статус
проектов, находящихся на различных стадиях процедуры стандартизации. Стандарты
консорциума W3C могут использоваться на любой аппаратной платформе в любой
операционной среде.

31


Нужно отметить, что совместно со стандартами платформы XML могут ис-


пользоваться и некоторые другие стандарты, которые формально к этому комплексу
стандартов не относятся. Мы будем далее называть их совокупность окружением
платформы XML. Некоторые из таких стандартов разработаны консорциумом W3C,
но не используют синтаксис языка XML. Другие стандарты окружения основаны на
синтаксисе XML, но разработаны не W3C, а различными другими организациями, и тем
самым не имеют статуса стандартов консорциума W3C. Ряд стандартов окружения
платформы XML получил достаточно широкое признание и применяется на практике.
Стандарты окружения платформы XML используются не только в разнообразных
приложениях XML, но и в самих спецификациях стандартов платформы. Например,
стандарт XPath, не использующий синтаксис языка XML, применяется в спецификациях
стандартов XPointer, XSLT, XQuery.
Функциональные возможности платформы XML и ее окружения можно в агре-
гированном виде охарактеризовать с помощью приведенной ниже функциональной
классификации основных составляющих ее стандартов. В ней представлены не
только уже принятые ключевые стандарты, но и ряд достаточно значимых проектов
стандартов, над которыми активно ведется работа.
Наиболее значимые с нашей точки зрения принятые консорциумом и достаточно
продвинутые в разработке стандарты платформы XML и ее окружения в соответствии
с их функциями можно разбить на следующие классы (для менее известных стандартов
здесь приведены полные названия; большинство сокращенных названий стандартов
расшифровано в глоссарии и в указателе — в разделах 4 и 5):
•• Фундаментальные стандарты:
XML, Namespaces in XML, XML Information Set;
•• Разметка содержания документов:
XML;
•• Определение локальной и глобальной информационной
гиперструктуры:
XPointer, XLink;
•• Форматирование и трансформация XML-документов:
XSL, XSLT, CSS;
•• Описание структуры XML-документов:
XML (DTD), XML Schema;
•• Стандарты семантического Веб:
RDF, SPARQL, RDFS, OWL, RIF (Rule Interchange Format), Semantic Annotation
for WS & XML Schema, SKOS (Simple Knowledge Organisation System);
•• Языки запросов XML-документов:
XQuery, XUpdate, XPath, XSLT;
•• Интерфейсы прикладного программирования:
DOM, SAX;
•• Обеспечение преемственности с HTML-технологиями:
XHTML, XML Base;
•• Транспорт данных:
SOAP, XForms;

32
Назначение и функциональные возможности языка XML 

•• Идентификация информационных ресурсов:


URI, URL, URN;
•• Информационная безопасность:
XML-Signature, XML Encription / Decription, XML Key Management, WS-Security;
•• Веб-сервисная архитектура:
WSDL, SOAP, WS-Addressing, WS-Choreography Description Language, WS-
Discovery, WS-Federation, WS-Reliability, WS-Security, Semantic Annotation for
WS & XML Schema, WS-Policy;
•• Вспомогательные функции:
XInclude, XFragment, Canonical XML, XPath;
•• Стандарты вертикальной сферы:
MathML, XMI, cXML, CML, WML, GML, ebXML, UBL и др.
Анализируя приведенную классификацию, нетрудно видеть, что некоторые из включенных
в нее стандартов многофункциональны и, в соответствии с этим, отнесены к нескольким
классификационным категориям. Мы полагаем, что названия классов позволяют составить
общее представление об основных функциональных возможностях платформы XML.
Более подробные сведения о большинстве конкретных упоминаемых здесь стан-
дартов содержатся, как уже отмечалось, в их спецификациях, свободно доступных на
веб-сайте консорциума W3C. Ряд перечисленных стандартов описан в этой книге (см.
разд. 3). Кроме того, необходимую информацию можно найти, например, в наших работах
[4–7, 9, 11–15], а также в ряде изданных на русском языке монографий и учебников по
языку XML.

2.5. Назначение и функциональные возможности


языка XML

Как можно видеть из приведенной выше классификации, стандарт XML играет тройную
роль в составе платформы XML. С одной стороны, он является одним из фундаментальных
стандартов платформы. В этой роли его функция состоит в обеспечении синтаксических
соглашений для определения всех других стандартов платформы. В другой своей роли
язык выполняет важную функцию конструирования основных структурных единиц
информационного наполнения Веб нового поколения, называемых XML-документами.
Наконец, третья роль XML — он является, как будет показано ниже, языком описания
XML-данных.
С синтаксической точки зрения, XML является подмножеством известного языка SGML
[37], допускающим сравнительно простую реализацию. В нем предусматривается набор
небольшого количества операторов, главное назначение которых состоит в определении
типов XML-документов и типов их элементов — «строительных блоков XML-документов»
данного типа — и в описании допустимой их структуры. Таким образом, XML, как и его
прототип SGML, — это метаязык, являющийся по существу языком определения тегов
разметки и структуры использующих их XML-документов.
Важно отметить, что в отличие от языка HTML новый язык разметки XML опреде-
ляет не форматную разметку XML-документов, а разметку и структурирование их

33
информационного наполнения (контента). Для форматной разметки служат языки XSL
и CSS.
Предполагается, что XML-документ состоит из элементов документа различных
типов. Элементы документов могут иметь свое содержимое, а также параметры, на-
зываемые атрибутами элемента. Содержимое элемента может быть пустым, может
быть некоторым значением и / или совокупностью элементов одного или нескольких
других типов, приведенных в произвольном или некотором определенном порядке.
Атрибуты элемента могут быть обязательными или факультативными и имеют скалярные
значения. Элементы документа данного типа также могут быть факультативными или
могут повторяться в нем определенное количество раз
Содержимое каждого XML-документа представляет собой иерархию элемен-
тов документа. При этом корневым элементом является сам документ. Каждый
определяемый тип элементов документов идентифицируется некоторым именем,
которое явно включается в экземпляры элементов этого типа. Имя типа элементов
служит тегом разметки.
Поскольку XML определяет составные части XML-документов и допустимую
их структуру, он выполняет функции языка описания XML-данных. Определение
структуры XML-документов — типов составляющих их элементов и допустимой их
структуры, представляющей иерархию таких элементов, — описывается средствами
языка XML и называется определением типа документов (Document Type Definition
или кратко DTD). Это определение может быть встроено в конкретный документ либо
хранится вне его. В последнем случае оно определяет потенциальное множество
экземпляров документов данного типа. В конкретном экземпляре документа для
дополнения внешнего DTD может использоваться какое-либо внутреннее DTD.
Фактически определение типа документов представляет собой сконструиро-
ванное с помощью XML как метаязыка определение конкретного языка разметки
с собственным набором тегов и правилами конструирования XML-документов, до-
пустимых в этом языке. Такого рода языки в материалах консорциума W3C называют
словарями XML.
Первоначально XML разрабатывался как язык разметки информационного
наполнения для нового поколения Веб. Однако он быстро нашел применение во
многих других областях ИКТ и в определяющих их стандартах. В частности, он
стал играть роль языка-посредника, используемого для информационного обмена
между различного рода системами, например, для обмена метаданными между
инструментами CASE, поддерживающими язык UML. Он используется также для обмена
данными между различными веб-приложениями, в частности, организованными
в виде веб-сервисов.
Авторы языка XML считают принципиально важным его свойством расши-
ряемость, обеспечивающую новые функциональные возможности среды Веб.
Это свойство языка указывается в его названии, и оно заслуживает более точной
интерпретации.
Достижение расширяемости XML основано на двух факторах. Прежде всего,
XML представляет собой, как уже отмечалось, язык метауровня, а не конкретный
язык, подобно HTML состоящий из набора тегов разметки. XML — это язык описания
данных. Используя его синтаксис, можно определять различные наборы тегов для

34
Преемственность с технологиями HTML

разметки содержания конкретных XML-документов или коллекций структурно


однородных документов.
Второй фактор — это использование пространств имен — именованных мно-
жеств символов, используемых в качестве тегов разметки, играющих роль имен типов
элементов XML-документов и их атрибутов. Пространство имен позволяет явным
или неявным образом ассоциировать нужную семантику с определяемыми тегами,
их атрибутами и допустимыми значениями атрибутов.
Важно подчеркнуть, что рассмотренные принципы обеспечивают также рас-
ширяемость функциональных возможностей всей платформы XML. Однако для
введения каждого такого расширения необходимо достижение консенсуса в рамках
консорциума W3C. Основу каждого дополняющего XML стандарта платформы со-
ставляет некоторый набор новых тегов с их атрибутами или только атрибутов уже
введенных ранее тегов, синтаксис которых может быть определен средствами языка
XML и которые воплощают требуемые новые функциональные возможности. Для
каждого нового стандарта платформы XML должно быть определено пространство
имен с зарезервированным именем, описывающее символы новых тегов и / или
атрибутов тегов. Синтаксис и семантика новых тегов, атрибутов тегов и значений,
которые они могут принимать, определяются в спецификации нового стандарта.
Теперь можно уточнить, как следует понимать расширяемость языка XML. Не
следует буквально понимать название языка XML — Extensible Markup Language
(расширяемый язык разметки). Строго говоря, сам язык XML не является расширяемым.
Пользователь не может добавить в одобренные консорциумом W3C его спецификации
никаких новых конструкций. Расширяемость языка XML понимается авторами языка
в том смысле, что пользователь имеет возможность вводить и пополнять определяемое
средствами языка множество тегов разметки по своему усмотрению. Для этого он
использует рассмотренные выше возможности языка.

2.6. Преемственность с технологиями HTML


За недолгую историю Веб в его среде было накоплено огромные массивы информации.
Количество HTML-страниц «видимой» части Веб достигло многих миллиардов. Утрата
возможности доступа к этим информационным сокровищам, конечно же, недопустима.
Поэтому необходимым условием технологического переоснащения Веб является
обеспечение преемственности новых технологий с технологиями HTML, сохранение
доступности существующих ресурсов HTML. Это требование было учтено при раз-
работке новой технологической платформы Веб, основанной на языке XML.
Для достижения указанной цели достаточно иметь возможность интерпретиро-
вать HTML-страницы при обработке их процессором XML в среде, поддерживающей
стандарты основанной на этом языке платформы, как XML-документы. Естественное
решение этой проблемы достигается благодаря следующим факторам.
Языки XML и HTML имеют общую природу, они оба являются порождением
стандартного обобщенного языка разметки SGML. Как известно, SGML — это метаязык,
и HTML представляет собой некоторое его порождение. Что касается XML, то он
также является метаязыком, удобным для реализации подмножеством SGML. В

35
связи с указанными причинами языки HTML и XML имеют общий алфавит и общие
синтаксические соглашения.
Наконец, и это самое главное, функциональность языка XML определялась таким
образом, чтобы язык HTML может быть порожден и XML. Средствами XML можно
построить такие определения типа документов DTD, которые будут специфицировать
любую допустимую структуру HTML-страниц. Если ассоциировать с HTML-страницами
такие DTD, то они будут корректно интерпретироваться в среде, поддерживающей
XML, как XML-документы.
Именно эту задачу решает стандарт W3C XHTML [45]. В нем предложены
спецификации DTD для трех уровней языка HTML, отличающихся друг от друга
степенью полноты использования его функциональных возможностей. Стандарт
ориентирован на версию HTML 4.01 — действующую версию стандарта этого языка.
В консорциуме W3C проводится дальнейшая работа по развитию стандарта XHTML
с целью совершенствования технологичности его использования. Однако заложен-
ный в его основу принцип обеспечения преемственности с языком HTML остается
неизменным.
В заключение нужно заметить, что для решения проблемы преемственности в со-
став платформы XML включен также стандарт XML Base [46]. Функции определенной
в нем спецификации аналогичны функции тега Base в языке HTML. Они позволяют
поддерживать средствами стандарта XLink некоторые виды гиперссылок, которые
используются в языке HTML.
Таким образом, ввод в действие платформы XML в Веб не грозит утратой
информации, накопленной ранее в этой среде.

2.7. Стандарты веб-сервисов


Функциональность новой технологической платформы Веб обеспечивает не только
поддержку статических гипертекстовых документов и доступ к ним, как это имеет
место в действующей версии Веб, но и возможности реализации функционирующих
в этой среде комплексов интероперабельных приложений на основе веб-сервисной
архитектуры (Web Services Architecture, WSA), представляющей собой частный случай
сервисно-ориентированной архитектуры (Service-Oriented Architecture, SOA).
Центральным звеном WSA является веб-сервис. В спецификациях стандартов
консорциума W3C веб-сервис понимается как программная система, идентифи-
цируемая URI, интерфейс которой описан стандартным образом и которая может
использоваться другими такими системами для обмена сообщениями с нею с помощью
XML-протокола. Веб-сервисы могут рассматриваться как обменивающиеся сообще-
ниями веб-приложения, реализация которых инкапсулируется с помощью адаптеров
(«оберток», wrappers). Именно эти адаптеры представляют собой описываемые
стандартным образом интерфейсы доступа к инкапсулируемым ими приложениям.
Для реализации веб-сервисной архитектуры консорциумом W3C и другими
организациями-разработчиками создан ряд стандартов, несколько стандартов
находится в стадии разработки. Наиболее важными из стандартов WSA являются
язык описания веб-сервисов (WSDL) и протокол обмена XML-данными (SOAP),

36
Стандарты веб-сервисов

разработанные консорциумом W3C, а также средства публикации сведений о веб-


сервисах и их обнаружения в Веб (UDDI), созданные консорциумом OASIS [38].
Язык WSDL (Web Services Description Language) следовало бы назвать более
точно языком описания интерфейсов веб-сервисов. Именно средствами этого языка
описываются интерфейсы-адаптеры веб-приложений, которые превращают их
в веб-сервисы. Язык WSDL описывает для данного веб-сервиса структуру и контент
входных и выходных сообщений, операции, которые данный веб-сервис может
выполнять с контентом сообщений, протоколы, которые следует использовать для
передачи сообщений этому веб-сервису (например, «SOAP поверх http»). Язык
WSDL аналогичен по назначению языку IDL CORBA. Спецификации интерфейсов
веб-сервисов на этом языке устраняют их неоднородность и обеспечивают тем
самым их интероперабельность.
Использование стандартизованных веб-сервисов позволяет решать проблему
обеспечения интероперабельности различных веб-приложений, обмена информацией
между ними и, таким образом, их интеграцию. Интероперабельность достигается за
счет стандартизации языка описания интерфейсов веб-сервисов. Этот язык независим
от языка программирования и среды реализации приложений.
Обмен сообщениями между веб-сервисами осуществляется на основе протокола
SOAP (Simple Object Access Protocol). Это транспортный протокол прикладного уровня
для обмена XML-данными в интернете. SOAP определяет совокупность соглашений,
управляющих правилами форматирования, обработки и передачи сообщений между
узлами сети. Первоначально он был разработан в 1999 г. компаниями Microsoft, IBM,
DevelopMentor и UserLand Software как расширение ранее созданного претендента
на роль XML-протокола XML-RPC. На основе этой версии SOAP консорциумом W3C
был разработан и одобрен (в 2003 году) стандарт XML-протокола SOAP 1.2. Одна
из главных сфер применения SOAP — обмен информацией между веб-сервисами.
Сообщения SOAP представляют собой XML-документы специального формата, по-
зволяющие передавать данные и осуществлять удаленный вызов процедур (RPC).
Семантическая интерпретация сообщений осуществляется приложениями SOAP,
в частности, веб-сервисами.
При обращении к веб-сервису его адаптер получает на входе сообщение — не-
который XML-документ, определяет по его содержанию, какую из программ инкап-
сулируемого приложения нужно исполнить, генерирует для нее входные данные
и активизирует эту программу. Получив результат исполнения вызванной про-
граммы, адаптер генерирует на его основе возвращаемые данные для вызывающей
стороны.
Протокол SOAP обеспечивает простейшие коммуникационные функции.
Комбинируя их, пользователь протокола может реализовать более тонкие про-
токолы. SOAP может отображаться в различные базовые транспортные протоколы.
В стандарте SOAP 1.2 определено связывание с протоколом HTTP.
Третьим из базовых стандартов технологий веб-сервисов является разра-
ботанный консорциумом OASIS стандарт UDDI (Universal Description, Discovery
and Integration). Этот стандарт определяет технологию публикации сведений
о веб-сервисах и их обнаружения в Веб. Компания-владелец веб-сервисов может
зарегистрировать сведения о них в глобальном UDDI-регистре. Четыре равноправные

37
копии UDDI-регистра, синхронизируемые в течение суток, поддерживаются IBM,
Microsoft, SAP, HP. Регистр имеет два интерфейса — для публикации сведений и для
запросов. Для доступа к регистру используется протокол SOAP. Информация, на-
правляемая в регистр, представляется стандартным образом на языке XML и включает:
сведения о компании — владельце регистрируемых веб-сервисов и контактные
данные, описание функциональности предоставляемых компанией веб-сервисов,
техническое описание веб-сервисов.
Перечисленные стандарты WSA, как уже указывалось, образуют базис WSA.
Наряду с ними уже существуют другие стандарты, расширяющие функциональ-
ность создаваемой консорциумом W3C платформы для реализации разнообразных
прикладных систем на основе WSA. В частности, созданы стандарты адресации
веб-сервисов WS Addressing, политики веб-сервисов WS Policy, хореографии веб-
сервисов WS Choreography. Разрабатывается стандарт семантического аннотирования
описаний интерфейсов веб-сервисов на языке WSDL, который позволит оперировать
веб-сервисами в среде семантического Веб.
В процессе разработки в консорциумах W3C, OASIS, группах заинтересованных
крупных компаний-поставщиков программного обеспечения находится ряд стандартов,
предназначенных для обеспечения безопасности веб-сервисов, использования их
в транзакционном режиме, возможностей построения более сложных веб-сервисов
из имеющихся, моделирования бизнес-процессов в терминах взаимодействующих
веб-сервисов и др. К числу этих стандартов относятся, например, WS-Orchestration,
WS-Transaction, WS-Coordination, WS-Security, BPEL4WS.
Благодаря появлению стандартов веб-сервисной архитектуры подходы, основан-
ные на SOA, стали активно использоваться в последние годы для разработки крупных
распределенных систем. Веб-сервисы также стали основой грид-технологий.

2.8. Технологии семантического Веб


Созревший еще во второй половине 1990‑х годов замысел создателей Веб, направлен-
ный на радикальные преобразования этой весьма значимой для жизнедеятельности
общества системы и на превращение ее в систему семантического уровня, начал
активно реализовываться в последние годы.
В то время как Веб первого поколения строился с ориентацией на обработку
представленной в нем информации человеком, новые технологии Веб должны
обеспечивать автоматизированную интерпретацию и обработку информации, се-
мантическую интероперабельность, т. е. возможности одинаковой интерпретации
информации, используемой сообществом взаимодействующих агентов. В этих
условиях уже недостаточно располагать синтаксическим описанием XML-документов
с помощью DTD или XML Schema. Например, при обмене документами, описанными
средствами этих языков, обе обменивающиеся стороны должны одинаковым образом
понимать смысл используемых в документах типов элементов и атрибутов элементов,
а также содержащихся в них гиперссылок, о чем заранее должны быть приняты
соответствующие договоренности, описанные явным образом.

38
Технологии семантического Веб

Средства формального описания семантики XML-данных. Необходимость решения


указанных задач вызвала потребность в таких средствах формального описания
семантики XML-данных, которые бы позволяли анализировать и обрабатывать их
с помощью программного обеспечения. При таком подходе Веб нового поколения
должен иметь многоуровневую информационную архитектуру — «физика», «логика»,
«семантика», о чем уже говорилось выше.
Первым шагом консорциума W3C в рассматриваемом направлении было создание
стандартов RDF (Resource Definition Framework) [40] и RDFS (RDF Schema) [39].
Описание семантики ресурсов XML с помощью выразительных средств стандарта
RDF, называемое RDF-спецификацией, аналогично по своим возможностям концепту-
альной схеме в системах баз данных и приблизительно эквивалентно ER-модели.
В RDF-спецификации объявляется некоторое множество ресурсов, для каждого
из которых определяются пары «свойство-значение». Ресурсы в RDF — это ресурсы
Веб, например XML-документы, идентифицируемые уникальным образом с помощью их
URI. Они могут также представлять собой коллекции других ресурсов или литералов,
называемые контейнерами. Допускаются контейнеры типа мультимножества, по-
следовательности и альтернативы. Значения свойств задаются литерально либо могут
быть другими ресурсами, которые представляются, в свою очередь, их свойствами.
Таким образом, свойства могут определять и связи между ресурсами.

Онтологии. Описание семантики свойств ресурсов в RDF называется RDF-схемой.


По сути, RDF-схема должна определять онтологию предметной области. Онтологии
получили в последние годы широкое распространение в решении проблем пред-
ставления знаний и инженерии знаний, семантической интеграции информации,
информационного поиска и т. д.
Под онтологией понимается «явная спецификация совместно используемой
концептуализации предметной области» [36]. Такая спецификация представляет
собой своего рода словарь понятий предметной области и совокупность явным
образом выраженных предположений относительно смысла этих понятий (ак-
сиом). Концептуализация предметной области понимается как представление
релевантных данному случаю понятий (концептов) предметной области и связей
между ними. Возможность совместного использования концептуализации предпо-
лагает существование некоторого сообщества взаимодействующих агентов, в ней
заинтересованного.
Уровень формальности описания онтологии может изменяться в широком
диапазоне. В упрощенных случаях онтология представляется как таксономия
понятий, связанных отношениями обобщения / специализации (is a), агрегации
(part of) и других видов. Такие описания онтологий используются в различных
классификациях. Другое средство неформального описания онтологий — схемы
метаданных, например, набор элементов метаданных Дублинского ядра [20]. Развитые
определения онтологий формализуются средствами языков логики первого порядка.
Они допускают возможности логического вывода.
Возвращаясь к стандарту RDF, следует отметить, что в RDF-спецификации не
регламентируется способ задания схемы. Достаточно лишь представить ее как
некоторый ресурс Веб и использовать URI этого ресурса для ссылки на нее в RDF-

39
спецификации. В документации стандарта RDF рассматривается, например, вариант
использования для этих целей набора элементов метаданных Дублинского ядра.
Один из более развитых способов задания схемы предлагается в упоминавшейся
второй части стандарта RDF, называемой RDF Schema (RDFS) [39]. Фактически
конкретные спецификации на языке RDFS представляют собой таксономии. Этот
язык основан на объектной модели, в которой используются концепции классов,
свойств и ограничений, ассоциируемых с классами и свойствами, поддерживается
иерархическое отношение «класс-подкласс».
Важно здесь отметить следующие два обстоятельства. Во-первых, хотя стандарт
RDF создавался с ориентацией на описание ресурсов XML, он не зависит от XML
и может применяться в иных информационных средах. Во-вторых, для приложений,
нуждающихся в более формальном описании семантики данных, схема в RDF-
спецификациях является той «открытой точкой», которая позволяет интегрировать
в среду XML онтологические спецификации предметной области или иные описания
семантических свойств информации, обладающие более формализованными функ-
циональными возможностями представления знаний.

Другие языки описания онтологий. Создание развитого языка описания онтологий


стало одним из наиболее важных звеньев работ в области семантического Веб, прово-
димых консорциумом W3C. Имеется в виду язык, позволяющий описывать онтологии
с помощью набора возможностей — от таксономий до формальных спецификаций.
В конце 2001 года для реализации этого проекта в составе W3C была учреж-
дена специальная рабочая группа — Web Ontology Working Group [49]. Разработка
языка, получившего название Web Ontology Language (с нетрадиционным образом
построенной аббревиатурой — OWL) началась в консорциуме не с чистого листа.
Она была основана на результатах, уже полученных к этому времени несколькими
авторитетными исследовательскими коллективами, и поэтому ее удалось осуществить
в относительно короткие сроки.
В предшествующие этой деятельности годы был выполнен ряд основательных
теоретических и прикладных исследовательских проектов, целью которых было соз-
дание языков описания онтологий. На разработку стандарта OWL непосредственное
влияние оказали проекты SHOE, OIL и DAML.
Проект SHOE (Simple HTML Ontology Extensions) [42] выполнялся в Мэрилендском
университете (Maryland University, College Park). Был разработан ориентированный
на Веб язык представления знаний, построенный как расширение HTML, включающее
в него дополнительные теги разметки для встраивания онтологий и для аннотирования
HTML-страниц. Дополнительно введенные в HTML-страницы спецификации могут
использоваться пользователем Веб при навигации с помощью браузера, поисковыми
машинами Веб, а также для информационных запросов.
Другой из названных проектов — OIL (Ontology Inference Layer или Ontology
Interchange Language) [50] — финансировался Европейской комиссией (EC). Его
целью являлось создание формального языка описания семантики информационных
ресурсов и логического вывода для Веб. Этот язык сочетает в себе возможности
фреймовых систем представления знаний и дескриптивных логик. Он опирается
на стандарты XML, XML Schema, RDF и RDFS.

40
Особенности XML-данных и их моделирование

Наконец, проект DAML (DARPA Agent Markup Language) [30] выполнялся по


инициативе и при финансовой поддержке DARPA (Defense Advanced Research Projects
Agency) с 2000 года. Его целью также было создание языка для описания семантики
информационного наполнения Веб и поддержки логического вывода в этой среде,
а также необходимого для этого инструментария. В выполнении проекта участвовали
наряду со специально созданной исследовательской группой также и участники
ряда ранних проектов, в том числе, SHOE и OIL. Первая версия разрабатываемого
языка, названная DAML-ONT, была создана в конце 2000 года. Она представляла
собой некоторое «онтологическое ядро», являющееся расширением стандарта RDFS.
Никаких средств вывода этот язык не обеспечивает. Весной 2001 года была объявлена
новая версия DAML+OIL [31], в которой, как видно из ее названия, в язык были при-
внесены возможности, заимствованные из проекта OIL, в частности, и возможности
логического вывода. Именно этот язык использовался Web Ontology Working Group
как прототип стандарта языка описания онтологий консорциума W3C. Естественно,
вместе с языком OIL, новый стандарт позаимствовал и аппарат дескриптивных логик
(Description Logics), который кратко обсуждается ниже.
Таким образом, для создания стандарта W3C OWL действительно имелся
существенный задел. Стандарт OWL был принят консорциумом W3C в феврале
2004 г. Язык OWL имеет три уровня (три подъязыка): OWL Light, позволяющий пред-
ставлять онтологии в виде таксономий и связанных с ними простых ограничений;
OWL DL — функционально более богатый язык, основанный на одной из версий
дескриптивных логик (Description Logics, DL), и наконец, уровень OWL Full — язык
с полными возможностями. В настоящее время OWL уже используется на практике
в разработках различных систем, главным образом, научного назначения.

Дескриптивные логики. Дескриптивные логики — это языки представления знаний,


в которых описывается множество концептов — унарных отношений, представляющих
классы объектов, и ролей — бинарных отношений между ними. Допускаются при-
митивные и сложные концепты и роли. Сложные концепты и роли формируются
из простых с помощью множества конструкторов. В качестве конструкторов могут
использоваться, например, операторы конъюнкции, дизъюнкции, дополнения, чис-
лового неравенства, кванторы и т. п. Различия между конкретными дескриптивными
логиками связаны с разнообразием используемых в них множеств конструкторов.
Дескриптивные логики фактически представляют собой различные подмножества
логики первого порядка. С помощью их формализма естественным образом опи-
сываются фреймовые модели знаний, объектно-ориентированные представления,
семантические сети и представления, основанные на других методах, используемых
в рассматриваемой области.

2.9. Особенности XML-данных и их моделирование


На развитие технологий XML весьма существенное влияние оказывают концепции
и подходы, сложившиеся в области технологий баз данных. В спецификациях стан-
дартов платформы XML приобрели право гражданства такие термины из этой области,

41
как модель данных, ограничение целостности, схема, язык запросов. Используются
концепции иерархии абстракций данных (или иначе — многоуровневого представле-
ния данных), самоописываемости данных, схемы данных, отчужденной (автономной)
от самих данных. Однако природа XML-данных и подходы к их моделированию имеют
свои особенности.

XML-данные. Основной структурной единицей XML-данных является XML-документ,


логическое представление которого, как указывалось выше, — это иерархия элементов
документа. По своей структуре XML-документ напоминает записи базы данных
CODASYL или записи файлов базы данных весьма популярной ранее СУБД ADABAS,
разработанной в 70‑х годах компанией Software AG.
Существуют две категории XML-документов. Документы первой категории служат
для представления некоторых данных средствами синтаксиса XML таким образом, что
организация самих представляющих их XML-документов в целом, исходный вид этих
документов не имеют для пользователей существенного значения. Важно только, со-
храняя эти документы в базе данных, иметь возможность воспроизвести при выборке
данных по запросам элементы, составляющие контент этих XML-документов, значения
их элементов и значения атрибутов элементов. Такие XML-документы называют
ориентированными на данные (Data-Centric Documents). Для XML-документов второй
категории важное значение имеет не только их контент как множество составляющих
элементов, но и исходное представление этих документов. XML-документы такого
рода называются документно-ориентированными (Document-Centric Documents)
или прозаическими документами (Prose-Oriented Documents).
Документы первой категории предназначены, главным образом, для автомати-
зированной обработки. В то же время, документы второй категории предназначены,
как правило, для восприятия человеком. Они обычно подготавливаются с помощью
какого-либо текстового редактора, а затем конвертируются в XML-представление.
XML-документы, ориентированные на данные, как правило, генерируются автома-
тически из различных источников, в том числе, и из содержимого баз данных. В
отличие от них, документно-ориентированные XML-документы обычно создаются
при существенном участии человека.

Гиперссылки в XML-документах. Язык XML — не единственный инструмент конструи-


рования XML-документов. Документ, представленный средствами языка XML, может
дополняться компонентами, описываемыми средствами других языков платформы
XML, — XML-формами, электронной подписью и т. д. С помощью языков XPointer
и XLink в XML-документ могут встраиваться внутренние и внешние гиперссылки.
Внутренние гиперссылки позволяют определять связи между компонентами данного
документа и определять тем самым его гипермедийную интраструктуру. Внешние
гиперссылки связывают данный документ с другими документами или их компонентами,
образуя гипермедийную макроструктуру XML-данных. Гиперссылки вместе с тем
определяют навигационные пути доступа к XML-данным на заданном множестве
XML-документов.

42
Особенности XML-данных и их моделирование

Идентификация XML-документов и фрагментов документов в среде Веб. В среде


Веб XML-документы могут идентифицироваться как по месту их хранения в интернете,
так и с помощью некоторых абстрактных имен. Предусматривается возможность ис-
пользования более общего вида идентификаторов ресурсов по сравнению с хорошо
известным пользователям действующего Веб унифицированным указателем ресурсов
(Uniform Resource Locator, URL). Такие абстрактные имена ресурсов, независимые от
местоположения их в Интернет, называются унифицированными именами ресурсов
(Uniform Resource Name, URN). Обобщенный вариант идентификатора ресурсов,
частными случаями которого являются привычные URL и абстрактные имена ресурсов
URN, называется унифицированным идентификатором ресурсов (Uniform Resource
Identifier, URI) [23]. В среде Веб, таким образом, возможен прямой доступ к требуе-
мым XML-документам по их URI, а также навигационный доступ по гиперссылкам,
содержащим URI целевых XML-документов.
Для идентификации фрагментов XML-документов используются стандар-
ты XPointer и XPath. Первый из них принадлежит платформе XML, а второй — ее
окружению.

Многоуровневое представление XML-данных. Как и в технологиях баз данных, раз-


работчики новой технологической платформы Веб ориентируются на использование
иерархии абстракций XML-данных — многоуровневой информационной архитектуры:
«физика-логика-семантика».
Физическое представление XML-документа — это его представление в терминах
«хранимых сущностей» [35], т. е. файлов, содержащих составные части данного
документа. К физическому представлению относятся также аспекты кодировки
(Encoding), используемой для контента документа, идентификации его компонентов
с помощью URL и т. п.
Логическое представление XML-документа — иерархическая структура, об-
разованная из элементов документа. Логическое представление может быть описано
с помощью DTD и / или языка XML Schema.
Наконец, семантическое представление XML-документов описывается сред-
ствами стандартов RDF, RDFS или OWL.
В отличие от принципов многоуровневого представления данных в системах баз
данных, платформа XML не обеспечивает строгого разделения аспектов физического
и логического представления данных. В XML-документе видны для пользователя
и «логика» его, и «физика». То и другое сосуществует в XML-документах, не обе-
спечивая высокой степени независимости данных, имеющей важное значение
в технологиях баз данных. При изменениях структуры хранимых сущностей изменяется
представление документа.

Структурированные и слабоструктурированные XML-данные. XML-документы


позволяют представлять как слабоструктурированные, так и структурированные
данные.
Действительно XML-документы некоторых типов не имеют регулярной струк-
туры. Их структура характеризуется наличием многих факультативных элементов
и факультативных атрибутов элементов. К тому же язык XML поддерживает довольно

43
бедную систему типов значений элементов и атрибутов элементов. Контент таких
документов представляет собой слабоструктурированные данные. Как правило,
указанным свойством обладают документно-ориентированные XML-документы.
Свойства слабоструктурированных XML-данных определяются разметкой содержащих
их документов. Для них могут быть также заданы DTD.
Вместе с тем, существуют типы XML-документов, характеризующихся регулярной
структурой относящихся к ним коллекций экземпляров документов. Контент таких
документов представляет собой структурированные данные. Для таких типов
XML-документов может использоваться отчужденное автономное описание — DTD
и / или схема на языке XML Schema. Указанные свойства характерны для документов,
ориентированных на данные.
Таким образом, стандарты платформы XML обеспечивают представление не
только слабоструктурированных, но и структурированных XML-данных.

Модели XML-данных. В стандартах XML активно употребляется понятие моде-


ли данных [16, 18], возникшее и играющее фундаментальную роль в технологиях
баз данных. Однако оно трактуется здесь иначе, чем в области баз данных. В то
время как в технологиях баз данных модель данных понимается как метамодель
для конструирования моделей конкретных предметных областей и оперирования
их элементами, т. е. как инструмент моделирования предметной области, авторы
стандартов XML употребляют «старомодную» (раннюю) трактовку понятия модели
данных как структуры конкретного XML-документа. Такое разночтение создает
неоправданные проблемы, поскольку в настоящее время уже сформировались походы
к интеграции XML-технологий и технологий баз данных. Практическая их реализация
привела к созданию нового пласта технологий баз данных и нового вида баз данных,
называемых XML-ориентированными базами данных. Поставщики программного обе-
спечения систем баз данных создали индустриальный инструментарий для создания
и использования таких баз данных.
Другая проблема в моделировании XML-данных заключается в том, что единой
функционально полной, охватывающей как структурные, так и операционные воз-
можности модели данных, на которой бы базировались все стандарты платформы,
не существует и похоже, что теперь уже она вряд ли сможет появиться. Никакой
деятельности в этом направлении в консорциуме не ведется. Вопросы моделирования
данных обсуждаются лишь автономно в рамках спецификаций отдельных стандартов.
При этом авторы имеют в виду только структурные аспекты моделирования данных.
Исключение составляет стандарт DOM, который обсуждается далее.
В разработках программных инструментальных средств, поддерживающих
стандарты XML, фактически используется несколько различных альтернативных
моделей данных, которые можно было бы назвать XML-ориентированными моделями.
Среди них модели данных, определяемые стандартами DOM и XPath, а также парами
языков (XML, XQuery), (XML, XSLT). Первая из названных моделей (DOM) — это
полнофункциональная объектная модель данных. Хотя стандарт DOM не основан на
синтаксисе языка XML и поэтому относится в соответствии с нашей терминологией
к ее окружению, определяемые им языковые средства часто используются в качестве
API в системах управления XML-данными. Поэтому объектную модель, определяемую

44
Особенности XML-данных и их моделирование

этим стандартом, с полным правом можно отнести к категории XML-ориентированных


моделей данных. Стандарт XPath также не использует синтаксис XML и позволяет
идентифицировать фрагменты XML-документа как узлы или подмножества узлов
иерархической древовидной структуры, представляющей документ. Наличие воз-
можности идентифицировать интересующие пользователя фрагменты документов
позволяет использовать определяемый стандартом XPath язык как язык запросов.
В остальных указанных выше моделях XML выполняет функции языка определения
данных, а языки XQuery и XSLT определяют их операционные возможности. Поэтому
язык запросов является фактически одним из компонентов определения модели
данных. Важно отметить, что указанные языки запросов не предусматривают средств
обновления данных.
Недавно консорциум W3C завершил работу над спецификациями языка запросов
SPARQL для RDF-спецификаций, описывающих семантику ресурсов. Совокупность
языков RDF и SPARQL может рассматриваться как полнофункциональная семантиче-
ская модель данных для семантического уровня представления XML-данных.

Метаданные XML. Как и в технологиях баз данных, ресурсы XML состоят из данных
и метаданных. Метаданные в среде XML имеют различные назначения. Они описывают
структурные свойства XML-документов, типы содержащихся в них данных, семантику
данных и т. д. Для описания структурных свойств документов и типов представленных
в них данных в технологиях XML используется, как и в технологиях баз данных,
содержащееся в документах или отчужденное от них описание, представляющее
собой в таком случае автономный ресурс — DTD, схему на языке XML Schema, RDF-
спецификацию и т. п. Случаи, когда в XML-документах используются встроенные
спецификации описания типа документа DTD, а не ссылки на внешние DTD, существенно
не нарушают этого принципа, поскольку при этом DTD четко синтаксически отделены
от остального контента определяемых документов.
Однако в отличие от технологий баз данных, в технологиях XML наряду с автоном-
но существующими метаданными, отчужденными от самих данных, существуют также
метаданные, встроенные в XML-документы и принципиально не отчуждаемые от них.
Встроенные метаданные — это разметка документов, обеспечивающая их самоопи-
сываемость. Для извлечения значений таких метаданных необходимо сканировать
содержание документа с помощью синтаксического анализатора (парсера). Таким
образом, в технологиях XML сосуществуют принципы самоописываемости данных
и автономного отчужденного от документов их описания. Разметка XML-документа
определяет при этом структурные его компоненты и описывает некоторые простейшие
свойства конкретного документа. Описание свойств типов XML-документов и со-
держащихся в них данных обеспечивается с помощью автономных описаний — DTD
или схем на языке XML Schema.
Важной особенностью управления XML-данными в Веб является отсутствие цен-
трализации, полная автономия поддержки информационного наполнения отдельных
веб-сайтов. В связи с этим в такой среде в отличие от систем баз данных отсутствуют
механизмы централизованной поддержки метаданных. Возможно, в рамках архитек-
турных подходов, разрабатываемых для Веб нового поколения, указанные функции
будут выполнять специальные веб-сервисы. Нужно заметить, что указанные проблемы

45
не возникают в системах баз данных нового типа, предназначенных для поддержки
XML-данных. Такие системы, как уже отмечалось, называют XML-ориентированными
базами данных. Их характеристики будут рассмотрены далее.

2.10. XML-ориентированные базы данных


Интенсивное развитие новой технологической платформы Веб, быстрое расширение
сферы ее практического использования привели к интенсивному наращиванию
объема ресурсов XML, поддерживаемых не только в среде Веб, но и вне ее — XML-
документов, составляющих их данных и описывающих их метаданных. Для эффектив-
ного управления хранилищами подобной информации (XML-данных), поддерживаемой
вне Веб, естественно использовать технологии баз данных, хотя сами хранилища
и такие данные обладают специфической с точки зрения традиционных баз данных
природой.

Новый класс систем баз данных. Учитывая нарастающую актуальность проблемы


управления XML-данными, в области баз данных началось формирование новых
технологий, учитывающих специфические свойства ресурсов XML. Стали разраба-
тываться СУБД, основанные на стандартах платформы XML и ее окружения, которые
непосредственно «с чистого листа» поддерживают XML-представление данных, а также
обладают соответствующими интерфейсами для конечных пользователей и интер-
фейсы прикладного программирования для различных языков программирования.
Вместе с тем, ведущие поставщики коммерческих СУБД стали оснащать свои системы
средствами поддержки XML-данных.
Такие базы данных стали называться базами данных XML, а СУБД, обеспечивающие
возможности работы с такими базами данных — XML-ориентированными СУБД.
Разработки XML-ориентированных СУБД начались в конце 90‑х годов. К на-
стоящему времени уже сформировалась индустрия программного обеспечения таких
систем. Поставки XML-ориентированных СУБД осуществляют как ведущие разработ-
чики традиционных серверов баз данных — компании Oracle, IBM, Microsoft и др., так
и ряд вновь возникших компаний. Рынок XML-ориентированных СУБД предоставляет
в настоящее время пользователям несколько десятков разнообразных СУБД, а также
многие другие связанные с ними программные продукты. Свой вклад в эту область
вносят и отечественные разработчики (см., например [2, 3]). Представительный
каталог существующего программного обеспечения рассматриваемого назначения
постоянно поддерживает Р. Буре [26].

Классификация XML-ориентированных СУБД. Различаются две разновидности


XML-ориентированных СУБД: «чистые» и адаптированные системы.
«Чистые» XML-ориентированные СУБД (Native XML DBMS) — это системы, которые
создавались специально для управления XML-данными. Они обеспечивают хранение
XML-документов в полном или декомпозированном виде и обеспечивают доступ к этим
документам или их фрагментам только в терминах модели данных XML. В некоторых таких

46
XML-ориентированные базы данных

системах поддерживаются гиперссылки между документами и / или их компонентами,


которые используются для навигации в базе данных и доступа к XML-данным.
Первоначально такие системы были предназначены для поддержки коллекций
документно-ориентированных XML-документов, для которых важно при хранении в базе
данных сохранять их исходный формат, не утрачивая содержащиеся в исходном до-
кументе инструкции по обработке и комментарии, встроенные в документ сущности.
Как правило, среда хранения данных в «чистых» XML-ориентированных СУБД
основывается на хранении XML-документов как текстов, например, в отдельных файлах.
Другой подход предусматривает структурированное и декомпозированное хранение
документов. В первом случае при обработке документов чаще всего необходимо ис-
пользовать синтаксический анализ их содержимого. Организация хранения документов
во втором случае основана на технике, используемой в традиционных СУБД. Для
повышения эффективности доступа к фрагментам XML-документов обычно используется
индексирование по значениям элементов и атрибутов, а также индексирование по
иерархическому ключу [17, 21] — метод, используемый ранее в системах баз данных,
поддерживающих иерархическую модель данных.
В «чистых» XML-ориентированных системах пользовательские интерфейсы и API
предусматриваются только в терминах XML. Единицей запрашиваемых данных из
базы данных также являются XML-документы или их фрагменты. При этом в запросах
могут использоваться характеристики порядка элементов в структуре документа.
Некоторые СУБД рассматриваемого вида обеспечивают наряду с поиском и выборкой
также обновление контента документов и возможность удаления документов или
их компонентов из базы данных. В этих системах предусматриваются механизмы
управления транзакциями. Однако производительность работы в таком режиме без
использования декомпозированного хранения документов ограничена в связи с тем,
что синхронизационные блокировки осуществляются в этом случае на уровне полных
XML-документов.
Первой среди коммерческих чистых XML-ориентированных СУБД по всеобщему
признанию является программный продукт Tamino компании Software AG. Именно
компания Software AG ввела термин «Native XML DBMS», начиная поставку этого
программного продукта. В Tamino роль языка определения данных играет XML DTD,
а в качестве языка запросов используется XQL [41] — один из ранних языков запросов
для XML, претендовавший на роль стандарта языка запросов для платформы XML.
Для управления средой хранения в Tamino используются механизмы, аналогичные
использованным в раннем продукте компании — СУБД ADABAS. Индексирование данных
в них основано на инвертированных списках. Такая организация среды хранения
хорошо приспособлена для хранения и обработки записей иерархической структуры
с повторяющимися группами с переменным числом экземпляров и с векторами данных.
Именно такую структуру имеют и XML-документы.
К числу «чистых» XML-ориентированных СУБД относятся также 4Suite (компании
Four Thought), Berkeley DB XML (Oracle), Lore (Stanford University), ozone (ozone-db.org),
Sedna XML DBMS (Институт системного программирования РАН), Total XML (Cincom),
X-Hive / DB (X-Hive Corp.) и ряд других систем.
Вторую теперь уже более распространенную и доминирующую в приложе-
ниях разновидность XML-ориентированных СУБД составляют СУБД, называемые

47
адаптированными к XML (XML-enabled DBMS). Это традиционные реляционные,
объектно-реляционные или объектные СУБД, расширенные средствами технологий
управления XML-данными.
Ранние версии таких систем позволяли наряду с их традиционными возмож-
ностями поддерживать коллекции XML-документов, ориентированных на данные. Для
этого в таких системах предусматривались механизмы отображения представления
XML-данных в модель данных, поддерживаемую рассматриваемой СУБД. При этом
выбор способа отображения часто зависел от конкретного приложения, и XML-
документы хранились в декомпозированном виде. Исходный формат XML-документов
обычно не сохранялся. В таких системах использовалось представление контента
хранимых XML-документов средствами их собственной модели данных — реляционной,
объектной или объектно-реляционной.
В последнее время грань между функциональными возможностями «чистых»
и адаптированных XML-ориентированных СУБД постепенно стирается. Оснащенные
дополнительными возможностями для работы с XML-данными традиционные СУБД
последних версий эффективно справляются с этой задачей для обоих видов XML-
документов. Они стали по существу мультимодельными системами, способными ра-
ботать с различными представлениями хранящихся в них XML-документов — как с до-
кументами в исходном виде, так и с компонентами декопозированных документов.
К числу адаптированных XML-ориентированных СУБД можно отнести последние
версии объектно-реляционных серверов баз данных DB2 (IBM), Oracle (Oracle Corp.),
Informix (IBM), SQL Server (Microsoft), объектную СУБД Objectivity / DB (Objectivity)
и др. Некоторые из этих программных продуктов имеют чрезвычайно развитое
оснащение для поддержки XML-технологий указанного назначения как для стадии
разработки, так и для стадии исполнения. Средства стадии разработки включают
парсеры ряда языков платформы XML и ее окружения, разнообразные утилиты,
средства поддержки интерфейсов прикладного программирования для языков Java,
C, C++, PL / SQL и другие. Средства стадии исполнения не являются самостоятельными
программными продуктами. Они представляют собой компоненты основного сервера
баз данных, обеспечивающие расширение его функциональности. Так, продукты
Oracle обеспечивают поддержку целого ряда важных стандартов платформы XML,
а именно XML, XML Schema, XSLT, SAX 2.0, DOM, XPath, SOAP, XQuery и ряда других,
предоставляя разработчику системы базы данных выбор из множества альтернативных
возможностей. Что касается способа отображения XML-документов в среду основного
объектно-реляционного SQL-сервера базы данных Oracle, то можно выбрать нужную
альтернативу в зависимости от ситуации. Например, документно-ориентированные
XML-документы можно представлять как данные типа CLOB или BLOB. Документы,
ориентированные на данные, могут декомпозироваться и представляться в виде
табличных данных.
В «живом» документе [25], постоянно поддерживаемом Р. Буре, была впервые
предпринята попытка представить целостную концепцию XML-ориентированных
баз данных. Имеется русский перевод [1] ранней версии этого поддерживаемого
и актуализируемого Р. Буре документа.

48
XML-ориентированные базы данных

Функциональные возможности XML-ориентированных СУБД. Рассмотрим кратко


функциональные возможности XML-ориентированных СУБД.
Прежде всего, следует отметить, что в отличие от демократичной и открытой
для публикации информации среды Веб, где возможно только локальное (в рамках
отдельных веб-сайтов) администрирование информационного наполнения, для
баз данных XML по необходимости обеспечивается централизованное админи-
стрирование данными.
В XML-ориентированных СУБД предусматривается более эффективная органи-
зация среды хранения по сравнению с используемой в Веб файловой организацией.
Так, например, для доступа к XML-данным применяется техника индексирования
[17, 21], аналогичная используемой в традиционных технологиях баз данных.
Благодаря поддержке метаданных, описывающих свойства XML-документов,
появляется возможность автоматической верификации логической целостности
данных, а также решения других задач управления данными. Поиск и выборка
данных в XML-ориентированной базе данных возможны с достаточно мелкой
гранулярностью — с точностью до фрагментов XML-документов, обладающих
требуемыми свойствами. Эту возможность обеспечивают, в частности, языки
запросов XQuery и XPath.
Большинство XML-ориентированных СУБД обеспечивает мультипользова-
тельский режим работы с развитыми средствами управления транзакциями. СУБД
рассматриваемой категории открывают новые возможности для разработки
приложений систем баз данных.
Существующие XML-ориентированные СУБД предназначены, как правило, для
управления коллекциями отдельных, независимых друг от друга XML-документов.
Гиперссылки между документами и / или фрагментами документов, для определения
которых служат языки XLink и XPointer, средствами большинства из этих систем
не поддерживаются. Однако все-таки имеются системы, располагающие такими
возможностями. Физические указатели, реализующие гиперссылки в среде хранения,
позволяют существенно быстрее осуществлять поиск, формировать производные
документы из взаимосвязанных компонентов.
Как и любая другая система управления базами данных, XML-ориентированная
СУБД должна базироваться на модели данных, определяющей организацию и свой-
ства данных в базе данных, а также доступные пользователям операционные
возможности. Эта модель воплощается в поддерживаемых системой языковых
средствах определения данных и манипулирования данными и / или в языке
запросов.
К сожалению, как уже указывалось, в настоящее время не существует единой
модели данных, на которой основывались бы все стандарты платформы XML.
Одни из этих стандартов содержат спецификации языков, обладающих только
дескриптивными возможностями, и могут тем самым использоваться как языки
определения данных, описывающие те или иные их свойства. К числу таких
стандартов относятся XML DTD, XML Schema, Relax NG. Некоторые другие стандарты,
например язык XSLT, позволяющий описывать трансформации XML-документов, или
XPath, обеспечивающий идентификацию их фрагментов, могут служить языками
запросов в XML-ориентированных СУБД. Консорциум W3C завершил разработку

49
стандарта XQuery, определяющего развитый язык запросов XML-данных, однако,
этот язык не позволяет обновлять данные. В настоящее время в W3C ведется раз-
работка функционального дополнения к XQuery — спецификаций языка XUpdate,
который даст возможность обновлять данные в базах данных XML.
Большинство «чистых» XML-ориентированных СУБД поддерживает какую-либо
комбинацию дескриптивного языка и языка запросов из числа перечисленных
выше.
В некоторых ранних XML-ориентированных СУБД используются также ранее
созданные языки запросов, выступавшие в качестве претендентов на роль стандарта
консорциума W3C — языки XML-QL, XQL и др.
Наряду с интерактивными интерфейсами конечных пользователей для XML-
ориентированных СУБД разработаны также спецификации интерфейсов прикладного
программирования. В частности, для этих целей может использоваться разработанная
консорциумом W3C спецификация объектной модели документов DOM (Document
Object Model) [32]. На ее основе создан ряд реализаций интерфейсов прикладного
программирования, обеспечивающих взаимодействие программ, написанных на
объектных языках, с XML-ориентированными СУБД, поддерживающими указанный
интерфейс. Другая довольно широко распространенная спецификация для рассматри-
ваемых целей — это разработанная в рамках консорциума OASIS спецификация SAX
(Simple API for XML) [19]. Первоначально SAX был предназначен для использования
в Java-программах. Он быстро приобрел популярность и стал стандартом де-факто.
Существующая в настоящее время версия SAX 2.0 применима в среде нескольких
языков программирования.
Указанные средства позволяют оперировать представлениями XML-документов
как иерархическими структурами данных (стандарты платформы XML, языки XPath
и XQL, XUpdate, спецификация SAX) либо их объектными представлениями (стандарт
DOM).
Большое влияние на развитие функциональных возможностей СУБД нового
класса оказывают тенденции интеграции информации, представленной в различных
средах. Так, упоминавшийся выше разработанный консорциумом W3C стандарт DOM,
используемый в качестве спецификации API для XML-ориентированных СУБД, обеспе-
чивает интеграцию ресурсов баз данных XML в объектные среды. Язык запросов XQuery
позволяет оперировать не только XML-данными, но и реляционными данными, а также
данными иерархической структуры. Адаптированные к XML объектно-реляционные
СУБД, которые поддерживают стандарт SQL: 2003, с помощью компонента SQL / XML [33]
смогут, по замыслу его разработчиков, обеспечить совместное использование SQL-
данных и XML-данных. Спецификации SQL / XML позволят определять представление
реляционных схем баз данных и данных SQL в форме XML-документов и наоборот
представление XML-документов и метаданных XML в терминах SQL, представление
операций манипулирования данными SQL (вставка, удаление, обновление) в XML,
а также протоколы передачи данных при совместном использовании SQL и XML.

50
Новые направления и перспективы

2.11. Новые направления и перспективы


За прошедшее десятилетие со времени принятия консорциумом W3C стандарта нового
языка разметки XML усилиями консорциума и других организаций сформированы
ключевые элементы развитой технологической платформы Веб нового поколения,
которые вместе с тем нашли широкое применение и вне рамок Всемирной паутины как
в горизонтальной, так и в вертикальной сфере.
Разработанные стандарты платформы XML обеспечивают средства для пред-
ставления информации, в том числе, метаданных, на разных уровнях информационной
архитектуры Веб, средства для создания действующих в среде Веб агентов (веб-сервисов)
и для их взаимодействия путем обмена сообщениями на основе разработанного про-
токола SOAP, созданы средства трансформации данных и доступа к ним по запросам,
средства обеспечения информационной безопасности. Разработан объектный интерфейс
прикладного программирования к репозиториям XML-документов. Созданы также
базовые стандарты семантического Веб RDF, RDFS, OWL. Предусмотрены механизмы
функционального расширения платформы.
Вместе с тем продолжается работа по развитию самой платформы XML. Она на-
правлена, в частности, на совершенствование уже разработанных стандартов, развитие
функциональных возможностей технологии веб-сервисов. Значительное внимание
уделяется развитию функциональности технологий семантического Веб.
Определились также черты дальнейших поколений Всемирной паутины. В Вебе
следующего поколения будет делаться акцент на развитие его технологий, связанных
с обеспечением предоставления по запросам не информации, а нужных пользователю
сервисов. Появятся возможности для пользователей интеграции отдельных сервисов
различных поставщиков на основе технологий веб-сервисов, а также синтеза целостных
систем из имеющихся веб-сервисов. Наконец, обсуждается направление, связанное
с интеллектуализацией Всемирной паутины на основе технологий семантического Веб
и других новых технологий.
Существенные заделы для развития инновационных направлений в деятельности
консорциума W3C, главной движущей силы в рассматриваемой области, создает учрежден-
ный консорциумом инкубатор новых идей [47], состоящий из нескольких рабочих групп.
Конструктивные предложения этих рабочих групп, учреждаемых на короткие периоды
времени (до одного года), в случае признания их полезности предполагается включать
в стандартный процесс деятельности консорциума по разработке стандартов.
Появились первые результаты деятельности инкубатора. Не случайно, что они
связаны с технологиями семантического Веб, наиболее привлекательного направления
развития Веб в последние годы. В конце марта 2008 г. были опубликованы документы
трех рабочих групп инкубатора. Первый из них [44] — отчет по проблеме нечетких
рассуждений, связанной с представлением и выводом знаний в условиях неполноты,
неопределенности, неоднозначности информации. В отчете представлен анализ со-
стояния дел в рассматриваемой области, существующие подходы к решению данной
проблемы.
Второй документ [27] содержит спецификации предназначенного для использо-
вания в Веб общего для человека и компьютера языка CWL (Common Web Language).
Средствами этого языка могут описываться метаданные и контент страниц Веб для

51
преодоления языкового барьера, существующего в сегодняшнем многоязычном Веб.
Структурирование семантики контента страниц Веб с помощью CWL, позволит, как
полагают авторы, обрабатывать информационное наполнение Веб на семантическом
уровне. Язык CWL независим от конкретных естественных языков, на которых представ-
ляется информация в Веб. Понятия конкретных используемых языков образуют словарь,
который представляется как онтология CWL. В документе представлена инфраструктура
платформы, поддерживающей CWL, рассматриваются конкретные задачи, возникающие
в сообществе пользователей и разработчиков инструментария Веб, которые могут
решаться с использованием CWL.
Третий документ [48], выпущенный инкубатором, предназначен для разработчиков
веб-сервисов, имеющих дело с их повторным использованием и интересующихся
семантическим аннотированием, которое может облегчить решение этих задач.
Документ представляет собой отчет рабочей группы инкубатора по модели испытаний
семантических веб-сервисов. В нем излагаются основные принципы и рекомендуемые
в качестве лучшей практики методологии для оценивания различных методов выполне-
ния функций посредников, обнаружения и композиции веб-сервисов, обеспечивающих
повторное их использование. При этом принимаются во внимание подходы в части
программной инженерии, а также семантического аннотирования.
Можно предполагать, что результаты деятельности рабочих групп инкубатора W3C
будут стимулировать развитие семантических возможностей платформы XML.
Наряду с консорциумом W3C активные разработки в области технологий се-
мантического Веб и, в частности, семантических веб-сервисов, ведутся в рамках
организации Европейская инициатива семантических систем (European Semantic
Systems Initiative, ESSI) [34]. Входящая в ее состав рабочая группа ESSI WSML (ESSI
Web Service Modeling Language) разработала на основе ключевых европейских
проектов в области семантических веб-сервисов проект спецификации языка Web
Services Modeling Language (WSML) [28], позволяющего формально описать онтологию
моделирования веб-сервисов (WSMO). Язык имеет несколько уровней, основанных на
различных логических формализмах — дескриптивной логике, логике первого порядка
и логическом программировании.
Другая рабочая группа — ESSI WSMO (ESSI Web Service Modeling Ontology) раз-
работала описанную на языке WSML онтологию моделирования веб-сервисов WSMO
[29]. Эта формально определенная средствами языка WSML онтология позволяет
описывать различные аспекты семантических веб-сервисов. Для поддержки и ис-
пользования онтологии WSMO разработана эталонная ее реализация, называемая
исполнительной средой моделирования веб-сервисов WSMX (Web Service Modelling
eXecution environment).
Одним из наиболее активных участников развития функциональности плат-
формы XML для вертикальной и горизонтальной сферы является консорциум OASIS
[38], которые разработал и поддерживает комплекс стандартов XML для электрон-
ного бизнеса — UDDI, ebXML, Universal Business Language (UBL) и др. Последние
разработки консорциума в рассматриваемой области — язык описания поведения
бизнес-процессов в терминах веб-сервисов Web Services Business Process Execution
Language v. 2.0 (WS-BPEL), а также стандарт безопасности веб-сервисов WS-Security
и его расширение WS-SecureConversation 1.3.

52
Литература

Заметный вклад в комплекс стандартов XML вносит индустриальный консорциум


Web Services Interoperability Organization (WS-I) [43], который декларировал свою
миссию как обеспечение интероперабельности на стеке спецификаций для веб-
сервисов. Членами консорциума являются компании IBM, Microsoft, BEA Systems, SAP,
Oracle, Fujitsu, Hewlett-Packard и Intel. Для решения поставленной задачи консорциум
разрабатывает профили, примеры приложений, демонстрирующие их использование
и тестовые инструменты, помогающие проверять соответствие конкретных разработок
предлагаемым профилям.

2.12. Заключение
Функциональные возможности разработанной и развиваемой консорциумом W3C
платформы XML вместе с созданным и пополняемым рядом организаций ее окружением
покрывают потребности весьма широкой сферы применения. Большинство конструк-
тивно обеспечивающих эту функциональность стандартов получило статус стандартов
де-факто и активно применяется в разработках электронных правительств в различных
странах. Развитие платформы XML и ее окружения продолжается благодаря усилиям
большого сообщества специалистов.

Литература
1. Буре Р. XML и базы данных // Открытые системы.  2000.  № 10.
2. Веселов В., Долженков А. Опыт построения
XML-СУБД // Открытые системы.  2002.  № 6.
3. Гринев М., Фомичев А., Кузнецов С. Особенности СУБД Sedna. XML-СУБД Sedna:
технические особенности и варианты
использования // Открытые системы.  2004.  № 8.
4. Когаловский М.Р. Перспективные технологии информационных
систем. – М.: ДМК Пресс, Компания АйТи, 2003. – 288 с.
5. Когаловский М.Р. Технологии XML и XML-данные / В кн. Базы данных
и информационные технологии XXI века. Материалы международной
научной конференции, Москва, 29–30 сентября 2003 г. – М.: РГГУ, 2004.
6. Когаловский М.Р. Стандарты XML и электронные библиотеки //
Электронные библиотеки.   2003,  Том 6,  Выпуск 2. http://www.elbib.ru
7. Когаловский М.Р. Энциклопедия технологий баз
данных. – М.: Финансы и статистика, 2002. – 800 с.
8. Когаловский М.Р. XML // ComputerWorld Россия. 2002, №№ 28–29.
9. Когаловский М.Р. Развитие стандартов XML: новые возмож-
ности и применения // В кн. Сб. трудов Второй Всероссийской

53
конференции «Стандарты в проектах современных инфор-
мационных систем», Москва, 27–28 марта 2002 г.
10. Когаловский М.Р. Глоссарий по стандартам платформы XML. Версия 3
(15‑12‑2002). http://www.elbib.ru / index. phtml?
page=elbib / rus / methodology / xmlbase / glossary_XML
11. Когаловский М.Р. Стандарты платформы XML и базы данных
(обзорная лекция) // В кн. Труды Третьей Всероссийской конференции
«Электронные библиотеки: перспективные методы и технологии,
электронные коллекции», Петрозаводск, сентябрь 2001 г.
12. Когаловский М.Р. Функциональные возможности и направления
использования стандартов платформы XML // В кн.
Сб. трудов Всероссийской практической конференции
«Стандарты в проектах современных информационных систем»,
Москва, 2001. – М.: Открытые системы, 2001. – с. 127–133.
13. Когаловский М.Р. XML: возможности и перспективы. Часть
1. Платформа XML и составляющие ее стандарты // Директор
информационной службы. Январь 2001. с. 24–28.
14. Когаловский М.Р. XML: возможности и перспективы. Часть 2.
Базы данных XML, семантика XML-документов, перспективы //
Директор информационной службы. Февраль 2001, с. 16–20.
15. Когаловский М.Р. XML: сферы применения // Директор
информационной службы. Апрель 2001. с. 10–12.
16. Когаловский М.Р. Абстракции и модели в
системах баз данных // СУБД. 1998, № 4–5
17. Новиков Б.А., Хвостиченко Б.С. Индексирование путей
в слабоструктурированных данных // В кн. Труды четвертой
Всероссийской конференция RCDL’2002. Дубна, 2002.
18. Цикритзис Д., Лоховский Ф. Модели данных. – 
М.: Финансы и статистика, 1986.
19. About SAX (Simple API for XML). http://www.saxproject.org / 
20. ANSI / NISO Z39.85–2001. The Dublin Core Metadata Element Set.
http://www.niso.org / standards / resources / Z39-85.pdf
21. Barashev D, Novikov B. Indexing XML to Support Path Expressions. Proc.
of the 6th East-European Conference on Advances in Databases and
Information Systems (ADBIS’2002). Bratislava, Slovenia, September 2002.
22. Berners-Lee T., Hendler J., and Lassila O. The Semantic Web. Scientific
American. May 2001.
http://www.sciam.com / article. cfm? id=the-semantic-web

54
Литература

23. Berners-Lee T., Fielding R., Irvine U. C., Masinter L. Uniform Resource


Identifiers (URI): General Syntax. RFC 2396. August 1998.
24. Bosak J., Bray T. XML and the Second-Generation Web. Scientific American.
May 1999. http://www.sciam.com / article. cfm? id=xml-and-the-second-genera
25. Bourret R. XML and Databases. September 2005.
http://www.rpbourret.com / xml / XMLAndDatabases. htm
26. Bourret R. XML Database Products. March 13, 2007.
http://www.rpbourret.com / xml / XMLDatabaseProds. htm
27. Common Web Language. W3C Incubator Group Report 31 March 2008.
http://www.w3.org / 2005 / Incubator / cwl / XGR-cwl-20080331 / 
28. D16.1 v0.21 The Web Service Modeling Language WSML. WSML Final Draft 5
October 2005. Final version.
http://www.wsmo.org / TR / d16 / d16.1 / v0.21 / 20051005 / 
29. D2 v1.0. Web Service Modeling Ontology (WSMO). WSMO Working Draft 20
September 2004. Final version:
http://www.wsmo.org / 2004 / d2 / v1.0 / 20040920 / 
30. DAML. DARPA Agent Markup Language. http://www.daml.org / 
31. DAML+OIL (March 2001) Reference Description. W3C Note 18
December 2001. http://www.w3.org / TR / 2001 / NOTE-
daml+oil-reference-20011218
32. Document Object Model (DOM) Level 3 Core Specification. Version 1.0. W3C
Recommendation 07 April 2004.
http://www.w3.org / TR / 2004 / REC–DOM–Level-3‑Core-20040407
33. Eisenberg A., Melton J. SQL / XML is Making Good Progress.
SIGMOD Record, Vol. 31, No. 2, June 2002.
34. European Semantic Systems Initiative.
http://www.essi-cluster.org / about-essi / essi-home / 
35. Extensible Markup Language (XML) 1.1 (Second Edition). W3C
Recommendation. 16 August 2006, edited in place 29 September
2006. http://www.w3.org / TR / 2006 / REC-xml11-20060816
36. Gruber T. A translation approach to portable ontology specifica-
tions. Knowledge Acquisition, 5 (2), 1993, pp. 199–220.
37. ISO 8879:1986. Information Processing – Text and Office
Systems – Standard Generalized Markup Language (SGML), 1986.
38. OASIS. http://www.oasis-open.org
39. RDF Vocabulary Description Language 1.0: RDF Schema. W3C Recommendation
10 February 2004. http://www.w3.org / TR / 2004 / REC-rdf-schema-20040210 / 

55
40. Resource Description Framework (RDF): Concepts and Abstract Syntax.
W3C Recommendation 10 February 2004.
http://www.w3.org / TR / 2004 / REC-rdf-concepts-20040210 / 
41. Robie J., Lapp J., Schash D. XML Query Language (XQL).
The W3C Query Languages Workshop. December 3–4, 1998. Boston,
Massachusets. http://www.w3.org / TendS / QL / QL98 / pp / xql. html
42. SHOE – Simple HTML Ontology Extensions. Parallel Understanding
Systems Group. Department of Computer Science. University of Maryland
at College Park. http://www.cs.umd.edu / projects / plus / SHOE / 
43. The Web Services Interoperability Organization (WS-I). http://www.ws-i.org / 
44. Uncertainty Reasoning for the World Wide Web. W3C Incubator Group Report 31
March 2008. http://www.w3.org / 2005 / Incubator / urw3 / XGR-urw3-20080331 / 
45. XHTML 1.0. The Extensible HyperText Markup Language (Second Edition).
A Reformulation of HTML 4 in XML 1.0. W3C Recommendation 26 January 2000,
revised 1 August 2002. http://www.w3.org / TR / 2002 / REC-xhtml1-20020801
46. XML Base. W3C Recommendation 27 June 2001.
http://www.w3.org / TR / 2001 / REC-xmlbase-20010627 / 
47. W3C Incubator Activity. http://www.w3.org / 2005 / Incubator / 
48. W3C SWS Challenge Testbed Incubator Methodology Report. W3C Incubator
Group Report 31 March 2008.
http://www.w3.org / 2005 / Incubator / swsc / XGR-SWSC-20080331 / 
49. Web Ontology (WebONT) Working Group.
http://www. w3.org / 2001 / sw / WebOnt
50. Welcome to OIL. http: //www.ontoknowledge. org/oil/

56


3. Краткие метаописания стандартов


В данном разделе приводятся краткие описания более 60 основных стандартов
платформы XML и ее окружения, в том числе фундаментальных стандартов плат-
формы, составляющих ее концептуальную, синтаксическую и архитектурную (в
аспекте архитектуры информации и данных) основу. К числу фундаментальных мы
относим стандарты консорциума W3C: Extensible Markup Language, XML Information
Set и Namespaces in XML. Мы называем окружением платформы XML совокупность
стандартов, формально к комплексу стандартов XML не относящихся, поскольку они
не соответствуют синтаксису языка XML или разработаны не консорциумом W3C, но
допускающих совместное использование со стандартами платформы.
Большинство описанных ниже стандартов широко используется в проектах
электронного правительства и других предметных областях. Они разработаны
консорциумом W3C, ISO, Internet Engineering Task Force (IETF), консорциумом
OASIS, различными группами крупных индустриальных компаний – разработчиков
программного обеспечения и средств вычислительной и коммуникационной техники,
а также другими организациями. Некоторые из описываемых стандартов находятся
в стадии разработки.
Метаописания стандартов представлены здесь в формате, основанном на рас-
ширенном наборе элементов метаданных Дублинского ядра. Описания приведены в
алфавитном порядке полных наименований рассматриваемых стандартов. Краткие
наименования, используемые в текстах спецификаций стандартов и в литературных
источниках, приведены в качестве заголовков соответствующих метаописаний.
Для того чтобы облегчить читателю поиск описаний интересующих его стан-
дартов, можно воспользоваться указателем, содержащимся в разделе 5.

57
W3C WWW Architecture

W3C WWW Architecture


Наименование Значение элемента метаописания
элемента
метаописания
Название Architecture of the World Wide Web, Volume One
Альтернативное Архитектура Веб, том 1
название
Язык Английский
Описание Задача стандарта заключается в четком определении основных
архитектурных принципов, на которых базируются технологии
Веб. Эти технологии, несмотря на их простоту, обеспечивают мас-
штабируемость, эффективность и практичность, представляющие
собой именно те свойства, которые способствуют интенсивному
развитию Веб.
К числу определяемых данным стандартом принципов относятся
идентификация ресурсов, представление состояния ресурсов,
а также протоколы, которые обеспечивают взаимодействия между
агентами и ресурсами Веб.
Формат документа HTML
Создатель W3C
Издатель W3C
Доступность Свободно доступен
документа
Источник http://www.w3.org / TR / webarch / 
Охват Архитектура Веб
Уровень Технологическая архитектура
архитектуры ЭП
Аспект Аспект информации и данных, аспект ин-
архитектуры ЭП теграции и взаимодействия
Технологический Сервисы управления данными, сервисы обмена данными
сервис ЭП
Вид документа Стандарт
Статус документа Принят

58
Краткие метаописания стандартов BPEL4WS

BPEL4WS
Наименование Значение элемента метаописания
элемента
метаописания
Название Business Process Execution Language for Web
Services Specification (BPEL4WS). Version 1.1
Альтернативное Язык BPEL4WS описания исполнения бизнес-процессов
название для спецификации веб-сервисов, версия 1.1
Язык Английский
Описание Настоящий документ определяет нотацию для описания исполне-
ния бизнес-процессов, основанных на веб-сервисах. Процессы
в BPEL4WS выполняют функции экспорта и импорта данных, ис-