Академический Документы
Профессиональный Документы
Культура Документы
Лекции
В идеале работа аналитиков и руководителей различных уровней должна быть организована так, чтобы
они могли иметь доступ ко всей интересующей их информации и пользоваться удобными и простыми
средствами представления и работы с этой информацией. Именно на достижение этих целей и
направлены информационные технологии, объединяющиеся под общим названием хранилищ данных и
бизнес-анализа.
Подсистема
информационно-
поискового
анализа
(СУБД,SQL)
Подсистема
Подсистема хранения оперативного
Подсистема ввода
информации (СУБД и/или анализа (OLAP)
(СУБД – OLTP)
ХД)
Подсистема анализа
Для предоставления необходимой для принятия решений информации обычно приходится собирать
данные из нескольких транзакционных баз данных различной структуры и содержания. Основная
проблема при этом состоит в несогласованности и противоречивости этих баз-источников, отсутствии
единого логического взгляда на корпоративные данные.
Поэтому для объединения в одной системе OLTP и СППР для реализации подсистемы хранения
используются концепция хранилищ данных (ХД). В основе концепции ХД лежит идея разделения данных,
используемых для оперативной обработки и для решения задач анализа, что позволяет оптимизировать
структуры хранения. ХД позволяет интегрировать ранее разъединенные детализированные данные,
содержащиеся в исторических архивах, накапливаемых в традиционных OLTP-системах, поступающих из
внешних источников, в единую базу данных, осуществляя их предварительное согласование и, возможно,
агрегацию.
2
1.1.3. Физические и виртуальные хранилища данных
При загрузке данных из OLTP-системы в ХД происходит дублирование данных. Однако в ходе этой загрузки
данные фильтруются, поскольку не все из них имеют значение для проведения процедур анализа. В ХД
хранится обобщенная информация, которая в OLTP-системе отсутствует.
Оператор Аналитические
запросы
Оператор Аналитик
Данные
Оператор Подсистема
хранения информации
Внешний источник
данных
Избыточность информации можно свести к нулю, используя виртуальное ХД. В такой системе данные из
OLTP-системы не копируются в единое хранилище. Они извлекаются, преобразуются и интегрируются
непосредственно при выполнении аналитических запросов в режиме реального времени. Фактически
такие запросы напрямую передаются к OLTP-системе.
Аналитические
запросы
Подсистема ввода Оперативный
Витрина данных Подсистема
(OLTP) источник данных
Данные
анализа
Оператор
Аналитик
Оператор Подсистема
хранения информации
Внешний источник
данных
4
многократное хранение одних и тех же данных в различных ВД и отсутствие консолидированности на
уровне предметной области.
Возможно также совмещение ХД и ВД в рамках одной СППР. ХД в этом случае представляет собой единый
источник данных для всей предметной области, а ВД являются подмножествами данных из хранилища,
организованными для представления информации по тематическим разделам данной области. В том
случае, если пользователю, для которого создавалась ВД, содержащихся в ней данных недостаточно, то он
может обратиться к ХД (Рисунок 4).
Аналитические
запросы
Подсистема ввода Оперативный
Витрина данных Подсистема
(OLTP) источник данных
Данные
анализа
Оператор
Аналитик
Аналитические
Оператор запросы
Витрина данных
Подсистема
анализа
Данные
Подсистема ввода Оперативный
(OLTP) источник данных Аналитик
Оператор Подсистема
хранения информации
Внешний источник
данных
Достоинствами такого решения являются простота создания и наполнения ВД, поскольку наполнение
происходит из единого стандартизированного источника очищенных данных – из ХД, простота расширения
за счет добавления новых ВД, а также снижение нагрузки на основное ХД.
Недостатки заключаются в избыточности, так как данные хранятся и в ХД, и в ВД, а также дополнительные
затраты на разработку СППР с ХД и ВД.
обобщения
(OLTP) источник данных
Поток
Обратный Агрегирован-
поток ные данные
Оператор Аналитические
запросы
метаданных
Аналитик
Архивный
Оператор
поток
Поток
Данные
Хранилище данных
Оператор Подсистема
хранения информации
Внешний источник
данных
Рисунок 5. Архитектура ХД
6
входной поток – образуется данными, копируемыми из OLTP-систем в ХД; данные при этом часто
очищаются и обогащаются путем добавления новых атрибутов;
Измерение
Измерение
Мера
Измерение
Рисунок 6. Гиперкуб
7
На пересечении осей измерений располагаются данные, количественно характеризующие анализируемые
факты – меры, например, объемы продаж, выраженные в единицах продукции.
В простейшем случае двумерного куба получается таблица, показывающая значения уровней продаж по
товарам и месяцам.
Точно так же в рамках измерения «География» можно ввести уровни «Страна», «Регион», «Область» и
«Город».
Рисунок 7. Срез
8
2. Вращение (Рисунок 8) – изменение расположения измерений, представленных в отчете или на
отображаемой странице. Например, операция вращения может заключаться в перестановке
местами строк и столбцов таблицы. Кроме того, вращением куба данных является перемещение
внетабличных измерений на место измерений, представленных на отображаемой странице, и
наоборот.
Измерение 2
Измерение 1
Измерение 2
Измерение 1
Измерение 3
Измерение 3
Рисунок 8. Вращение
Консолидация (Рисунок 9) и детализация (Рисунок 10) – операции, которые определяют переход вверх по
направлению от детального представления данных к агрегированному и наоборот, соответственно.
Направление детализации (обобщения) может быть задано как по иерархии отдельных измерений, так и
согласно прочим отношениям, установленным в рамках измерений или между измерениями.
Рисунок 9. Консолидация
9
Рисунок 10. Детализация
Например, если при анализе данных о продажах в Северной Америке выполнить операцию детализации
для измерения «Регион», то будут отображены такие элементы, как «Канада», «Восточные штаты США» и
«Западные штаты США». В результате дальнейшей детализации элемента «Канада» будут отображены
элементы «Торонто», «Ванкувер» и т.д.
3. факты, связанные с элементами документа (Line-item facts). Основаны на том или ином документе
(например, счете за товар или услуги) и содержат подробную информацию об элементах этого
документа (например, количестве, цене, проценте скидки);
4. факты, связанные с событиями или состоянием объекта (Event or state facts). Представляют
возникновение события без подробностей о нем (например, просто факт продажи или факт
отсутствия таковой без иных подробностей).
Таблица фактов, как правило, содержит уникальный составной ключ, объединяющий первичные ключи
таблиц измерений. Чаще всего это целочисленные значения либо значения типа «дата/время» — ведь
таблица фактов может содержать сотни тысяч или даже миллионы записей, и хранить в ней
повторяющиеся текстовые описания, как правило, невыгодно — лучше поместить их в меньшие по объему
таблицы измерений. При этом как ключевые, так и некоторые неключевые поля должны соответствовать
будущим измерениям OLAP-куба. Помимо этого таблица фактов содержит одно или несколько числовых
полей, на основании которых в дальнейшем будут получены агрегатные данные.
10
Для многомерного анализа пригодны таблицы фактов, содержащие как можно более подробные данные
(то есть соответствующие членам нижних уровней иерархии соответствующих измерений). В данном
случае предпочтительнее взять за основу факты продажи товаров отдельным заказчикам, а не суммы
продаж для разных стран — последние все равно будут вычислены OLAP-средством.
В таблице фактов нет никаких сведений о том, как группировать записи при вычислении агрегатных
данных. Например, в ней есть идентификаторы продуктов или клиентов, но отсутствует информация о том,
к какой категории относится данный продукт или в каком городе находится данный клиент. Эти сведения, в
дальнейшем используемые для построения иерархий в измерениях куба, содержатся в таблицах
измерений.
Пример фрагмента схемы данных хранилища данных AdventureWorks приведен на Рисунок 11.
В приведенной схеме данных таблица FactInternetSales является таблицей фактов и содержит сведения о
продажах через Интернет в разрезе товаров, дат, валют, рекламы, клиентов и территории. Перечень
столбцов таблицы и их типов данных приведен на Рисунок 12.
11
Рисунок 12. Столбцы таблицы FactInternetSales и их типы данных
Каждая таблица измерений должна находиться в отношении «один ко многим» с таблицей фактов.
Отметим, что скорость роста таблиц измерений должна быть незначительной по сравнению со скоростью
роста таблицы фактов; например, добавление новой записи в таблицу измерений, характеризующую
товары, производится только при появлении нового товара, не продававшегося ранее.
12
Так, в приведенном выше примере одной из таблиц измерений является таблица DimCustomer,
содержащая редко изменяемые сведения о клиентах. Состав ее столбцов и их типы данных приведены на
Рисунок 13.
13
Произвольные Многомерный
Отчеты Data Mining
запросы анализ
Витрина Витрина
данных данных
Хранение
данных
Хранилище
данных
Извлечение,
Извлечение, преобразование и загрузка преобразование
и загрузка
данных
Источники
данных
Рисунок 14. Архитектура корпоративной OLAP-системы
хранение данных;
анализ данных.
14
Данные поступают из различных внутренних OLTP-систем, от подчиненных структур, от внешних
организаций в соответствии с установленным регламентом, формами и макетами отчетности. Вся эта
информация проверяется, согласуется, преобразуется и помещается в хранилище и витрины данных. После
этого пользователи с помощью специализированных инструментальных средств получают необходимую
им информацию для построения различных табличных и графических представлений, прогнозирования,
моделирования и выполнения других аналитических задач.
С системно-технической точки зрения данный слой представлен ЛВС всех подразделений всех уровней, к
которым подключены специализированные технические комплексы, хранящие информацию, чаще всего
реализованные в виде реляционных СУБД.
Согласование данных необходимо и при загрузке данных из одного источника. Дело в том, что в
хранилище хранятся исторические данные, т.е. данные за достаточно большой промежуток времени. В
оперативной системе данные хранятся в целостном виде за ограниченный промежуток, после чего они
отправляются в архив. При изменениях в структуре или собственно данных архивы не подвергаются
никакой дополнительной обработке, а хранятся в исходном виде. Следовательно, при необходимости
иметь данные за достаточно большой период времени необходимо согласовывать архивную информацию
с текущей.
ХД чаще всего реализуется в виде реляционной БД, работающей под управлением достаточно мощной
реляционной СУБД. Такая СУБД должна поддерживать эффективную работу с терабайтными объемами
информации, иметь развитые средства ограничения доступа, обеспечивать повышенный уровень
надежности и безопасности, соответствовать необходимым требованиям по восстановлению и архивации.
1. стандартная отчетность;
2. нерегламентированные запросы;
Каждая из этих технологий имеет свои особенности, определенный набор типовых задач и должна
поддерживаться специализированной инструментальной средой.
Надстройки к пакету приложений Microsoft Office для извлечения и обработки данных представляют собой
ряд функций, обеспечивающих доступ к возможностям извлечения и обработки данных из приложений
Microsoft Office, и тем самым позволяющих осуществлять прогностический анализ на локальном
компьютере. Благодаря тому, что встроенные в службы платформы Microsoft SQL Server алгоритмы
извлечения и обработки данных доступны из среды приложений Microsoft Office, бизнес-пользователи
могут легко извлекать ценную информацию из сложных наборов данных всего несколькими щелчками
мыши. Надстройки к пакету приложений Office для извлечения и обработки данных дают конечным
пользователям возможность выполнять анализ непосредственно в приложениях Microsoft Excel и Microsoft
Visio.
1. клиент извлечения и обработки данных для Excel позволяет создавать проекты извлечения и
обработки данных на базе служб SSAS и управлять ими из Excel 2007;
2. средства анализа таблиц для приложения Excel позволяют использовать встроенные в службы SSAS
функции извлечения и обработки информации для анализа данных, хранящихся в таблицах Excel;
На Рисунок 15 изображена сводная таблица Excel, используемая для доступа клиентов к данным служб
аналитики.
17
Рисунок 15. Сводная таблица Excel 2007
С помощью приложения Microsoft Office Visio можно аннотировать, дополнять и отображать графические
представления результатов извлечения и обработки данных. Платформа SQL Server 2008 в сочетании с
приложением Visio 2007 позволяет:
2. сохранять модели извлечения и обработки данных в виде документов Visio, внедренных в другие
документы приложений Office или сохраненных в виде веб-страниц.
Клиентские OLAP-средства применяются, как правило, при малом числе измерений (обычно
рекомендуется не более шести) и небольшом разнообразии значений этих параметров, — ведь
полученные агрегатные данные должны умещаться в адресном пространстве подобного средства, а их
количество растет экспоненциально при увеличении числа измерений. Поэтому даже самые примитивные
клиентские OLAP-средства, как правило, позволяют произвести предварительный подсчет объема
требуемой оперативной памяти для создания в ней многомерного куба.
18
базируются именно на серверных OLAP-средствах, например, таких как Oracle Database Server и Microsoft
SQL Server.
Oracle Business Intelligence (BI) – это самый обширный комплекс технологий и приложений для обеспечения
представления внутренней организации бизнеса, включающий ведущие BI-приложения, технологические
BI-платформы и хранилища данных.
1. описание различных источников данных. В качестве источников данных могут быть практически
любые СУБД, как реляционные (Oracle, Microsoft SQL Server, Microsoft Analysis Services, IBM DB2), так
и многомерные (MS AS, Hyperion Essbase или SAP BW), а также ODBC источники, текстовые файлы и
т.д.
С другой стороны, BI Server сам виден в сети как ODBC источник и позволяет делать к себе запросы с
помощью любого инструмента или программы, работающей с ODBC. При этом этот сервер остается
виртуальным, так как данные на нем не хранятся, а собираются в момент запроса. Аналитический сервер
позволяет использовать хранилище как источник данных, одновременно с OLTP системами.
19
Общий перечень продуктов Oracle, необходимых для реализации технологии хранилищ данных и
аналитических приложений, приводится в Таблица 1 соответствии с выделенными ранее уровнями
(Рисунок 14).
Oracle WorkFlow
Существует три основных способа реализации многомерной модели – MOLAP, ROLAP, HOLAP.
1.11.1. MOLAP
MOLAP (Multidimensional OLAP) – для реализации многомерной модели используются многомерные БД.
При этом данные хранятся в виде упорядоченных многомерных массивов. Такие массивы подразделяются
на гиперкубы, в которых все хранимые в БД ячейки имеют одинаковую мерность, и поликубы, в которых
каждая ячейка хранится с собственным набором измерений. Физически данные хранятся в «плоских»
файлах, при этом куб представляется в виде одной плоской таблицы, в которую построчно вписываются все
комбинации элементов всех измерений с соответствующими им значениями мер (Рисунок 16).
Измерения Меры
21
делают выполнение этих задач на основе реляционных БД достаточно сложным, а иногда и
невозможным.
Недостатки MOLAP:
объем исходных данных для анализа не слишком велик (не более нескольких гигабайт), т. е.
уровень агрегации данных достаточно высок;
1.11.2. ROLAP
ROLAP (Relational OLAP) – для реализации многомерной модели используются реляционные БД.
Если каждое измерение содержится в одной таблице, такая схема хранилища данных носит название
«звезда» (star schema). Если же хотя бы одно измерение содержится в нескольких связанных таблицах,
такая схема хранилища данных носит название «снежинка» (snowflake schema). Дополнительные таблицы
измерений в такой схеме, обычно соответствующие верхним уровням иерархии измерения и находящиеся
в соотношении «один ко многим» в главной таблице измерений, соответствующей нижнему уровню
иерархии, иногда называют консольными таблицами (outrigger table).
22
Сотрудник
PK ID_Сотрудника
Имя_Сотрудника
Продажи Клиент
Время
PK ID_Время
Время
День_недели
Поставщик
Месяц
Год PK ID_Поставщика
Квартал
Название_Поставщика
23
Сотрудник1
PK ID_Сотрудника
Категория
PK ID_Категории Имя_Сотрудника
Название_Категории
Продажи1 Клиент1
PK,FK1 ID_Продукта PK ID_Клиента
PK,FK1 ID_Категории
Продукт1 PK,FK2 ID_Сотрудника Название_компании
PK ID_Продукта PK,FK3 ID_Клиента Контактное_лицо
PK,FK1 ID_Категории PK,FK5 ID_Поставщика Адрес
PK,FK4 ID_Время Город
Название_Продукта Регион
Цена Количество Телефон
Сумма
Скидка
Время1
PK ID_Время
Время
День_недели
Поставщик1
Месяц
Год PK ID_Поставщика
Квартал
Название_Поставщика
24
в случае переменной размерности задачи, когда изменения в структуру измерений приходится
вносить достаточно часто, ROLAP-системы с динамическим представлением размерности являются
оптимальным решением, т. к. в них такие модификации не требуют физической реорганизации БД;
реляционные СУБД обеспечивают значительно более высокий уровень защиты данных и хорошие
возможности разграничения прав доступа.
1.11.3. HOLAP
HOLAP (Hybrid OLAP) - для реализации многомерной модели используются и многомерные, и реляционные
БД. HOLAP-серверы используют гибридную архитектуру, которая объединяет технологии ROLAP и MOLAP. В
отличие от MOLAP, которая работает лучше, когда данные более-менее плотные, серверы ROLAP
показывают лучшие параметры в тех случаях, когда данные довольно разрежены. Серверы HOLAP
применяют подход ROLAP для разреженных областей многомерного пространства и подход MOLAP — для
плотных областей. Серверы HOLAP разделяют запрос на несколько подзапросов, направляют их к
соответствующим фрагментам данных, комбинируют результаты, а затем предоставляют результат
пользователю.
Компонент Описание
25
анализа и построения отчетов.
2.1.2. UDM
SSAS построены на основе Унифицированной Многомерной Модели (Unified Dimensional Model, UDM),
появившейся в версии 2005, которая позволяет различным типам клиентских приложений получать доступ
к данным как из реляционных, так и из многомерных баз данных без использования отдельных моделей
для каждого типа баз данных.
Основой UDM является архитектура измерений на основе атрибутов. Архитектура измерений на основе
атрибутов дает возможность группировать свойства (атрибуты), определяющие функционирование
бизнеса, в одно измерение и отделить эти свойства от правил навигации по измерению — иерархий.
UDM предоставляет возможность использовать множество источников данных (data sources) для создания
многомерной модели.
Модель UDM может быть использована для создания единого представления реляционных и
многомерных данных, включающих бизнес-объекты, бизнес-аналитику, вычисления и метрики.
Модель UDM создает промежуточный логический уровень между физической реляционной базой данных,
используемой в качестве источника данных, и фирменными структурами куба и измерений,
используемыми для обработки пользовательских запросов. Таким образом, модель UDM можно
представить себе как ядро системы OLAP. Одним из ключевых преимуществ модели UDM является
возможность сочетать гибкость и функциональное богатство традиционной реляционной модели
генерации отчетов с мощными аналитическими средствами и превосходной производительностью
классической модели системы OLAP. В эту модель включен широкий спектр функций бизнес-аналитики,
позволяющих эффективнее осуществлять реляционный и OLAP-анализ, и дающих организациям
26
возможность расширять свои решения с использованием механизма ключевых показателей эффективности
KPI, а также сложных функций прогностического анализа.
Чтобы обеспечить работу большого количества пользователей, избежать конфликтов при пользовании
ресурсами и снизить затраты, имеется возможность горизонтального масштабирования служб SSAS.
Горизонтальное масштабирование заключается в наращивании вычислительных мощностей и емкости
хранилищ данных с целью хранения и синхронизации нескольких версий данных, но в то же время службы
SSAS позволяют организовать общий доступ для чтения информации из одной базы данных служб с
нескольких серверов, устраняя необходимость в избыточных ресурсах.
Кубы служб SSAS — это многомерные структуры, обеспечивающие высокоскоростной доступ к большим
объемам предварительно объединенных данных, и позволяющие конечным пользователям получать
интересующие их бизнес-данные в реальном времени. В службах SSAS хранятся бизнес-данные в формате
MOLAP, предоставляющем возможность высокой степени оптимизации и сжатия . Присущая этому
формату гибкость дает также возможность частично или полностью хранить данные в реляционной базе
данных в режиме реляционного OLAP (ROLAP) или в смешанном режиме, называемом гибридным OLAP
(HOLAP). Режим MOLAP обеспечивает значительно более высокую производительность, чем режимы
ROLAP и HOLAP.
Microsoft Office Excel 2007 дает возможность просматривать данные, хранящиеся в OLAP-кубах SSAS
путем построения динамических представлений Microsoft PivotTable, что не требует установки
дополнительного программного обеспечения;
Microsoft Office Word 2007, как и Microsoft Office Excel 2007, позволяют просматривать отчеты,
генерируемые при помощи Reporting Services;
Microsoft Office Visio 2007 позволяет визуализировать деревья решений, деревья зависимостей,
кластерные диаграммы и другие модели технологии data mining;
Microsoft Office SharePoint Server позволяет создать единый пользовательский интерфейс для
просмотра и управления отчетами, генерируемыми при помощи Reporting Services.
27
2.1.6. Локализация решения посредством использования переводов
Часто возникает необходимость разработки многоязыковых решений. Как правило, сами данные едины
для всего мира, но метаданные — куб, меры, наименования и уровни измерений, ключевые показатели
эффективности (KPI) будут своими для каждого используемого языка. Переводы позволяют задавать
различные значения метаданных для разных языков и приспосабливать решения для работы в
международном контексте. Финансовую информацию также необходимо локализировать для
представления результатов в надлежащей валюте. Предусмотренные в службах SSAS возможности
перевода и автоматического конвертирования валют позволяют отображать локализованные данные
анализа на родном языке пользователей.
BI Dev Studio интегрируется в оболочку Visual Studio, что позволяет создавать дополнительные типы
проектов для SSAS (Рисунок 20);
28
Рисунок 20. Типы проектов для Analysis Services
При помощи среды BI Dev Studio можно создавать проекты служб SSAS, содержащие определения
объектов (кубов, измерений и т.д.) служб SSAS, которые хранятся в XML-файлах, содержащих элементы
языка сценариев служб SSAS (ASSL). Эти проекты содержатся в решениях, где также содержатся проекты из
других компонентов SQL Server, включая службы SQL Server Integration Services и SQL Server Reporting
Services.
В среде BI DevStudio можно разрабатывать проекты служб SSAS как часть решения, которое не зависит от
какого-либо конкретного экземпляра служб SSAS. Во время разработки объекты могут быть развернуты на
экземпляре на тестовом сервере с целью проверки, после чего этот же проект служб SSAS может быть
использован для развертывания объектов в экземплярах на одном или нескольких промежуточных или
рабочих серверах.
В BI Dev Studio входит средство оповещения Best Practice Design Alerts , автоматически информирующее о
возможных недочетах в проекте на ранних стадиях процесса разработки, и сокращающее потери времени,
вызванные проектными ошибками, что существенно ускоряет разработку.
2.2.2. SSMS
SQL Server Management Studio (SSMS) – инструмент, предназначенный для администраторов баз данных,
позволяющий управлять многомерными объектами, созданными разработчиками баз данных (Рисунок 21).
SSMS позволяет администрировать Analysis Services, SQL Server, Reporting Services и Integration Services в
единой консоли, которая объединяет функциональность управления, редактирования запросов и
настройки производительности.
29
Рисунок 21. SSMS
При помощи среды SQL Server Management Studio можно управлять объектами служб Analysis Services
(выполнять резервное копирование, обработку и т. д.), а также создавать новые объекты непосредственно
в существующем экземпляре служб Analysis Services с помощью сценариев XML для аналитики. Среда SQL
Server Management Studio представляет проект сценариев сервера анализа данных, в котором можно
разрабатывать и сохранять сценарии, написанные на языках многомерных выражений, расширений
интеллектуального анализа данных и XML для аналитики (XMLA). Обычно проекты сценариев сервера
анализа данных используются для выполнения задач по управлению или для повторного создания
объектов, например: баз данных или кубов, в экземплярах служб Analysis Services.
30
3. Планирование и архитектура SSAS
Серверный компонент служб SSAS реализован в виде службы Microsoft Windows. Службы SQL Server
Analysis Services поддерживают работу нескольких экземпляров на одном компьютере, при этом каждый
экземпляр служб SSAS реализован как отдельный экземпляр службы Windows.
Клиенты обмениваются данными со службами SSAS с помощью общедоступного стандарта XML для
аналитики (XMLA), который представляет собой протокол на базе SOAP для выполнения команд и
получения ответов и предоставляется в виде веб-службы. Поэтому каждый экземпляр SSAS является Web-
сервисом.
Клиентские модели объектов также предоставляются через XML для аналитики, и доступ к ним
производится через управляемый поставщик, например ADOMD.NET, или через собственный поставщик
OLE DB.
Также службы SSAS поддерживают ядро локального куба, которое позволяет приложениям на
отключенных клиентах просматривать локально хранимые многомерные данные.
Экземпляр служб SSAS может содержать несколько баз данных, а в базе данных могут одновременно
присутствовать объекты OLAP и объекты интеллектуального анализа данных. Приложения подключаются к
указанному экземпляру служб SSAS и к указанной базе данных. На серверном компьютере может
эксплуатироваться несколько экземпляров служб SSAS. Экземпляры служб SSAS именуются как
«<ИмяСервера>\<ИмяЭкземпляра>». На Рисунок 7 показаны все упомянутые связи между объектами служб
SSAS.
31
Рисунок 22. Связи между объектами служб SSAS
Основные классы представляют собой минимальный набор объектов, требуемый для формирования куба.
Этот минимальный набор объектов включает измерение, группу мер и секцию. Определение
статистической обработки является необязательным.
Атрибут – это полная коллекция элементов одного типа. Например, все дни недели будут атрибутом
измерения «Время».
Иерархии формируются с использованием упорядоченного набора атрибутов, такого, что каждый атрибут
соответствует одному из уровней в иерархии.
Кубы создаются на основе измерений и групп мер. Начиная с Analysis Services 2005, поддерживается
множество фактов в одном кубе. Меры из таблицы фактов группируются в группу мер. Куб может иметь
несколько групп мер.
Группы мер — это коллекции мер, которые имеют одно и то же представление источника данных и одно и
то же подмножество измерений в кубе. Группа мер имеет одну или несколько секций, предназначенных
для управления физическими данными. Группа мер может иметь применяемую по умолчанию
статистическую схему.
Статистическая схема по умолчанию может использоваться во всех секциях в группе мер; кроме того,
каждая секция может иметь собственную статистическую схему.
Каждый экземпляр служб SSAS рассматривается как отдельный объект сервера. Каждый отдельный
экземпляр подключается к объекту Server с помощью отдельного соединения. Каждый объект сервера
32
содержит один или несколько источников данных, представление источника данных и объекты базы
данных, а также сборки и роли безопасности.
Каждый объект базы данных содержит несколько объектов измерения. Каждый объект измерения
содержит один или несколько атрибутов, которые организованы в виде иерархий.
Каждый объект базы данных содержит один или несколько объектов куба. Куб задается его мерами и
измерениями. Меры и измерения куба выводятся из таблиц и представлений в представлении источника
данных, на котором основан куб или который создан из определений мер и измерений.
Пример
Куб «Импорт» (Рисунок 23) содержит две меры («Пакеты» и «Последняя дата») и три связанных измерения
(«Маршрут», «Источник» и «Время»).
По осям куба отложены элементы измерений. Примеры элементов — «Наземный» (элемент измерения
«Маршрут»), «Африка» (элемент измерения «Источник») и «1-й квартал» (элемент измерения «Время»).
Значение в ячейках куба представляют две меры — «Пакеты» и «Последняя дата». Мера «Пакеты»
представляет число импортированных посылок; для статистической обработки фактов используется
функция Sum. Мера «Последняя дата» представляет собой дату получения; для статистической обработки
используется функция Max.
Измерение «Маршрут» представляет пути, которыми импортируемый товар достигает своего назначения.
В число элементов этого измерения входят «наземный», «не наземный», «воздушный», «морской»,
«дорожный» и «железнодорожный». Измерение «Источник» представляет место производства
импортируемого товара, например Азию или Африку. Измерение «Время» представляет кварталы и
полугодия.
33
Пользователи куба могут определять значения его мер для каждого элемента в каждом измерении
независимо от уровня элемента в измерении, поскольку службы SSAS вычисляют значения верхних
уровней по мере необходимости.
Например, значения меры на Рисунок 23 могут быть вычислены в соответствии с обычной календарной
иерархией с использованием иерархии «Календарное время» в измерении «Время», как показано на
Рисунок 24.
Меры, атрибуты и иерархии в примере куба выводятся из следующих столбцов таблиц фактов и измерений
куба (Таблица 3).
34
Атрибут Африка, Азия, Австралия, SourceDimensionTable Континент Европа
«Континент» в Европа, Северная Америка,
измерении Южная Америка
«Источник»
Приведенный пример представляет простой куб, в том смысле, что это куб с единственной группой мер, а
все таблицы измерений соединены с таблицей фактов по схеме «звезда». Другая схема — это схема
«снежинка», в которой одна или несколько таблиц измерений присоединяются к другой таблице
измерения, а не напрямую к таблице фактов.
В приведенном здесь примере содержится только одна таблица фактов. Когда в кубе есть несколько
таблиц фактов, меры каждой из них организуются в группы мер, причем группа мер связана с
соответствующим набором измерений согласно заданным связям измерений.
1. Серверный компонент служб SSAS реализован в виде службы Microsoft Windows. Службы SSAS
поддерживают работу нескольких экземпляров на одном компьютере, при этом каждый экземпляр
служб SSAS реализован как отдельный экземпляр службы Windows.
2. Клиенты обмениваются данными со службами SSAS с помощью общедоступного стандарта XML для
аналитики (XMLA), который представляет собой протокол на базе SOAP для выполнения команд и
получения ответов и предоставляется в виде веб-службы. Клиентские модели объектов также
предоставляются через XML для аналитики, и доступ к ним производится через управляемый
поставщик, например ADOMD.NET, или через собственный поставщик OLE DB.
2. Язык сценариев служб Analysis Services (ASSL) также может использоваться для управления
объектами базы данных служб SSAS.
Экземпляр служб SSAS запускается, как изолированная служба, взаимодействие с этой службой происходит
через XMLA с использованием протокола HTTP или TCP. Объекты AMO — это прослойка между
приложением пользователя и экземпляром служб SSAS. Они предоставляют доступ к административным
объектам служб SSAS. Объект AMO — это библиотека класса, которая принимает команды от клиентского
приложения и преобразует их в XMLA-сообщения для экземпляра служб SSAS. Объекты AMO представляют
объекты экземпляра служб SSAS, как классы для приложения конечного пользователя, с элементами-
методами, запускающими команды и элементами-свойствами, хранящими данные объектов служб SSAS.
На Рисунок 25 отображена архитектура компонентов служб SSAS, включая все главные элементы,
запущенные на экземпляре служб SSAS, и все пользовательские компоненты, взаимодействующие с этим
35
экземпляром. Как показано на рисунке, единственным путем доступа к экземпляру является
прослушиватель XML для аналитики или использование протокола HTTP или TCP.
36
многомерной базе данных, так и для описания модели формирования данных внутри нее при помощи
MDX-сценариев (MDX Scripts).
Объекты AMO позволяют создавать, изменять и удалять такие объекты, как кубы, измерения, структуры
интеллектуального анализа, а также базы данных служб SSAS. Приложение, работающее на
платформе .NET Framework, может выполнять действия со всеми этими объектами. Кроме этого,
существует также возможность обновления и обработки данных, хранящихся в базах данных служб SSAS.
Объекты AMO не позволяют выполнять запросы к данным. Для запроса данных предназначены объекты,
описанные в разделе ADOMD.NET.
Библиотека классов AMO содержит иерархию классов, где для использования в коде сначала создаются
экземпляры одних классов, а затем других. Существуют также дополнительные классы, экземпляры
которых могут быть в любой момент созданы в коде, однако сначала, вероятно, потребуется создать
экземпляры одного или нескольких классов иерархии.
На Рисунок 26 приведена иерархия классов AMO высокого уровня, содержащая основные классы.
37
Рисунок 26. Иерархия классов AMO высокого уровня
Объекты AMO особенно полезны для автоматизации часто выполняемых задач (например, для создания
новых секций в группе мер при появлении новых данных в таблице фактов или для повторного обучения
модели интеллектуального анализа при появлении новых данных). Обычно эти задачи, которые создают
новые объекты, выполняются ежемесячно, еженедельно или ежеквартально, а приложение может легко
именовать эти новые объекты на основе новых данных.
Администраторы служб SSAS могут использовать объекты AMO, чтобы автоматизировать обработку баз
данных служб SSAS. Проектирование и развертывание баз данных служб SSAS следует производить в среде
BI Dev Studio.
Разработчики могут также внедрять в приложения логику служб SSAS. Это возможно благодаря созданию
кубов, измерений, структур и моделей интеллектуального анализа на основе пользовательского ввода и
других факторов.
1. языка описания данных DDL, или язык определения объектов, который определяет и описывает
экземпляр служб SSAS, а также базы данных и объекты баз данных, находящихся в этом
экземпляре;
2. командного языка, который отправляет команды-действия, например Create, Alter или Process,
экземпляру служб SSAS.
В службах SSAS язык определения данных (Data Definition Language, DDL) языка ASSL определяет структуру
объектов служб SSAS (например, кубов, измерений и моделей интеллектуального анализа данных), а также
привязку объектов служб SSAS к источникам данных. DDL также сохраняет определение объектов служб
SSAS. Приложения служб SSAS используют DDL для создания, изменения, развертывания и описания
объектов SSAS.
Разработчик проектирует набор кубов при помощи средств проектирования среды BI DevStudio и сохраняет
это определение как часть проекта. Разработчик не ограничен использованием только средств
проектирования, он также может открывать непосредственно файлы определений кубов для изменения
XML.
Получив метаданных при помощи наборов строк схемы или модели объекта, приложения могут узнать
больше о тех данных, которые можно извлечь из источника данных. Получить можно такие сведения, как
типы доступных ключевых индикаторов производительности, измерения в кубе и параметры, которые
требуются модели интеллектуального анализа данных. Наибольшее значение метаданные имеют для
динамических приложений, которым для определения типа, глубины и области действия получаемых
данных требуется ввод пользователя. Среди таких приложений Query Analyzer, Microsoft Excel и другие
средства запросов. Метаданные менее значимы для статических приложений, выполняющих набор
стандартных действий.
Получение данных — это фактическое извлечение сведений, хранящихся в источнике данных. Получение
данных является основной функцией «статических» приложений, которым известна структура источника
данных. Получение данных также является конечным результатом «динамических» приложений. Значение
ключевого индикатора производительности в данное время суток, число велосипедов, проданных за
последний час по каждому магазину и факторы, влияющие на среднегодовую производительность
сотрудников — все это примеры данных, которые можно получить. Получение данных важно для любого
выполняющего запросы приложения.
Компонент ADOMD.NET также можно использовать, чтобы фактически изменять структуру хранилища
аналитических данных. И хотя обычно это делается с помощью модели объектов AMO, компонент
ADOMD.NET можно использовать для отправки команд на ASSL, чтобы создавать, изменять или удалять
объекты на сервере.
40
4. Разработка многомерных баз данных с использованием SSAS
Проект Описание
Проект служб Analysis Содержит определения объектов для одиночной базы данных служб SSAS.
Services
Импорт базы данных Предоставляет мастер, который можно использовать для создания нового
служб Analysis Services проекта служб SSAS путем импортирования определений объектов из
2008 существующей базы данных служб SSAS.
Проект служб Integration Содержит определения объектов для набора пакетов служб Integration Services.
Services
Мастер проектов Предоставляет мастер, который помогает выполнить процесс создания проекта
отчетов отчета с помощью служб Reporting Services.
Проект модели отчета Содержит определения объектов для модели отчета служб Reporting Services.
Проект сервера отчетов Содержит определения объектов для одного или нескольких отчетов служб
Reporting Services.
Среда SSMS также содержит несколько типов проектов, предназначенных для различных типов запросов
или сценариев (Таблица 5).
Проект Описание
41
Сценарии SQL Содержит сценарии SQL для SQL Server Compact, а также соединения с экземплярами
Server Compact SQL Server Compact, в которых могут выполняться эти сценарии.
Сценарии SQL Содержит сценарии Transact-SQL и XQuery для экземпляра компонента SQL Server
Server Database Engine, а также соединения с экземплярами компонента SQL Server Database
Engine, в которых эти сценарии могут выполняться.
среда SSMS предоставляет интегрированную среду для соединения с экземплярами служб SSAS,
SQL Server и Reporting Services, чтобы настраивать объекты, а также проводить администрирование
объектов и управлять ими в пределах экземпляра служб SSAS. С использованием этих сценариев
можно также использовать среду SSMS для создания или изменения объектов служб SSAS, но среда
SSMS не предоставляет графический интерфейс для конструирования и определения объектов;
среда BI Dev Studio предоставляет интегрированную среду разработки для разработки решений
бизнес-аналитики. Среду BI Dev Studio можно использовать в проектном режиме, использующем
определения на основе XML объектов служб SSAS, Integration Services и Reporting Services,
содержащихся в проектах и решениях. Использование среды BI Dev Studio в проектном режиме
означает, что изменения объектов служб SSAS в среде BI Dev Studio применяются к определениям
объектов на основе XML, но не применяются непосредственно к объекту в экземпляре служб SSAS
до тех пор, пока решение не будет развернуто. Среду BI Dev Studio можно также использовать в
оперативном режиме, т. е. напрямую подключаться к экземпляру служб SSAS и работать с
объектами существующей базы данных.
Если в настоящий момент в среде BI Dev Studio не загружено ни одно решение, при создании нового
проекта служб SSAS будет автоматически создано новое решение. В противном случае новый проект служб
SSAS может быть добавлен к существующему решению или создан в новом решении.
Для создания проекта служб SSAS в среде BI Dev Studio необходимо выполнить следующие шаги:
1. создание проекта служб SSAS выполняется путем выбора шаблона проекта служб SSAS или с
помощью мастера импорта базы данных служб Analysis Services 9.0 в группе шаблонов бизнес-
аналитики диалогового окна «Добавление нового проекта», а также задания имени и размещения
для нового проекта (Рисунок 27).
42
Рисунок 27. Создание проекта служб SSAS
2. если определить проект служб SSAS, основанный на шаблоне проекта служб SSAS, проект шаблона
будет открыт в среде BI Dev Studio, в которой можно определить источники данных, представления
источников данных, кубов, измерений, ролей и других объектов служб SSAS. Можно
сконструировать эти объекты, основанные на существующих источниках данных, или сформировать
специальную реляционную структуру базы данных, основанную на кубе и конструкторе измерений.
Также можно сконструировать куб и объекты измерения, основанные на кубе и шаблонах
измерений (Рисунок 28);
3. если вновь определенный проект служб SSAS был основан на существующей базе данных служб
SSAS, метаданные для этой базы данных будут открыты в проекте служб SSAS в среде BI Dev Studio,
в которой можно изменить метаданные существующей базы данных. Однако до тех пор, пока
изменения не будут развернуты, они не повлияют на существующие базы данных служб SSAS;
43
5. Добавляются дополнительные файлы, например текстовые файлы, содержащие примечания к
проекту, в папку «Разное» проекта служб SSAS в окне обозревателя решений (Рисунок 29).
6. определяются свойства развертывания проекта, чтобы задать сервер, на котором будут развернуты
метаданные проекта как обработанные объекты, и указать другие свойства развертывания (Рисунок
30).
7. Собирается (Рисунок 31) и развертывается (Рисунок 32) решение в экземпляре служб SSAS для
тестирования. При сборке решения проверяются определения и зависимости объектов,
включенные в проект, и формируется сценарий развертывания. При развертывании решения
используется ядро развертывания служб SSAS для отправки подсистемы развертывания в
указанный экземпляр.
44
Рисунок 31. Построение решения Рисунок 32. Развертывание решения
Папка Описание
Источники данных Содержит источники данных для проекта служб SSAS. Эти объекты создаются в
мастере источников данных и редактируются в конструкторе источников
данных.
Представления Содержит представления источников данных для проекта служб SSAS. Эти
источников данных объекты создаются в мастере представлений источников данных и
редактируются в конструкторе представлений источников данных.
Кубы Содержит кубы для проекта служб SSAS. Эти объекты создаются в мастере
кубов и редактируются в конструкторе кубов.
Измерения Содержит измерения для проекта служб SSAS. Эти объекты создаются в
мастере измерений или мастере кубов и редактируются в конструкторе
измерений.
Роли Содержит роли базы данных для проекта служб SSAS. Создание и управление
ролями осуществляется в конструкторе ролей.
Прочее Содержит все типы файлов, за исключением типов файлов служб SSAS.
Файл источника данных (DS) Содержит элементы языка сценариев служб SSAS (ASSL),
определяющие метаданные для источника данных.
Файл куба (CUBE) Содержит элементы ASSL, определяющие метаданные для куба,
включая группы мер, меры и измерения куба.
Файл секций (PARTITIONS) Содержит элементы ASSL, определяющие метаданные для секций
указанного куба.
Файл измерения (DIM) Содержит элементы ASSL, определяющие метаданные для измерения
базы данных.
Файл базы данных (DATABASE) Содержит элементы ASSL, определяющие метаданные для базы
данных, включая типы учетных записей, переводы и разрешения базы
данных.
46
Файл роли базы данных (ROLE) Содержит элементы ASSL, определяющие метаданные для роли базы
данных, включая членов роли.
Измерение базы данных — это коллекция атрибутов измерения, связанных с ключевым атрибутом,
который, в свою очередь, связан с фактами в измерении мер.
Атрибут измерения привязан к одному или более столбцам в таблице измерения и состоит из элементов.
Атрибут измерения может содержать имена заказчиков, названия месяцев, названия продуктов.
Элемент — это значение атрибута измерения, в том числе измерения мер. Иерархия может содержать
конечные элементы, родительские элементы, элементы данных и элемент «(Все)».
Мера — это значение из таблицы фактов (синонимом меры является термин факт). Значение в измерении
мер часто называют общим термином элемент. Мерами обычно являются числовые значения, но могут
быть и строковые.
Измерение мер — это измерение, содержащее все меры куба. Измерение мер является измерением
специального типа, в котором элементы обычно статистически вычислены (обычно по сумме или
количеству) на основе текущего элемента каждого атрибута измерения, для которого существует данная
мера.
Группа мер — это коллекция связанных мер в кубе служб SSAS (обычно меры из одной таблицы фактов). В
службах SSAS куб может содержать несколько групп мер.
Элемент «(Все)» — это вычисленное значение всех элементов в иерархии атрибута или определенной
пользователем иерархии.
Элемент данных — это дочерний элемент, связанный с родительским элементов в иерархии типа
«родители-потомки». Элемент данных содержит значение данных для родительского элемента вместо
статистического значения потомков родительского элемента.
Атрибут гранулярности - атрибут измерения куба, связывающий измерение с фактами в группе мер в
измерении мер. Если атрибут гранулярности и ключевой атрибут — это разные атрибуты, то неключевые
атрибуты должны быть напрямую или косвенно связаны с атрибутом гранулярности. Внутри куба атрибут
гранулярности определяет гранулярность измерения.
1. конечный уровень, содержащий все отдельные элементы атрибута, и все элементы конечного уровня
(конечные элементы);
Сбалансированная иерархия — это иерархия, в которой между верхним и любым из конечных элементов
расположено одинаковое количество уровней.
Иерархия типа «родители-потомки» — это иерархия атрибута специального типа, в которой атрибут
измерения имеет тип parent. Иерархия типа «родители-потомки» является несбалансированной иерархией
из дочерних и родительских элементов. Иерархия типа «родители-потомки» содержит следующие уровни:
Для каждого измерения может существовать единственная иерархия типа «родители-потомки», она
должна быть связана с ключевым атрибутом.
Связь атрибутов — это связь между атрибутами типа «один ко многим», например связь между атрибутами
измерения области и города.
Свойство элемента — это свойство элемента атрибута, например пол заказчика или цвет товара.
48
Ячейка куба — пространство, существующее на пересечении элемента измерения меры и элемента каждой
иерархии атрибута куба.
Пространство куба — это совокупность элементов иерархий атрибутов куба с мерами куба.
4.2.2. Кортежи
Кортеж уникальным образом определяет ячейку на основе сочетания элементов атрибута, состоящих из
атрибутов каждой иерархии атрибута куба. При определении кортежа в запросе многомерных выражений
или в многомерном выражении не обязательно явно включать элемент атрибута из каждой иерархии
атрибута. Если элемент из иерархии атрибута не включен явно в запрос или выражение, в кортеж неявным
образом включается элемент по умолчанию данной иерархии атрибута. Если в кубе явно не указано
обратное, элементом по умолчанию любой иерархии атрибута считается элемент «(Все)», если он
существует. Если такой элемент отсутствует в иерархии атрибута, элементом по умолчанию считается
элемент верхнего уровня иерархии. Мерой по умолчанию является первая мера указанного куба, если
только мера по умолчанию не определена явно.
Например, следующий кортеж определяет одну ячейку в базе данных Adventure Works, явно определяя
только один элемент в измерении Measures.
В примере уникально определена ячейка, состоящая из элемента Reseller Sales Amount из измерения
Measures и элемента по умолчанию из каждой иерархии атрибута в кубе. Элементом по умолчанию для
каждой иерархии атрибута, кроме Destination Currency, является элемент «(Все)». Элементом по
умолчанию для иерархии Destination Currency является элемент US Dollar (он определен в сценарии
многомерных выражений в кубе Adventure Works).
Следующий запрос возвращает значение ячейки, на которую ссылается кортеж, указанный в предыдущем
примере:
SELECT
Размерностью кортежа называют последовательность или порядок его элементов. Поскольку неявные
элементы всегда расположены в одном и том же порядке, размерность практически всегда зависит от
элементов кортежа, определенных явно. Порядок элементов кортежа важен при определении набора
кортежей. В следующем примере кортеж содержит два элемента по оси столбцов:
SELECT
49
Кортеж в запросе возвращает ячейку куба на пересечении меры Reseller Sales Amount измерения Measures
и элемента CY 2004 иерархии атрибута Calendar Year в измерении Date.
4.2.3. Наборы
Набором называют упорядоченное множество кортежей одинаковой размерности. Для обозначения
набора кортежей используются фигурные скобки {}. Пример набора:
SELECT
} ON COLUMNS
В примере все кортежи набора имеют одинаковую размерность, поскольку первый элемент каждого
кортежа принадлежит измерению Measures, а второй элемент — иерархии атрибута Calendar Year.
Базовый запрос многомерных выражений — это инструкция SELECT, наиболее частый запрос в
многомерных выражениях. Чтобы получить основательные знания о применении многомерных
выражений для запроса многомерных данных, необходимо понять, как в инструкции многомерных
выражений SELECT определяется результирующий набор, синтаксис инструкции SELECT и как с ее помощью
создавать простые запросы.
число осей или наборов иерархий. В многомерном запросе можно указать до 128 осей;
50
имя куба, задающего контекст многомерного запроса;
элементы оси среза, по которой отсекаются данные для элементов из осей запроса.
Для указания осей запроса куба, задающего контекст запроса, и осей среза в инструкции многомерных
выражений SELECT используются следующие предложения:
SELECT
{ [Measures].[Sales Amount],
{ [Date].[Fiscal].[Fiscal Year].&[2002],
Этот запрос возвращает результирующий набор, содержащий продажи за 2002 и 2003 годы и сумму
налогов для юго-западных областей продаж. Запрос содержит следующие сведения о результирующем
наборе:
предложение SELECT задает оси запроса как элементы Sales Amount и Tax Amount в измерении
Measures и как элементы 2002 и 2003 в измерении Date;
предложение FROM указывает, что источником данных является куб Adventure Works;
51
предложение WHERE определяет ось среза как элемент Southwest измерения Sales Territory.
Сценарий многомерных выражений определяет процесс вычислений для куба. Сценарий многомерных
выражений также считается частью самого куба. Поэтому изменение сценария многомерных выражений,
связанного с кубом, сразу изменяет процесс вычислений для куба.
Для создания сценариев многомерных выражений можно воспользоваться конструктором кубов в среде BI
Dev Studio.
1. Сценарий многомерных выражений по умолчанию. При создании куба службы SSAS создают
стандартный сценарий многомерных выражений для этого куба. В этом сценарии определяется этап
вычисления для всего куба.
Сценарий многомерных выражений по умолчанию, создаваемый службами SSAS при определении куба,
содержит одну инструкцию CALCULATE. Эта инструкция CALCULATE находится в начале сценария
многомерных выражений по умолчанию и говорит о том, что весь куб должен быть рассчитан во время
первого этапа вычислений.
Если с кубом не связан ни один сценарий многомерных выражений, куб вычисляется по сценарию
многомерных выражений по умолчанию. Куб должен быть связан хотя бы с одним сценарием
многомерных выражений, поскольку только в сценарии определяется порядок вычисления куба.
52
5. Использование служб Integration Services со службами Analysis Services
Службы SSIS содержат графические инструменты и мастера для построения и отладки пакетов; задачи для
выполнения функций потока операций, таких как:
Типичные случаи применение пакетов служб SSIS совместно с SSAS включают в себя:
1. Множество организаций хранят архивные данные в традиционных системах хранилищ данных. Эти
данные могут быть не слишком важными для ежедневных операций, однако они могут иметь
ценность для анализа трендов, которому необходимы данные за длительный период.
2. Филиалы организации могут использовать разные технологии хранения данных для хранения
операционных данных. Пакету может потребоваться извлечь данные из электронных таблиц, а
также из реляционных БД перед тем, как он сможет объединить эти данные.
3. Данные могут храниться в базах данных, которые используют различные схемы для одних и тех же
данных. Пакету может потребоваться изменить тип данных столбца или объединить данные из
нескольких столбцов в один перед тем, как он сможет объединить данные.
Службы SSIS могут подключиться ко многим типам источников данных, включая несколько источников
данных одного пакета. Пакет может подключиться к реляционным базам данных, используя
поставщиков .NET и OLE DB, а также ко множеству традиционных баз данных, используя драйверы ODBC.
Он также может подключиться к плоским файлам, файлам Excel и проектам служб SSAS.
53
Службы SSIS содержат компоненты источника, осуществляющие работу по извлечению данных из плоских
файлов, рабочих листов Excel, XML-документов, а также таблиц и представлений реляционных БД из
источника данных, к которому подключается пакет.
Затем данные обычно преобразуются с помощью преобразований, содержащихся в службах SSIS. После
того, как данные преобразованы в совместимые форматы, они могут быть физически объединены в один
набор.
После успешного слияния данных и применения преобразований данные загружаются по одному или
нескольким назначениям. Службы SSIS содержат назначения для загрузки данных в плоские файлы,
необработанные файлы, а также реляционные базы данных. Данные также могут быть загружены в набор
записей, хранимых в памяти, и быть доступны для других элементов пакета.
Службы SSIS содержат задачу, которая производит массовую загрузку данных прямо из плоского файла в
таблицы и представления SQL Server, а также компонент назначения, производящий массовую загрузку
данных в базу данных SQL Server в качестве последнего шага преобразования данных.
Пакет служб SSIS может быть настроен с возможностью перезапуска. Это означает, что можно
перезапустить пакет с предопределенной контрольной точки — задачи или контейнера пакета.
Возможность перезапуска пакета может значительно экономить время, особенно если пакет обрабатывает
данные из большого количества источников.
Можно использовать пакеты служб SSIS для загрузки в базу данных таблиц измерений и фактов. Если
источник данных для таблицы измерения хранится в нескольких источниках данных, то пакет может
объединить данные в один набор и загрузить таблицу измерения в течение одного процесса, вместо
использования отдельных процессов для каждого источника данных.
Обновление данных в хранилищах и витринах данных может стать сложной задачей, так как оба типа
хранилищ данных обычно содержат медленно изменяющиеся измерения, которыми бывает сложно
управлять с помощью преобразования данных. Мастер медленно изменяющихся измерений
автоматизирует поддержку медленно изменяющихся измерений, динамически создавая инструкции SQL,
которые обновляют и заменяют записи, обновляют связанные записи, а также добавляют новые столбцы в
таблицы.
Кроме того, задачи и преобразования в пакетах служб SSIS могут обрабатывать кубы и измерения служб
SSAS. Когда пакет обновляет таблицу в базе данных, на основе которой построен куб, можно использовать
задачи и преобразования служб SSIS для автоматической обработки куба, а также для автоматической
обработки измерений. Автоматическая обработка кубов и измерений помогает предоставлять текущие
данные для пользователей обеих сред: пользователям, которые получают данные из кубов и измерений, и
пользователям, которые получают доступ к данным в реляционной базе данных.
Службы SSIS могут также вычислять функции перед загрузкой данных в назначение. Если хранилища и
витрины данных содержат статистические данные, то пакет служб SSIS может рассчитать такие функции,
как SUM, AVERAGE и COUNT. Преобразование служб SSIS может также свести реляционные данные и
54
преобразовать их в менее нормализованный формат, который является более совместимым с табличными
структурами хранилища данных.
1. Данные были получены из нескольких филиалов организации, и каждый филиал использует разные
стандарты и соглашения. Перед тем, как данные могут быть использованы, может потребоваться
преобразовать их в другой формат. Например, может потребоваться объединить имя и фамилию в
один столбец.
2. Данные могут быть арендованными или приобретенными. Перед тем, как данные могут быть
использованы, может потребоваться их стандартизация и очистка для соответствия стандартам
делопроизводства. Например, какая-либо организация желает проверить, что все записи содержат
один набор кодов регионов или один и тот же набор названий продукции.
3. Формат данных зависит от языкового стандарта. Например, данные могут иметь различные
форматы даты-времени, а также форматы чисел. Если данные объединены из источников разных
языковых стандартов, то перед загрузкой их необходимо привести в один формат во избежание
повреждения данных.
Службы SSIS содержат встроенные преобразования, которые можно добавить к пакетам для очистки и
стандартизации данных, изменения регистра данных, преобразования данных в иной тип или формат, а
также для создания нового столбца данных на основе выражений. Например, пакет может объединить
столбцы, содержащие имена и фамилии, в общей столбец полного имени, а затем перевести все символы
в верхний регистр.
Пакет служб SSIS также может произвести очистку данных путем замены значений в столбцах на значения
ссылочной таблицы, используя уточняющие запросы или нечеткие уточняющие запросы для поиска
значений в ссылочной таблице. Часто пакет сначала применяет уточняющий запрос и, в случае неудачи,
нечеткий уточняющий запрос. Например, сначала пакет пытается провести поиск названия продукта в
ссылочной таблице, используя значение первичного ключа. Если этот поиск не смог вернуть название
продукта, то пакет повторяет попытку с применением нестрогого соответствия наименования продукта.
Другое преобразование производит очистку данных с помощью группирования похожих значений набора
данных. Это полезно при распознавании записей, которые могут быть дубликатами и поэтому не должны
быть включены в базу данных без дальнейшей оценки. Например, сравнивая адреса в списке записей
клиентов, можно найти несколько дублирующих записей.
55
Рисунок 33. Архитектура служб SSIS
Конструктор служб SSIS — это графическое средство, с помощью которого можно создавать и обслуживать
пакеты служб Integration Services. Конструктор служб SSIS доступен в среде BI Dev Studio как часть проекта
служб SSIS.
Среда выполнения служб SSIS сохраняет макет пакетов, выполняет пакеты и обеспечивает поддержку
ведения журналов, точек останова, настройки, соединений и транзакций.
Исполняемые объекты времени выполнения служб SSIS — это пакеты, контейнеры, задачи и обработчики
событий, содержащиеся в службах SSIS. К числу исполняемых объектов среды выполнения принадлежат
также разрабатываемые пользовательские задачи.
Задача потока данных инкапсулирует подсистему обработки потока данных. Подсистема обработки потока
данных предоставляет размещенные в памяти буферы для перемещения данных из источника на целевой
объект и вызова средств для извлечения данных из файлов и реляционных баз данных. Подсистема
обработки потока данных также управляет преобразованиями, которые изменяют данные, и
назначениями, которые загружают данные или делают их доступными для других процессов.
56
Компонентами потока данных служб SSIS являются источники, преобразования и назначения, включенные
в службы SSIS. Можно также добавлять к потоку данных пользовательские компоненты.
Модель объектов служб SSIS включает управляемые прикладные программные интерфейсы (API) для
создания пользовательских компонентов, используемых в пакетах, или пользовательских приложений для
создания, загрузки, выполнения пакетов и управления ими. Разработчик может написать пользовательские
приложения, пользовательские задачи или преобразования, применяя любой язык, совместимый со
средой CLR.
Служба SSIS позволяет использовать среду SQL Server Management Studio для наблюдения за работой
пакетов служб SSIS и управления хранением пакетов.
Мастер импорта и экспорта SQL Server может копировать данные из любого источника данных и в любой
источник данных, для которого доступен управляемый поставщик данных .NET Framework или собственный
поставщик данных OLE DB. Этот мастер также предоставляет простейший метод создания пакета служб
SSIS, в котором данные копируются из источника в назначение.
Службы SSIS включают дополнительные средства, мастера и программы командной строки для
выполнения пакетов служб SSIS и управления ими.
элементы потока данных - эти необязательные элементы извлекают, изменяют и загружают данные
в источники данных. Основными элементами потока данных являются источники, преобразования
и назначения. Присутствие каких-либо элементов потока данных в пакете необязательно.
На Рисунок 34 приведен пример потока управления, который имеет один контейнер и шесть задач. Пять
задач пакетного уровня и одна задача уровня контейнера. Задача находится в контейнере.
57
Рисунок 34. Пример потока управления
5.3.1.1. Контейнеры
Архитектура служб SSIS поддерживает вложение контейнеров, и поток управления может включать
множество уровней вложенных контейнеров. Так, пакет может содержать контейнер, например контейнер
«цикл по каждому элементу», который в свою очередь может содержать другой контейнер «цикл по
каждому элементу», и так далее.
Контейнеры обеспечивают структуру в пакетах и службах для задач в потоке управления. SSIS содержит
следующие типы контейнеров для группирования задач и внедрения повторяющихся потоков управления:
контейнер «цикл по каждому элементу» перечисляет коллекцию данных и повторяет этот поток
управления для каждого члена коллекции;
контейнер «цикл по элементам» повторяет это управление потоком до тех пор, пока определенное
выражение не примет значение FALSE;
5.3.1.2. Задачи
Задачами называются элементы потока управления, которые определяют рабочие модули,
выполняющиеся в потоке управления пакета. Пакет служб SSIS состоит из одной или более задач. Если в
пакете несколько задач, они связаны и упорядочены в потоке управления с помощью управления
очередностью.
Конструктор служб SSIS — графическое средство служб SSIS для работы с пакетами — предоставляет
область конструктора для создания потока управления пакета и специальные редакторы для настройки
задач. Можно также использовать объектную модель служб SSIS для программного создания пакетов.
Службы SSIS включают в себя следующие типы задач для выполнения разнообразных функций:
задача потока данных определяет и выполняет потоки данных, которые извлекают данные,
применяют преобразования и загружают данные;
58
задачи подготовки данных копируют файлы и каталоги, загружают файлы и данные, сохраняют
данные, возвращенные при помощи веб-методов, или работают с XML-документами;
задачи технологического процесса связываются с другими процессами для загрузки пакетов или
программ, отправляют и получают сообщения между пакетами, отправляют сообщения
электронной почты, считывают данные инструментария управления Windows (WMI) или наблюдают
за событиями WMI;
задачи SQL Server позволяют получить доступ, копировать, вставлять, удалять или изменять
объекты или данные SQL Server;
задачи служб SSAS позволяют создать, изменить, удалить или обработать объекты служб SSAS;
Кроме того, службы SSIS предоставляют пути, соединяющие выход одного компонента с входом другого.
Пути определяют последовательность компонентов и дают возможность добавлять заметки к потоку
данных или просматривать источник столбца.
На Рисунок 35 приведен пример потока данных с источником, преобразованием с одним входом и одним
выходом и целевым объектом. На диаграмме присутствуют входы, выходы, выходы ошибок, а также
входные, выходные и внешние столбцы.
59
Рисунок 35. Пример потока данных
5.3.2.1. Источники
В службах SSIS источником называется компонент потока данных, который делает данные из внешнего
источника данных доступными для других компонентов потока данных.
У источника потока данных обычно есть один стандартный выход. В стандартном выходе содержатся
выходные столбцы, которые источник добавляет к потоку данных. Стандартный выход ссылается на
внешние столбцы. Внешним называется столбец в источнике. Метаданные внешних столбцов хранят
информацию об имени исходного столбца, типе и длине хранящихся в нем данных.
Выход ошибок источника хранит те же столбцы, что и стандартный выход, а также два дополнительных
столбца, предоставляющих информацию об ошибках. Объектная модель служб SSIS не ограничивает число
стандартных выходов и выходов ошибок, которые могут быть связаны с источником. У большей части
включенных в службы SSIS источников, за исключением компонента сценария, имеется один стандартный
выход, а у многих также есть один выход ошибок. Пользовательские источники могут быть спроектированы
так, чтобы содержать несколько стандартных выходов и выходов ошибок.
Все выходные столбцы доступны в качестве входных столбцов для следующего компонента потока данных.
5.3.2.2. Преобразования
Возможности преобразований очень разнообразны. Преобразования могут выполнять такие задачи, как
обновление, очистка, слияние и распространение данных и сбор статистики о них.
60
Входы и выходы преобразований определяют столбцы входных и выходных данных. В зависимости от
выполняемых операций над данными у одних преобразований может быть один вход и несколько
выходов, а у других — несколько входов и один выход. У преобразований также могут быть выходы
ошибок, которые предоставляют информацию о произошедших ошибках, и сами данные, вызвавшие
ошибку: например, строковые данные, которые не могут быть преобразованы в целое число. Объектная
модель служб SSIS не ограничивает число входов, стандартных выходов и выходов ошибок, которые могут
быть связаны с преобразованием. Пользовательские преобразования могут реализовывать любое
сочетание входов, стандартных выходов и выходов ошибок.
Вход преобразования определяется как один или более входных столбцов. Некоторые преобразования
служб SSIS также могут ссылаться на внешние входные столбцы. Например, вход преобразования
«Команда OLE DB» включает в себя внешние столбцы. Выходным называется столбец, который
добавляется преобразованием в поток данных. И стандартные выходы, и выходы ошибок содержат
выходные столбцы. Эти выходные столбцы, в свою очередь, служат входными столбцами для следующего
компонента потока данных: или другого преобразования, или целевого объекта.
У целевого объекта служб SSIS должен быть, по крайней мере, один вход. Вход содержит входные столбцы,
которые предоставляются другим компонентом потока данных. Входные столбцы сопоставляются со
столбцами целевого объекта.
У многих целевых объектов есть также один выход ошибок. Выход ошибок назначения содержит выходные
столбцы, которые обычно хранят информацию об ошибках, произошедших во время записи в целевое
хранилище данных. Ошибки могут происходить по разным причинам. Например, столбец может содержать
значение NULL, а целевой столбец этого не допускает.
Объектная модель служб SSIS не ограничивает число стандартных входов и выходов ошибок, которые
могут быть связаны с целевым объектом, пользовательские назначения могут реализовывать комбинации
из нескольких стандартных входов и выходов ошибок.
Проект служб SSIS поддерживает работу в автономном режиме. При работе в автономном режиме
соединения с используемыми пакетом источниками и целевыми объектами не устанавливаются, а
метаданные внешних столбцов не обновляются.
61
Вход содержит один или более входных столбцов, которые могут ссылаться на внешние столбцы, если
компонент потока данных настроен так, чтобы использовать их. Входы могут быть настроены для контроля
над потоком данных и управления им: например, можно определить, что компонент должен прервать
нормальный ход работы в ответ на ошибку, или пропускать ошибки, или перенаправлять строки,
содержащие ошибки, на вывод ошибок. Можно также задавать описание входа или обновлять имя входа.
Выход содержит один или более выходных столбцов, которые могут ссылаться на внешние столбцы, если
компонент потока данных настроен так, чтобы использовать их. Выходы могут предоставлять информацию,
полезную при последующей обработке данных. Например, можно указать, что данные на выходе
отсортированы. Можно также задавать описание выхода или обновлять имя выхода.
Можно определить, как компонент потока данных будет реагировать на ошибки в каждом входном и
выходном столбце. Если во время выполнения произошла ошибка или усечение данных, а компонент
потока данных настроен так, чтобы перенаправлять строки, строки данных, содержащие ошибки, будут
отправлены на выход ошибок. По умолчанию вывод ошибок содержит выходные столбцы и два столбца с
данными об ошибках: ErrorCode и ErrorColumn. Выходные столбцы содержат данные из строки с ошибкой,
ErrorCode хранит код ошибки, а ErrorColumn определяет столбец, в котором произошла ошибка.
5.3.2.6. Пути
Пути соединяют компоненты потока данных. В конструкторе SSIS можно просматривать и изменять
свойства путей, просматривать выходные метаданные для начальной точки пути и связывать с путем
средства просмотра данных.
1. на уровне компонента определяются общие для всех компонентов свойства, а также свойства,
характерные для конкретного компонента;
2. на уровне входа, выхода и выхода ошибок определяются общие свойства входов, выходов и
выходов ошибок компонента. Если компонент поддерживает работу с несколькими выходами, то
их можно добавить;
3. на уровне столбцов в дополнение к общим для всех столбцов свойствам задаются характерные
свойства, предоставляемые компонентом для столбцов. Если компонент поддерживает
добавление выходных столбцов, то их можно добавить к выходам;
62
При развертывании проекта служб SSAS необходимо ответить на следующие вопросы:
2. как развертывать дополнительные объекты, выходящие за область проекта служб SSAS, а именно:
пакеты, отчеты или схемы реляционных баз данных служб SSIS?
4. как обновлять метаданные (например, вычисления) в развернутой базе данных служб SSAS?
5. нужно ли предоставлять пользователям доступ к данным служб SSAS через сеть Интернет?
7. нужно развертывать объекты в распределенной среде при помощи связанных кубов или удаленных
секций?
1. при обработке больших или сложных кубов. Для этого требуется больше ресурсов памяти и процессора
в сравнении с обработкой малых или простых кубов;
Объем требуемого места на диске зависит от различных аспектов установки служб SSAS и задач, связанных
с обработкой объектов.
Кубы с большими таблицами фактов требуют больше места на диске, чем кубы с небольшими таблицами
фактов. Аналогично, хотя и в меньшей степени, кубы с большим количеством измерений требуют большего
места на диске. Как правило, для базы данных служб SSAS требуется примерно на 20% больше объема
места на диске в сравнении с таким же объемом данных, хранящемся в базовой реляционной базе данных.
Для агрегатов требуется дополнительное место, пропорциональное добавлению самих агрегатов: чем
больше добавляется агрегатов, тем больше требуется места на диске. Если лишние агрегаты не
используются, то дополнительное место на диске, необходимое для агрегатов, обычно не должно
превышать 10% от размера данных, хранящихся в базовой реляционной базе данных.
63
По умолчанию структуры интеллектуального анализа данных кэшируют на диск набор данных, которые
использовались для обучения.
Во время обработки службы Analysis Services хранят на диске копии объектов, которые участвуют в
обработке транзакций, до завершения обработки. Затем обработанные копии объектов замещают
исходные объекты. Следовательно, необходимо предоставить значительный объем дополнительного
места на диске для второй копии обрабатываемых объектов. Например, если планируется обрабатывать в
одной транзакции весь куб, то необходимо обеспечить достаточный объем места на диске для хранения
второй копии всего куба.
Некоторые изменения в кубе могут вызвать недоступность куба во время его обработки. Например, при
выполнении структурных изменений в измерении куба, даже при повторной обработке измерения,
необходимо обработать все кубы, использующие это измененное измерение. Во время обработки таких
кубов пользователи не могут выполнять запросы к этим кубам, а также к моделям интеллектуального
анализа данных, основанным на кубе с измененным измерением. Чтобы обеспечить доступность во время
обработки структурных изменений, влияющих на один или несколько кубов в проекте служб SSAS, следует
рассмотреть использование промежуточного сервера и мастера синхронизации баз данных. Эта функция
позволяет обновлять данные и метаданные на промежуточном сервере, а затем выполнять оперативную
синхронизацию рабочего и промежуточного серверов.
1. использование ASSL-сценария. При помощи SQL Server Management Studio создается XML-сценарий
метаданных существующей базы данных служб SSAS, затем этот сценарий запускается на другом
сервере для воссоздания начальной базы данных;
2. использование мастера развертывания служб, чтобы использовать выходные файлы формата XMLA,
созданные проектом служб SSAS для развертывания метаданных проекта на целевой сервер;
3. синхронизация баз данных служб SSAS при помощи мастера синхронизации БД;
Сценарий развертывания XMLA, сформированный мастером развертывания служб SSAS, состоит из двух
частей:
64
1. Первая часть сценария содержит команды, необходимые для создания, изменения или удаления
соответствующих объектов служб Microsoft SQL Server в целевой базе данных. По умолчанию входные
файлы, сформированные проектом служб SSAS, основываются на добавочном развертывании. В
результате сценарий развертывания XMLA влияет только на те объекты, которые были изменены или
удалены.
2. Вторая часть сценария развертывания содержит команды, необходимые для обработки только тех
объектов, которые были созданы или изменены на целевом сервере или для полной обработки
целевой базы данных.
1. Защита компьютера со службами SSAS. Как и в случае любого приложения, наиболее простым
способом доступа к данным в службах SSAS является физическое использование компьютера, на
котором запущено приложение. Если несанкционированный пользователь получит физический доступ
к компьютеру, на котором запущены службы SSAS, то этот пользователь потенциально может получить
доступ к любым данных, хранящимся на этом компьютере, независимо от других мер безопасности,
используемых для защиты данных. Чтобы повысить физическую безопасность компьютера, на котором
запущены службы SSAS, выполните следующие шаги:
отключите функцию загрузки с дискеты, если это возможно в настройках BIOS материнской платы, и
рассмотрите возможность полного удаления дисковода;
отключите функцию загрузки с CD-ROM, если это возможно в настройках BIOS материнской платы;
увеличьте защиту компьютера путем использования пароля при включении и повысьте защиту
настроек BIOS материнской платы, используя пароль доступа к BIOS;
2. Защита операционной системы Windows для служб SSAS. Операционная система с неверно
выставленными параметрами безопасности может подвергнуть риску безопасность экземпляра служб
SSAS. Следующие мероприятия позволят повысить защищенность операционной системы:
4. Безопасность взаимодействия клиентов с экземпляром служб SSAS, что включает шифрование данных,
проверку подлинности клиента, установку пакетов безопасности, и указание частоты обновления кэша
ролей.
6. Обеспечение безопасности доступа с помощью служб SSAS. Службы SSAS разрешают устанавливать
соединения только пользователям, прошедшим проверку подлинности Windows, если только не
разрешены анонимные подключения, и пользователям, которым предоставлены разрешения в
экземпляре служб SSAS. Пользователям, не имеющим разрешений, устанавливать соединения
запрещено. Службы SSAS не выполняют собственной проверки подлинности пользователей. При
проверке подлинности всех пользователей перед авторизацией доступа к данным служб SSAS или
перед предоставлением пользователям возможности выполнения административных задач службы
SSAS полагаются на операционную систему Windows.
По умолчанию любой пользователь, не являющийся членом роли сервера, не имеет разрешений служб
SSAS. Чтобы получить разрешения, член роли сервера должен сначала создать пользовательскую роль
базы данных, а затем предоставить этой роли разрешения.
Пользовательской роли базы данных могут быть предоставлены ограниченные или полные
административные разрешения в базе данных. Этой роли также могут быть предоставлены ограниченные
или полные разрешения на доступ к данным.
После создания пользовательской роли базы данных член роли сервера должен добавить
соответствующих пользователей и группы Windows. Пользователь получает разрешения в службах SSAS
только после его добавления к пользовательской роли базы данных.
66
6.2.2. Настройка безопасности служб SSAS
После установки экземпляра служб SSAS все члены локальной группы «Администраторы» становятся
членами роли сервера на этом экземпляре и обладают разрешениями уровня сервера для выполнения
любой задачи в пределах этого экземпляра служб SSAS. По умолчанию никакие другие пользователи не
имеют разрешений на доступ к объектам в экземпляре. Члены роли сервера служб SSAS могут
предоставлять другим пользователям доступ к объектам сервера и базы данных, используя среду SQL
Server Management Studio, среду BI Dev Studio или XMLA-сценарий.
Член роли сервера служб SSAS может предоставить другим пользователям доступ к службам SSAS
следующими способами:
2. путем использования ролей базы данных, чтобы предоставить пользователям доступ к источникам
данных, кубам, измерениям, структурам интеллектуального анализа данных и моделям
интеллектуального анализа данных.
6.2.4. Разрешения, которые роль сервера служб SSAS может предоставить роли
базы данных
Роль сервера служб SSAS может предоставить роли базы данных следующие разрешения:
1. полные административные разрешения в базе данных. В качестве члена роли базы данных с
разрешениями «Полный доступ» (администратор) пользователь Windows может выполнять в
рамках базы данных любую задачу, включая следующие:
67
обработка объектов базы данных;
2. только разрешение на обработку некоторых объектов служб SSAS. При предоставлении роли базы
данных разрешения на обработку объекта данных администратор получает возможность передать
задачу обработки некоторых объектов без предоставления дополнительных внешних разрешений
пользователю, выполняющему обработку. При предоставлении роли базы данных разрешений на
обработку следует иметь в виду то, что разрешения носят аддитивный характер. Например, одна
роль базы данных разрешает пользователю обрабатывать определенный куб, в то время как другая
роль базы данных предоставляет тому же пользователю разрешение на обработку измерения в
этом же кубе. Разрешения из двух различных ролей объединяются, в результате чего пользователь
получает разрешение на обработку как куба, так и заданного измерения в рамках такого куба.
Пользователь, роль базы данных которого имеет только разрешения на обработку одного или
нескольких объектов базы данных, не сможет воспользоваться средой SQL Server Management
Studio или BI Dev Studio для подключения к службам SSAS и выполнения обработки объектов. Для
данных средств необходимо, чтобы у пользователя было разрешение на доступ к метаданным
объекта. Следовательно, для обработки таких объектов пользователю, располагающему только
разрешениями на обработку объектов, необходимо будет использовать XMLA-сценарий.
Разрешения на обработку могут быть предоставлены на уровнях базы данных, куба, измерения и
структуры интеллектуального анализа данных.
Контрольные вопросы
1. Опишите назначение служб Analysis Services.
68
2. Какие инструментальные средства используются для создания, управления и работы с OLAP-
кубами?
6. В каких редакциях SQL Server 2008 предусмотрена возможность работы с хранилищами данных? В
чем заключается отличие между этими версиями с точки зрения функционала при работе с
хранилищами данных?
69