Академический Документы
Профессиональный Документы
Культура Документы
1 из 11
Архитектура Deductor Warehouse – многомерное хранилище данных
Многомерное представление данных–
Deductor Warehouse - многомерное хранилище данных, аккумулирующее всю необходимую для
анализа предметной области информацию. Вся информация в хранилище хранится в структурах типа
«звезда», где в центре расположены таблицы фактов, а «лучами» являются измерения. 4-ая версия
поддерживает схему хранения «звезда», а 5-ая значительно более мощную – «снежинка». В схеме
«звезда» измерение может ссылаться только на таблицу фактов, а в «снежинке» измерение может
ссылаться на другие измерения, которые в свою очередь ссылаются на таблицу фактов. Можно
говорить, что «звезда» - это частный случай схемы «снежинка».
Такая архитектура хранилища наиболее адекватна задачам анализа данных. Каждая «звезда»
называется процессом и описывает определенное действие, например, продажи товара, отгрузки,
поступления денежных средств и прочее. В Deductor Warehouse может одновременно храниться
множество процессов, имеющие общие измерения, например, «Товар», фигурирующий в
«Поступлении» и в «Отгрузке».
Измерения могут быть как простыми списками, например, дата, так и содержать
дополнительные столбцы, называемые свойствами (атрибутами измерений). Например, измерение
«Товар» может состоять из следующих полей: «Наименование товара» - собственно измерение
(первичный ключ), «Вес», «Объем» и прочее - свойства данного измерения (атрибуты данного
измерения).
Лекция № 3 стр. 2 из 11
Процессы тоже могут иметь атрибуты, - атрибуты процесса. Атрибут процесса в отличие от
измерения не определяет координату в многомерном пространстве. Это справочное значение,
относяцееся к процессу, например, № накладной, валюта и т.д.
Часто сложно определиться, что делать атрибутом процесса, а что измерением. Универсальных
рецептов на все случаи не существует. Но можно дать общие рекомендации:
· совокупность измерений процесса должна однозначно определять единственную запись в таблице
процесса («точку» в многомерном пространстве);
· если существуют иерархии, то выбор должен быть в пользу измерения;
· если по объекту хранилища данных предполагается в будущем делать частые «срезы», то снова
лучше отдать предпочтение измерению;
· наличие возможных пропусков (необязательное поле) говорит о том, что объект лучше сделать
атрибутом процесса.
Что представляет собой хранилище Deductor Warehouse?
Лекция № 3 стр. 3 из 11
Физически – это реляционная база данных, содержащая таблицы для хранения информации и
таблицы связей, обеспечивающие целостное хранение сведений. Поверх реляционной базы данных
реализован специальный слой, который преобразует реляционное представление к многомерному.
Многомерное представление используется потому, что оно намного лучше реляционного
соответствует идеологии анализа данных. Благодаря этому слою, пользователь оперирует
многомерными понятиями, такими как измерение, факт, а система автоматически производит все
необходимые манипуляции, необходимые для работы с реляционной СУБД. Deductor Warehouse
реализует универсальное многомерное хранение, т.е. может содержать множество процессов с
различным количеством измерений и фактов. Настройка процессов, задание измерений, свойств и
фактов может осуществляться с помощью Редактора метаданных Deductor Studio, либо при загрузке в
хранилище данных. Вся работа с хранилищем осуществляется средствами Deductor Studio.
Новое хранилище данных не содержит в себе пока никакой информации. В нем пока еще нет
данных и не определены процессы, измерения, факты. Структура хранилища создается с помощью
Редактора хранилища или при первой загрузке в него данных.
Создание структуры хранилища с помощью Редактора метаданных
Перед тем, как приступить к загрузке данных во вновь созданное хранилище, необходимо задать
его структуру, т.е. определить, какие процессы, измерения, факты и свойства будут в нем содержаться.
Для этого предназначен Редактор метаданных. Хотя создание процессов и измерений возможно и во
время самого процесса загрузки данных, зачастую бывает удобней заранее спроектировать схему
хранилища данных, и производить загрузку в созданные ранее объекты хранилища.
Лекция № 3 стр. 4 из 11
Редактор метаданных может быть вызван с помощью всплывающего меню или из окна
настройки параметров хранилища на панели «Источники данных». В левой части окна Редактора
метаданных показано дерево объектов хранилища (процессы, измерения, свойства и факты).
В правой части окна отображаются параметры выделенного объекта:
Измерения
Загружать измерение имеет смысл, если у него есть свойства. Например, у измерения «Товар»
могут быть свойства «Вес», «Цвет», «Размер». При загрузке процесса свойства измерения не
загружаются; для того, чтобы добавить их в хранилище, измерение следует загрузить отдельно. В
качестве другого примера, измерение «Дата» никаких свойств не имеет, поэтому может загружаться как
самостоятельно, так и вместе с процессом.
Лекция № 3 стр. 6 из 11
Пример
Пусть во внешнем источнике хранится информация об отгрузках, представленная следующей таблицей.
Лекция № 3 стр. 7 из 11
Лекция № 3 стр. 8 из 11
Лекция № 3 стр. 9 из 11