Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Данные организованны в виде упорядоченных многомерных массивов (кубов).
Основное назначение многомерных СУБД (МСУБД) – реализация систем, ориентированных на динамический, многомерный анализ исторических данных (и текущих). Они ориентированы на обработку произвольных запросов. Поэтому проектирование МБД начинается с определения вопросов, с которыми конечные пользователи хотели бы обратиться к системе.
Например, для ответа на вопрос: «Какие два варианта скидок наиболее эффективны в западном регионе в летний период при продаже «Жигулей» на основе данных за последние 10 лет», в БД должны быть данные об объеме продаж по 4 измерениям:
Выберем уровень детализации и агрегации:
Получим куб, состоящий из 438000000 ячеек. В основе используемого в МСУБД способа хранения лежит предположение, что «пустые» не хранятся. Значения показателей хранится в виде множества логически упорядоченных блоков (массивов), имеющих фиксированную длину. Блок – минимальная индексированная единица. Блоки с полностью неопределенными значениями не хранятся. Реальные значения (на сегодняшний день) могут составлять приблизительно 0,25% всех ячеек (365х30х10х1).
Подход к агрегации влияет и на размер БД и на время выполнения запросов. Их значения должны быть оптимальными.
Структура данных для этого уровня детализации (агрегации).
Измерения: DAY – день, MANAGER – менеджер, MODEL_CAR – модель, FIRMA_CAR – фирма-производитель, DEPARTMENT – подразделение (филиал), REGION –регион, MONTH – месяц, YEAR – год, TIP_DISCOUNT – тип скидки.
Показатели (меры): TOTAL_COST – объем продаж, INT_COST – себестоимость проданного авто, QOANTITY – количество проданного авто, PROFIT – доход, WORK_TIME – количество рабочих часов.
Достоинства МСУБД:
· точно моделируют бизнес-данные
· быстрый доступ без SQL-запросов (на 1,2 порядок)
· содержат заранее рассчитанные сводные данные
Ограничения:
· не позволяют работать с большими БД (только десятки Гб)
· неэффективно используют внешнюю память, так как данные хранятся блоками в упорядоченном виде, и непосредственные значения не всегда удаляются полностью
· не поддерживают репликацию данных
Условия применения:
· небольшой объем данных (<нескольких Гб)
· набор измерений стабилен
· время ответа системы на запрос является критическим параметром
· требуется использовать сложные строенные функции над ячейками гиперкуба
Дата публикования: 2014-11-26; Прочитано: 216 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!