![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Проектирование хранилищ – сложная задача:
• Менеджеру, принимающему решения, необходимы самые разнообразные отчеты, причем зачастую новые.
• Данные в хранилище должны регулярно пополняться (необходимо тщательно планировать обновления и резервное копирование).
• Поскольку отчет будет создавать конечный пользователь, должны быть упрощены требования к запросам(должны быть исключены запросы с множественными утверждениями(sql-запрос), с множественными обращениями к реляционным БД).
• Обработка запросов к хранилищу должна проводиться с высокой производительностью (максимально приближена к режиму реального времени)
Основные подходы к архитектуре Хранилищ данных:
• Корпоративная информационная фабрика (CIF) Билла Инмона
• Хранилище данных с архитектурой шины (BUS) Ральфа Кимболла
Архитектура CIF. Этот подход был известен под названием корпоративного ХД. Информация в БД хранится в вивде двумерных таблиц. Получившиеся хранилища используются для того, чтобы наполнить информацией дополнительные репозитории. Данные в них относительно специализированы и предназначены для тех или иных видов анализа.
Конечные витрины данных создаются для обслуживания бизнес-отделов, для реализации бизнес-функций. И используют пространственную модель.
В отличие от исходной РБД данные организованы не в 3й нормальной форме, хотя элементы реляционности здесь присутствуют.. источник данных для таблиц – множество репозиториев.
Отличительные характеристики подхода Билла Инмона:
• Использование реляционной модели организации атомарных данных и пространственной - для организации суммарных данных.
• Использование итеративного или "спирального" подхода при создании больших Хранилищ данных (позволяет вносить изменения в относительно небольшие блоки данных, оформленные в витрины).
• Использование третьей нормальной формы для организации атомарных данных (высокая степень детальности интегрированных данных, которые позволяют широко манипулировать форматами и средствами, способами представления данных).
• Хранилище данных - это проект корпоративного масштаба (охватывает все отделы корпорации, обслуживает всех пользователей).
• Хранилище данных - это не механическая коллекция витрин данных, а физически целостный объект.
Архитектура шины BUS/ первичные данные преобразуются в информацию, используемую на этапе подготовки данных. Пространственная модель ХД содержит ту же атомарную информацию, что и нормализованная модель. При этом запросы в процессе управления обращаются последовательно все к более низкому уровню детализации, как на уровне шины данных и шины витрин. На уровне шины данных пространственные модели служат не для бизнес-отделов, а для бизнес-процессов, которые в свою очередь связаны с отдельными бизнес-показателями или с бизнес-событиями.
Типичные черты подхода Ральфа Кимболла.
• Использование пространственной модели организации данных с архитектурой "звезда"
• Использование двухуровневой архитектуры
• BUS – хранилище обладает характеристиками:
– оно пространственное;
– оно включает как данные о транзакциях, так и суммарные данные;
– оно включает витрины данных, посвященные только одной предметной области или имеющие только одну таблицу фактов (fact table);
– оно может содержать множество витрин данных в пределах одной базы данных.
• Хранилище данных является «виртуальным» хранилищем. Это – коллекция витрин данных, каждая из которых имеет архитектуру типа "звезда".
Дата публикования: 2015-01-25; Прочитано: 313 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!