Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Сравнение основных подходов к архитектуре ХД



Проектирование хранилищ – сложная задача:

• Менеджеру, принимающему решения, необходимы самые разнообразные отчеты, причем зачастую новые.

• Данные в хранилище должны регулярно пополняться (необходимо тщательно планировать обновления и резервное копирование).

• Поскольку отчет будет создавать конечный пользователь, должны быть упрощены требования к запросам(должны быть исключены запросы с множественными утверждениями(sql-запрос), с множественными обращениями к реляционным БД).

• Обработка запросов к хранилищу должна проводиться с высокой производительностью (максимально приближена к режиму реального времени)

Основные подходы к архитектуре Хранилищ данных:

• Корпоративная информационная фабрика (CIF) Билла Инмона

• Хранилище данных с архитектурой шины (BUS) Ральфа Кимболла

Архитектура CIF. Этот подход был известен под названием корпоративного ХД. Информация в БД хранится в вивде двумерных таблиц. Получившиеся хранилища используются для того, чтобы наполнить информацией дополнительные репозитории. Данные в них относительно специализированы и предназначены для тех или иных видов анализа.

Конечные витрины данных создаются для обслуживания бизнес-отделов, для реализации бизнес-функций. И используют пространственную модель.

В отличие от исходной РБД данные организованы не в 3й нормальной форме, хотя элементы реляционности здесь присутствуют.. источник данных для таблиц – множество репозиториев.

Отличительные характеристики подхода Билла Инмона:

• Использование реляционной модели организации атомарных данных и пространственной - для организации суммарных данных.

• Использование итеративного или "спирального" подхода при создании больших Хранилищ данных (позволяет вносить изменения в относительно небольшие блоки данных, оформленные в витрины).

• Использование третьей нормальной формы для организации атомарных данных (высокая степень детальности интегрированных данных, которые позволяют широко манипулировать форматами и средствами, способами представления данных).

• Хранилище данных - это проект корпоративного масштаба (охватывает все отделы корпорации, обслуживает всех пользователей).

• Хранилище данных - это не механическая коллекция витрин данных, а физически целостный объект.

Архитектура шины BUS/ первичные данные преобразуются в информацию, используемую на этапе подготовки данных. Пространственная модель ХД содержит ту же атомарную информацию, что и нормализованная модель. При этом запросы в процессе управления обращаются последовательно все к более низкому уровню детализации, как на уровне шины данных и шины витрин. На уровне шины данных пространственные модели служат не для бизнес-отделов, а для бизнес-процессов, которые в свою очередь связаны с отдельными бизнес-показателями или с бизнес-событиями.

Типичные черты подхода Ральфа Кимболла.

• Использование пространственной модели организации данных с архитектурой "звезда"

• Использование двухуровневой архитектуры

• BUS – хранилище обладает характеристиками:

– оно пространственное;

– оно включает как данные о транзакциях, так и суммарные данные;

– оно включает витрины данных, посвященные только одной предметной области или имеющие только одну таблицу фактов (fact table);

– оно может содержать множество витрин данных в пределах одной базы данных.

• Хранилище данных является «виртуальным» хранилищем. Это – коллекция витрин данных, каждая из которых имеет архитектуру типа "звезда".





Дата публикования: 2015-01-25; Прочитано: 313 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...