Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Архитектура хранилища данных



К проектированию хранилищ данных обычно предъявляются следующие требования:

· структура данных хранилища должна быть понятна пользователям;

· должны быть выделены статические данные, которые регулярно модифицируются: ежедневно, еженедельно, ежеквартально;

· должны быть упрощены требования к запросам с целью исключения запросов, которые могли бы требовать множественных утверждений SQL в традиционных реляционных СУБД;

· должна быть обеспечена поддержка сложных запросов SQL, которые требуют последовательной обработки тысяч или миллионов записей [1].

ХД это огромный проект, включающий в себя согласование между многими частями организации. Соответствующая архитектура может помочь созданию проекта. На рис. 2.1 приводится распространенный вариант двухуровневой архитектуры построения хранилища данных.

В рамках этой архитектуры данные из операционной СУБД проходят через процесс трансформации (ETL – процесс) и затем загружаются в хранилище данных через сервер хранилища данных. Доступ к хранилищу данных для извлечения данных для принятия решений осуществляется через сервер.

Трансформационный процесс достаточно трудоемкий. Для него необходимо иметь четкое понятие о предметной области хранилища данных. Для лучшего понимания предметной области необходимо начать построение хранилища данных с концептуальной модели.


 
 


Рис. 2.1. Двухуровневая архитектура построения хранилищ данных

Преимущества подобной архитектуры заключаются в следующем:

Недостатки двухуровневой архитектуры:

В случае выбора архитектуры СППР на основе трехуровневого хранилища данных, последнее представляет собой единый централизованный источник информации для всего предприятия. Витрины данных отражают подмножества данных из хранилища, организованные для решения задач отдельных подразделений компании. Конечные пользователи имеют возможность доступа к детальным данным хранилища, в случае если данных в витрине недостаточно, а также для получения более полной картины состояния бизнеса (рис. 2.2).


Рис. 2.2. Трехуровневая архитектура построения хранилищ данных


Eе преимущества заключаются в том, что:

  • создание и наполнение витрин данных упрощено, поскольку наполнение происходит из единого стандартизованного надежного источника очищенных нормализованных данных;
  • имеется (построена) общая структура данных предприятия;
  • витрины данных синхронизированы и совместимы с общей структурой данных предприятия;
  • существует возможность сравнительно легкого расширения хранилища и добавления новых витрин данных;
  • гарантированная производительность.

Недостатки трехуровневой архитектуры:

  • избыточность данных, ведущая к росту объема хранилища;
  • требуется согласованность с принятой архитектурой многих областей с потенциально различными требованиями (например, скорость внедрения иногда конкурирует с требованиями следовать архитектурному подходу).

Тем не менее, несмотря на указанные недостатки, последняя конструкция наилучшим образом отвечает возможности решения самых разнообразных аналитических и управленческих задач в любой сфере деятельности.

Очевидно, что для принятия качественного решения необходим достаточно полный и глубокий анализ данных, который просто невозможно провести без специального программного обеспечения. Конечно, можно было бы воспользоваться и более простыми программными продуктами такими, как электронные таблицы. Но это годилось бы только для единичных решений, имеющих место один раз в большой промежуток времени.

Предприятие, как правило, ставит перед собой задачу консолидации – накопления – данных различных отделов, для того, чтобы в будущем избежать проволочек с ее получением, а также для ее своевременного обновления. Кроме того, принятие решения в условиях современности предполагает автоматизацию всего процесса анализа данных, начиная от сбора данных и заканчивая формированием необходимой аналитической отчетности. И, наконец, самым важным в формировании механизма принятия решений является возможность поставить его на поток, т. е. обеспечить неоднократное его использование.

Все эти функции сочетают в себе аналитические платформы. Сегодня на рынке программного обеспечения предлагается большое количество таких программных решений. В настоящих методических указаниях мы остановимся на одном из них, а именно платформе Deductor Studio Academic 5.2. Поскольку предоставление полного лицензионного пакета осуществляется на коммерческой основе, работа с данной платформой будет осуществляться в рамках учебной версии.

Кроме возможности работать с единым источником информации, руководители и аналитики должны иметь удобные средства визуализации данных, агрегирования, поиска тенденций, прогнозирования. Несмотря на многообразие аналитической деятельности, можно выделить типовые технологии анализа данных, каждой из которых соответствует определенный набор инструментальных средств. Вместе с хранилищем данных эти средства обеспечивают полное решение для автоматизации аналитической деятельности и создания корпоративной информационно-аналитической системы.





Дата публикования: 2014-11-02; Прочитано: 4144 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...