![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
В процессе консолидации данных решаются следующие задачи:
• выбор источников данных;
• разработка стратегии консолидации;
• оценка качества данных;
• обогащение;
• очистка;
• перенос в хранилище данных.
Сначала осуществляется выбор источников, содержащих данные, которые могут иметь отношение к решаемой задаче, затем определяются тип источников и методика организации доступа к ним.
В связи с этим можно выделить три основных подхода к организации хранения данных.
1. Данные, хранящиеся в отдельных (локальных) файлах, например в текстовых файлах с разделителями, документах Word, Excel и т. д.
2. Базы данных (БД) различных СУБД, таких как Oracle, SQL Server, Firebird, Файлы БД лучше поддерживают целостность структуры данных, поскольку тип и свойства их полей жестко задаются при построении таблиц. Однако для создания и администрирования БД требуются специалисты с более высоким уровнем подготовки, чем для работы с популярными офисными приложениями
3. Специализированные хранилища данных (ХД) являются наиболее предпочтительным решением, поскольку их структура и функционирование специально оптимизируются для работы с аналитической платформой. Большинство ХД обеспечивают высокую скорость обмена данными с аналитическими приложениями, автоматически поддерживают целостность и непротиворечивость данных.
Главное преимущество ХД перед остальными типами источников данных — наличие семантического слоя, который дает пользователю возможность оперировать терминами предметной области для формирования аналитических запросов к хранилищу.
Дата публикования: 2015-01-26; Прочитано: 481 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!