Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Распределённые системы обработки данных



В современных сетевых информационных технологиях всё чаще используют распределённую обработку данных. Она позволяет повысить эффективность удовлетворения информационных потребностей пользователей, обеспечить гибкость и оперативность принимаемых им решений и др.

Под распределённой обработкой данных понимают обработку приложений несколькими территориально разделёнными ЭВМ. При этом в приложениях, связанных с обработкой базы данных, собственно управление базой данных может выполняться централизованно.

Технология распределённой обработки данных представляет стандартный набор сетевых служб для выполнения прикладных процессов, рассредоточенных по группе абонентских систем (по гетерогенной сети). При этом создаются распределённые базы и банки данных. Обработка информации в базе ведётся на компьютере клиента, а поддержание базы в актуальном состоянии – на сервере. Доступ пользователей к БД и администрирование ею осуществляются с помощью системы управления распределённой базой данных (СУРБД).

Подобные системы дают возможность пользователям безадресно обращаться к любым хранящимся в них данным и порой предоставляют новые, ранее неизвестные, возможности работы с информацией. При этом возникают новые проблемы, решаемые путём использования новых технологий.

В распределенных системах используются три интегрированные технологии:

1. «клиент-сервер»;

2. совместного использования ресурсов в глобальных сетях;

3. универсального пользовательского общения в виде электронной почты.

Распределенная обработка данных (Distributed Data Processing, DDP) - это методика выполнения прикладных программ группой систем. При этом пользователь получает возможность работать с сетевыми службами и прикладными процессами, расположенными в нескольких взаимосвязанных абонентских системах.

Распределённая обработка данных позволяет повысить эффективность удовлетворения информационных потребностей пользователей, обеспечивает гибкость и оперативность принимаемых ими решений.

Функции распределённой среды включают службы:

Наиболее часто данные размещаются в БД. Ими обычно управляют локальные СУБД, то есть размещённые на том же компьютере. Когда несколько таких БД удалены друг от друга на большие расстояния, то возникает необходимость решения задач управления ими, то есть распределёнными БД. Для решения таких задач между ЭВМ с локальными СУБД и БД организуют сеть передачи данных по каналам связи, а в ней обеспечивают техническую и программную поддержку обмена данными. То есть в этом случае используют ПО, управляющее распределёнными базами данных, которые могут образовывать банки данных.

Распределённые базы данных (англ. "Distributed DataBase", DDB) представляют определённым образом связанные между собой БД, рассредоточенные на какой-либо территории (локально или регионально), обеспечивающие свободный обмен информацией и поиск данных в них.

Распределённая база данных предполагает хранение и выполнение функций управления данными в нескольких узлах и передачу данных между этими узлами в процессе выполнения запросов. Разбиение данных в распределённой базе данных может достигаться путём хранения различных таблиц на разных компьютерах или даже хранения разных частей и фрагментов одной таблицы на разных компьютерах. Для пользователя или прикладной программы не имеет значения, каким образом распределены данные между компьютерами. Работа с распределённой базой данных осуществляется так же, как и с централизованной, т. е. размещение БД должно быть прозрачно.

При распределённой обработке работа с базой (представление данных, их обработка и др.) ведётся на компьютере клиента, а поддержание базы в актуальном состоянии – на сервере. При этом такие БД обычно располагаться на нескольких серверах – различных узлах компьютерной сети, а некоторые данные могут дублироваться.

Размещение частей общей БД бывает избыточным или безызбыточным. При избыточном размещении определяют степень дублирования частей (фрагментов) единой БД. Чтобы поддерживать целостность БД необходимо постоянно корректировать все её копии. Преимущества дублирования уменьшаются, когда увеличивается стоимость хранения её частей, что связано с необходимостью обеспечивать устойчивость системы.

Создание распределённых баз данных (РБД) вызвано попыткой одновременного решения двух задач: интеграции и децентрализации.

Интеграция подразумевает централизованное управление и ведение баз данных.

Децентрализация обеспечивает хранение данных там, где они появились и обрабатываются. При этом снижается стоимость системы и увеличивается степень её надёжности, а также повышается скорость обработки данных.

Выделяют однородные и неоднородные РБД. В неоднородных РБД используются различные СУБД. Основная проблема при этом заключается в сложности их интеграции.

Доступ пользователей к РБД и администрирование ею осуществляются с помощью системы управления распределённой базой данных (СУРБД).

Система управления распределёнными базами данных (Distributed dataBase management system, DDBMS) - это система управления базами данных, расположенными в нескольких узлах информационной сети.

В СУРБД используется комбинация централизованного и локального способов хранения данных.

Для решения задач с распределёнными БД, во-первых, необходимо организовать между этими ЭВМ сеть передачи данных, то есть соединить их каналами связи. Затем обеспечивают техническую и программную поддержку обмена данными между ними, образуя тем самым сеть ЭВМ.

СУРБД создаются таким образом, чтобы максимально обеспечить соблюдение принципа независимости прикладных программ от локализации данных в сети. При этом логическое представление распределённой БД и манипулирование данными для прикладной программы ничем не отличаются от работы пользователя с локальной базой. Такие СУРБД оснащены каталогами, в которых хранятся структура сети, информация о локальных СУРБД и базах данных, а также программным обеспечением, которое на основе этой информации управляет взаимодействием прикладной программы и конкретной локальной базой данных сети.

Сложность управления распределёнными базами данных во многом зависит от того, поддерживаются ли они однотипными локальными СУРБД, взаимодействие между которыми осуществляется просто. В противном случае в такую сеть включают различные программные и технические устройства, обеспечивающие единый интерфейс, согласование и возможность выполнения информационных процессов, например, использовать промежуточную интерфейсную СУРБД и др.

Распределенные банки данных (РБнД).

Если накапливаемая в сетях машиночитаемая (электронная) информация не размещается на одной ЭВМ, то доступ к подобным базам и банкам данных осуществляется с помощью сетевых СУБД. Они дают возможность безадресно обращаться к любым данным (аналогично обычным БД, расположенным на одной ЭВМ) и порой предоставляют пользователям новые, ранее неизвестные, возможности работы с информацией. При этом возникают новые проблемы, решение которых осуществляется путём использования новых технологий.

Практически с момента возникновения компьютеров предпринимались попытки объединения большого количества вычислительных ресурсов. Реальная возможность для такого объединения появилась в конце XX столетия. Она обусловлена развитием компьютерных архитектур, непрерывным ростом производительности, улучшением пропускной способности коммуникационных сред, а также новыми технологиями разработки программ. Совместное использование ресурсов в глобальных сетях позволяет осуществлять распределенные вычисления, способствующие существенному сокращению времени вычислений и получения результата вычислений.

Для реализации такой задачи создана технология Grid (с англ. «сетка»). Термин аналогичен термину «электрическая сеть» (англ. «power grid»), предоставляющему всепроникающий доступ к источникам электроэнергии, но вместо электричества предоставляются вычислительные мощности. Grid оценивается как инфраструктура, способная фундаментально изменить представление о вычислительных сетях и их возможностях. в GRID интегрируется большой объем географически удаленных компьютерных ресурсов, при этом пользователя не интересует где находятся используемые им ресурсы. IBM анонсировала эту технологию в 2003 г.

GRID – это распределенная программно-аппаратная компьютерная среда, с принципиально новой организацией вычислений и управления потоками заданий и данных. Она предназначена для объединения вычислительных мощностей различных организаций.

Важнейшим компонентом GRID-инфраструктуры является промежуточное программное обеспечение (англ. «middleware»), предназначенное управлять заданиями, обеспечивать безопасный доступ к данным большого объема в универсальном пространстве имен, перемещать и тиражировать данные с высокой скоростью из одного географически удаленного узла на другой и организовывать синхронизацию удаленных копий.

На основе технологии GRID формируются региональные и национальные вычислительные компьютерные инфраструктуры с целью создания объединенных интернациональных ресурсов, доступных широкому кругу пользователей и предназначенных для решения крупных научно-технических задач.





Дата публикования: 2015-10-09; Прочитано: 1239 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...