Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Принципиальные подходы к обработке данных



Традиционный подход

С самого начала развития вычислительной техники сложилось два основных направления ее использования. Первое было связано с вы­полнением численных расчетов, которые слишком долго или вообще невозможно произвести вручную. Это способствовало быстрому про­грессу численных методов решения математических задач, развитию класса языков программирования, ориентированных на удобную записьсоответствующих алгоритмов, становлению обратной связи с разработ­чиками новых архитектур ЭВМ. Обработка данных при этом велась по определенной схеме, представленной на рис. 42.

Рис. 42. Традиционный подход к обработке данных

При таком подходе в центре внимания оказыва­лись функции обработки данных, а не сами данные. В частности, когда разра­батывались программы для каких-либо целей, в пер­вую очередь определялись их функции, а лишь затем необходимый формат дан­ных. В результате каждая

прикладная программаимела свои собственные входные и выходные файлы данных, ориентированные на ее специфику. По мере роста коли­чества таких программ неизбежно возникали две проблемы.

Во-первых, определенная часть информации была необходима одно­временно для нескольких приложений и, таким образом, оказывалась в файлах каждой задачи. Дублирование информации требовало большей емкости внешних запоминающих устройств, а следовательно, увеличивало стоимость компьютера. Впрочем, удешевление оперативной и внешней памяти отчасти компенсировало этот недостаток. Более серьезная про­блема - то, что при многократном хранении одних и тех же данных ста­новится трудно вносить в них изменения, не нарушая их целостности.

Во-вторых, поскольку каждое приложениеразрабатывалось неза­висимо, часто использовалось различное представление одной и той же информации. Нередко возникали случаи, когда пользователи одной и той же ЭВМ вводили в свои программы разные наборы данных, содержащие сходную информацию. Иногда пользователь просто не знал, что в соседней комнате или за соседним столом сидит сотрудник, который уже давно ввел нужные ему данныев машину. Но в действительности проблема имела гораздо более принципиальный характер. Разработчики прикладных программ (написанных, например, на Бейсике, Паскале или Си) размещают нужные им данные в файлах, организуя их наиболее удобным для себя образом. При этом одни и те же данные могут иметь в разных приложениях совершенно разную организацию (разную по­следовательность размещения в записи, разные форматы одних и тех же полей и т.п.). Объединить такие данные чрезвычайно трудно: любое изменение структуры записи файла, производимое одним из разработчи­ков, приводит к необходимости изменения другими разработчиками тех программ, которые используют такие записи.

Таким образом, основные недостатки первого направления использо­вания ЭВМ и присущего ему традиционного подхода к обработке данных заключались в следующем:

дублирование информации;

несовместимость данных;

ограниченные возможности разделения данных;

невысокая производительность программ;

сложность модификации программ и файлов данных.

Второе направление использования средств вычислительной тех­ники было связано с созданием автоматизированных информационных систем. В широком смысле информационная системапредставляет собой программно-аппаратный комплекс, функции которого состоят в поддержке надежного хранения информации в памяти компьютера, выполнении специфических преобразований информации и предостав­лении необходимых данных пользователю. Обычно объемы информации, с которыми приходится иметь дело таким системам, достаточно велики, а сама она имеет достаточно сложную структуру. Классическими при­мерами информационных систем являются банковские системы, систе­мы резервирования авиационных или железнодорожных билетов, мест в гостиницах и т.д.

Это направление возникло несколько позже первого, поскольку длительное время объемы внешней памяти компьютеров были весьма ограниченными. Такое ограничение не очень существенно для числен­ных расчетов; даже если программадолжна обработать большой объем данных, при программировании можно организовать их размещение во внешней памяти таким образом, чтобы скорость обработки была доста­точно высокой.

Для информационных систем, где потребность в текущих данных определяется пользователем, а не программистом, использование магнитных лент и барабанов не решало проблемы (достаточно представить себе покупателя билета, который, стоя у кассы, ждет полной перемотки магнитной ленты накопителя). Средняя скорость выполнения запросов должна быть достаточно высокой; именно это требование привело к появлению магнитных дисков с подвижными головками, а тем самым и к революции в технической базе ЭВМ. Эти устройства внешней памяти обладали существенно большей емкостью, чем магнитные барабаны, обеспечивали удовлетворительную скорость доступа к данным в режиме произвольной выборки, а возможность смены дискового пакета на устрой­стве позволяла иметь практически неограниченный архив данных.

Активные поиски приемлемых способов объединения непрерывно ра­стущего объема разнородных данных, а также появление магнитных дис­ков привело к созданию в начале 60-х годов систем управления данными во внешней памяти - принципиально нового подхода к их обработке.

Подход на основе баз данных

На первый взгляд, подход на основе баз данных (БД) может показаться обманчиво простым (рис. 43). Данные при этом занимают центральное место, функции обработки перемещаются на периферию системы, инфор­мация запрашивается из общей базы по мере необходимости, результаты помещаются туда же. Поскольку все приложения используют единую базу данных, дублирование (а следовательно, и несоответствие данных) практически невозможно. Для всех пользователей существует только одно представление информации или ее части и только один механизм манипулирования ею. Становится нетрудно устанавливать и желаемые взаимоотношения между различными типами данных.

Рис. 43. Подход к обработке данных на основе баз данных

Накопление всех данных по организации в одном банке подчеркивает важность информации для ее нормального функционирования и необхо­димость адекватных денежных вложений для накопления информации и поддержания БД. В настоящее время данныедолжны рассматриваться как один из основных организационных ресурсов (наряду с денежными

средствами, трудовыми ресурсами и т.д.); административные структуры должны нести ответственность за общее управление и контроль над ними.

Наиболее общее и полное определение БД дается в Законе РФ «О правовой охране программ и электронно-вычислительных машин и баз данных». Согласно ст. 1 данного закона база данных- это объективная форма представления и организации совокупности данных, системати­зированных таким образом, чтобы эти данныемогли быть найдены и обработаны с помощью ЭВМ. В нестрогом смысле слова БД - это сово­купность данных и связей между ними, хранящихся в виде одного или более файлов данных с произвольной организацией доступа.

Пользователей баз данных можно разделить на три категории: конеч­ные пользователи {те, кто вводит и извлекает данные), программисты (те, кто пишет прикладные программы их обработки) и администраторы баз данных. При использовании крупных БД может быть несколько типов конечных пользователей, программистов и администраторов; напротив, для небольших баз данных все эти функции может выполнять один че­ловек.

Можно назвать следующие преимущества использования БД:

контроль за дублированием и несоответствием данных;

совместимость данных;

хранение данных в виде единого банка данных;

более простое разделение данных между приложениями;

более эффективное управление данными как важнейшим организа­ционным ресурсом;

увеличение производительности прикладных программ и повышение их надежности;

возможность быстрого и экономичного доступа к информации;

надежная защита данных от повреждения и неавторизованного до­ступа;

обеспечение независимости данных.





Дата публикования: 2014-11-18; Прочитано: 1081 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...