Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Организация Баз Данных 1 страница



Відповідальний за випуск зав. кафедри маркетингу доктор екон. наук, проф. С.М. Ілляшенко

Редактор Н.М. Мажуга

Комп’ютерне верстання: О.В.Черняков

Підп. до друку 27.02.2008, поз.

Формат 60х84/16. Папір офс. Гарнітура Times New RomanCyrДрук офс

Ум. друк. арк. 7,91. Обл.-вид. арк.7,27.

Тираж 100 прим. Собіватість вид.

Зам. №

Видавництво СумДУ при Сумському державному університеті

40007, Суми, вул. Римського-Корсакова, 2

Свідоцтво про внесення суб’єкта видавничої справи до Державного реєстру ДБ 3062 від 17.12.2007.

Надруковано у друкарні СумДУ

40007, Суми, вул. Римського-Корсакова, 2.

Организация Баз Данных

Причина широкого применения средств электронно-вычислительной техники связана с информационным взрывом, сущность которого состоит в том, что количество информации, которое человек должен воспринимать и перерабатывать лавинообразно растет (так называемый экспоненциальный закон информации). Это касается экономики и техники, наук и технологии, медицины и социального обеспечения. Информация, данные все чаще рассматриваются как общие, жизненно важные национальные ресурсы, которые должны быть организованы так, чтобы ценность их была по возможности максимальной.

Перерабатывать большой объем информации в заданные сроки практически невозможно без специальных средств обработки информации. Хотя большая часть информации все еще находится вне ЭВМ, однако, стоимость запоминающих устройств вычислительных машин быстро снижается, поэтому хранить данные в файлах ЭВМ будет дешевле, чем на бумаге.

Резкий рост перерабатываемой информации и накопленный опыт использования электронно-вычислительной техники в различных областях приводят к необходимости пересматривать такую традиционную область управления информацией, как управление данными.

Новый подход к организации процессов обработки данных нашел наиболее яркое выражение в концепциях банков данных, которые позволили принципиально по-новому подойти к вопросам управления информацией в автоматизированных системах. Автоматизированные системы управления, спроектированные на основе концепций банков данных, обладают рядом характерных свойств, выгодно отличающих их от предшествующих разработок, основой которых была система массивов данных, ориентированная на решение комплекса установившихся задач. Использование автоматизированных банков данных позволяет обеспечить многоаспектный доступ к совокупности взаимосвязанных данных, интеграцию и централизацию управления данными, устранение излишней избыточности данных, возможность совмещения эффективных режимов пакетной и телепроцессорной обработки данных.

Автоматизированный банк данных определяют как систему информационных, математических, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоаспектного использования данных для получения необходимой информации. В автоматизированном банке данных часть функций выполняется различными элементами вычислительной техники, а другая - человеком.

Массив данных, хранимый в вычислительной системе, называется базой данных. База данных вместе с системой управления ею является составной частью банка данных. При создании баз данных необходимо уделить особое внимание тому, чтобы данные можно было широко использовать в различного рода приложениях и чтобы способы использования данных можно было легко и быстро изменять. До появления баз данных было чрезвычайно трудно изменить способ организации используемых данных.

Различные программисты по-разному представляли данные и постоянно стремились их модифицировать по мере возникновения новых задач. Эти модификации вызывали значительные изменения существующих программ и поэтому их выполнение обходилось дорого. Для обеспечения гибкости использования данных необходимо учитывать два аспекта разработки баз данных: во-первых, данные должны быть независимы от программ, использующих их, для того, чтобы данные можно было добавлять или перестраивать без изменения программ; во-вторых, должна быть обеспечена возможность запрашивать и отыскивать информацию в базе данных без трудоемкого написания программ на обычном языке программирования.

Таким образом, проектирование баз данных должно основываться на вполне определенной системе положений - четко сформулированной концепции.

Концепция баз данных стала определяющим фактором при создании эффективных систем автоматизированной обработки информации.

Базы и банки данных являются одними из основных компонентов автоматизированных систем различных уровней и типов (АСУП – автоматизированных систем управления предприятиями, АСУ ТП –автоматизированных систем управления технологическими процессами, ОАСУ – отраслевых автоматизированных систем управления, АСНИ – автоматизированных систем управления научными исследованиями, САПР – систем автоматизации проектирования и т.п.). Они создаются для многих сфер и отраслей народного хозяйства: планирования, учета, управлениями предприятиями, статистики, здравоохранения и др.

Поэтому проектирование автоматизированных систем управления различного назначения должно включать в себя и проектирование банков данных.

Информация и данные.

Под информацией понимают любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения или использования.

Понятие об информации как о знании сложилось у человека уже давно. Информация создается и используется во всех областях человеческой деятельности: любая взаимосвязь и координация работ возможны только благодаря информации. Человек создал естественные информационные системы, поскольку существовала насущная потребность снабжать производство информацией, необходимой при контроле и принятии решений, научился собирать эту информацию, обрабатывать и передавать ее по назначению.

Процесс осмысливания понятия информации и ее роли в жизни и деятельности человека продолжается. Понятие информации вместе с другими научными понятиями позволяет более глубоко познать законы развития материального мира. На современном этапе считается, что оно является общим для всех видов и форм движения материи и связывается с тем или иным неотъемлемым свойством или атрибутом материи (отражением, разнообразием, структурой, неоднородным распространением вещества и энергии в пространстве и времени и т.д.).

Данные можно определить как информацию, фиксированную в определенной форме, пригодной для последующей обработки, хранения и передачи.

Соответственно двум понятиям - "информация" и "данные" - в банках данных различают два аспекта рассмотрения вопросов: инфологический и дат алогический.

Инфологический аспект употребляется при рассмотрении вопросов, связанных со смысловым содержанием данных независимо от способа их представления в памяти системы.

На этапе инфологического проектирования информационной системы должны быть решены вопросы:

1) о каких объектах или явлениях реального мира требуется накапливать и обрабатывать информацию о системе;

2) какие их основные характеристики и взаимосвязи между собой будут учитываться;

3) уточнения вводимых в информационную систему понятий об объектах и явлениях, их характеристиках и взаимосвязях.

Таким образом, на этапе инфологического проектирования выделяется часть реального мира, определяющая информационные потребности системы, т.е. ее предметную область.

Даталогический аспект употребляется при рассмотрении вопросов представления данных в памяти информационной системы.

При даталогическом проектировании системы исходя из возможностей имеющихся средств восприятия, хранения и обработки информации разрабатываются соответствующие формы представления информации в системе посредством данных, а также приводятся модели и методы представления и преобразования данных, формулируются правила смысловой интерпретации данных.

По своему назначению банк данных (БнД)- это информационная система. Предметная область (ПО) - это область применения конкретного банка данных. Различают банки данных, применяемые в сфере управления предприятиями и организациями, транспортом, а медицине, научных исследованиях и т.д. В настоящее время банки данных широко используются в составе таких автоматизированных систем, как АСУ различных уровней управления народным хозяйством, автоматизированные справочные системы различного профиля, системы автоматизированного проектирования и т.д.

Предметная область - информационная сторона функционирования автоматизированной системы, отражающая множество объектов и связей между ними. Под предметной областью принято понимать часть реального мира, подлежащую изучению с целью организации управления и в конечном счете автоматизации. Это м/б предприятие, министерство, ВУЗ, служба управления городом. Предметная область представляется фрагментов: например, предприятие - бухгалтерия, отдел кадров, планово-финансовая служба и т.д.

В то же время каждый фрагмент предметной области характеризуется множеством объектов процессов, использующих объекты, а также множеством пользователей, характеризуемых единым взглядом на предметную область. В частности, для бухгалтерии объекты – всевозможные документы: договоры, исполнительные листы, трудовые соглашения, листы нетрудоспособности и др. Процессы бухгалтерии - расчет заработной платы, материальный учет, учет командировочных расходов, банковские операции и др. Пользователи данного фрагмента - сотрудники бухгалтерии, работники финансовых органов.

Предпосылки создания банков данных.

Создание банков данных вызвано следующими основными предпосылками:

1) данные, хранящиеся в информационной системе, отражают часть реального мира; объекты реального мира находятся в сложной взаимосвязи между собой. Системность, взаимосвязанность отображаемых объектов приводит к взаимосвязанности отражающих их информационных единиц. Для того, чтобы обеспечить адекватное отображение реального мира, информационная база должна представлять собой взаимоувязанное целое;

2) информационные потребности различных конечных пользователей пересекаются. Создание локальных массивов приводит к значительному дублированию информации, а единая информационная база сокращает избыточность хранимых данных и обеспечивает многократное обращение к одним и тем же данным разных пользователей;

3) при решении любой задачи выполняется отбор данных, предварительно собранных и зафиксированных в запоминающей среде. Функции создания и ведения информационного фонда, предоставления нужной информации конечному пользователю являются общими для различных задач. Эти функции могут быть отделены от других функций по обработке данных, т.е. от логической и арифметической обработки в соответствии с потребностями конечных пользователей. Для выполнения этих функций создается специальное системное программное обеспечение;

4) современный уровень развития технического и программного обеспечения систем обработки данных, а также теоретического и практического опыта построения информационных систем позволяет создавать эффективные банки данных.

Роль и место банков данных в автоматизированных системах.

Банк данных - это информационная система, включающая в свой состав комплекс специальных методов и средств для поддержания динамической информационной модели предметной области с целью обеспечения информационных запросов пользователей.

Банк данных выступает в роли специальной обеспечивающей подсистемы в составе автоматизированных систем (АС). Приведенное опреде-

       
   
ДРУГИЕ ИСТОЧНИКИ ИНФОРМАЦИИ
 
БАНК ДАННЫХ
 


       
   
 
 


Рис. Банк данных в составе АС

ление очерчивает границу банка данных, как подсистемы в составе автоматизированной системы. Эта граница определяется задачами поддержания информационной модели в требуемом состоянии и обеспечения (информационных запросов пользователей). Входная информация (подготовленная к вводу в информационную модель и являющаяся результатом работы подсистемы сбора и регистрации информации в АС), а также выходная информация (полученная в результате обработки информации, заключенной в модели, и поступающая на вход подсистемы распределения и отображения информации в АС) не рассматриваются как часть информационной модели.

Задача поддержания информационной модели в необходимом состоянии требует, чтобы в банке данных выполнялись операции хранения и модификации (последняя представляет собой совокупность трех операций: включить, удалить, изменить данные) информационной модели в соответствии с возникающими изменениями в состоянии объектов предметной области. Кроме того, с развитием АС видоизменяются состав объектов предметной области и связи между ними, что также должно найти отражение в соответствующих изменениях информационной модели. При этом в рассматриваемых АС используется самая разнообразная по смысловому содержанию информация, представленная в различных кодах. Поэтому организация банков данных должна быть достаточно гибкой, чтобы обеспечивать использование информации различных видов и изменять при необходимости структуру хранимой информации.

Задача обеспечения информационных запросов пользователей имеет два аспекта, которые необходимо рассматривать и учитывать при проектировании банков данных. Первый аспект-это определение границ конкретной предметной области и разработка описания соответствующей информационной модели. Банк данных должен обеспечивать автоматизированную систему всей необходимой информацией, а в идеальном случае и той, которая может потребоваться при дальнейшем расширении АС.

Второй аспект-разработка банка данных, ориентированного на эффективное обслуживание запросов пользователей. Исходя из этого, следует проанализировать типы и виды запросов тех лиц, которые будут пользоваться услугами банка данных, а также функциональные задачи АС, для которой банк данных является источником информации.

Пользователей банка данных можно разделить на две группы по признаку постоянства общения с банком данных. Постоянные пользователи – такие, которые регулярно пользуются услугами банка данных и для которых можно заранее сформулировать типы запросов, определяющие круг их интересов. Предварительное определение тематики запросов пользователей необходимо для организации эффективной обработки запросов.

Постоянные пользователи могут обращаться к системе с произвольными по содержанию запросами. Разовые пользователи - те, которые не имеют постоянных запросов, но могут обращаться к системе с произвольными по содержанию запросами.

Наличие постоянных и разовых пользователей в автоматизированной системе, а следовательно, наличие потока регламентированных и произвольных по содержанию запросов требуют разработки специальных подходов к определению границы ПО и проектированию состава элементов информационной модели. Если бы в автоматизированной системе существовало только поток регламентированных запросов и не ожидалось развития системы, то можно было определить границы ПО и выполнить проектирование исходя из анализа содержания всей совокупности запросов пользователей - это так называемый подход к проектированию "от запросов пользователей". Наличие потока произвольных по содержанию запросов и развитие автоматизированной системы во времени не позволяют в полной мере использовать подход от запроса. В этом случае необходим поход, позволяющий выполнить прогноз смыслового содержания ожидаемой совокупности произвольных запросов. Таким является подход, называемый "от реального мира". С помощью экспертов определяются границы предметной области - состав объектов, их свойства и отношения с учетом развития системы, и затем проектируется модель. Этот подход базируется на предположении, что произвольные запросы пользователей соответствуют тематической направленности АС.

Подход "от реального мира" - основной, подход "от запросов пользователей" используется для уточнения границ предметной области.

Наибольшее применение он получает в период использования автоматизированной системы, когда при работе накапливается достаточно информации о содержании произвольных запросов и необходимо выполнить коррекцию границ ПО и состава элементов информационной модели.

Пользователей банка данных различают также по уровню компетенции, характеризующему возможность доступа пользователей к тем или иным данным. Речь идет о защите определенной части данных от тех пользователей, которые по различным причинам не должны иметь возможность их получения или изменения. Следовательно, банк данных должен иметь специальные средства для обеспечения санкционированного доступа пользователей к данным.

Пользователи банка данных отличаются друг от друга по форме представления запросов, с которыми они обращаются к системе, а также по форме представления затребованной информации.

Пользователи прикладные программисты - особая категория пользователей. Они выполняют работы по программированию функциональных задач.

Так как АС всегда является развивающейся системой (один из принципов создания автоматизированной системы - принцип непрерывного развития), то расширяется круг задач, которые должны решаться в изменяющихся условиях функционирования. Кроме того, при работе АС может возникнуть ситуация, когда целесообразно составить прикладную программу для обработки ряда запросов, которые предполагались произвольными, но оказались относительно постоянными по содержанию и времени поступления. Поэтому в составе обслуживающего персонала АС имеются специалисты в области обработки данных, выполняющие программирование функциональных задач, т.е. разрабатывающие прикладные программы.

Пользователи этой категории обычно умеют работать на нескольких алгоритмических языках программирования, знакомы со средствами обработки, имеющегося в составе используемого банка данных. Для обеспечения нормальной работы этой категории пользователей необходимо наличие в системе словаря данных и хорошо поставленной службы слежения за его состоянием. Из словаря данных узнают о наличии соответствующих типов данных, их структуре и связях между ними, обо всех изменениях, происходящих в структуре информационной модели.

Пользователи-непрограммисты - наиболее многочисленная группа лиц, для удовлетворения информационных потребностей которых и создается банк данных. Поэтому пользователей-непрограммистов еще называют конечными пользователями. Это специалисты в своей области деятельности (руководители подразделений предприятия, работники медицинских учреждений, читатели тематических библиотек, кассиры в сберегательных кассах и т.д.), которые обычно не имеют специальной подготовки по программированию. Они охотнее обращаются к системе, если не требуется много затрат на подготовку запроса. Для этой группы пользователей идеальной может быть система, общение с которой выполняется на естественном языке. Поэтому целесообразно обеспечивать конечных пользователей специальным формализованным языком запросов, напоминающий естественный язык, и работать на этом языке в режиме диалога "пользователь-система", целью которого является уточнение запроса пользователя, оказания пользователю помощи в ознакомлении с возможностями системы.

Таким образом, услугами банка данных пользуется большее число разнородных пользователей. Поэтому в банках данных предусматривается специальное средство приведения всех запросов к единой терминологии - словарь данных. Кроме того, используются специальные методы эквивалентных грамматических преобразований запросов для построения оптимальных процедур их обработки, специальные методы организации доступа к одним и тем же данным различных пользователей при совпадении во времени поступивших запросов.

Сформулируем требования к банку данных. Банк должен:

1) удовлетворять актуальным информационным потребностям внешних пользователей, обеспечивать возможность хранения и модификации больших объемов многоаспектной информации, удовлетворять выявленным и вновь возникающим потребностям пользователей;

2) обеспечивать заданный уровень достоверности хранимой информации и ее непротиворечивость;

3) обеспечивать доступ к данным только пользователей с соответствующими полномочиями;

4) обеспечивать возможность поиска информации по произвольной группе признаков;

5) удовлетворять заданным требованиям производительности при обработке запросов;

6) иметь возможность реорганизации и расширения при изменении границ предметной области;

7) обеспечивать выдачу информации пользователям в различной форме;

8) обеспечивать простоту и удобство обращения внешних пользователей за информацией;

9) обеспечивать возможность одновременного обслуживания большого числа внешних пользователей и т.д.

Стремление к максимальному удовлетворению названных требований приводит к необходимости решать вопрос о централизации управления данными.

По сравнению с традиционным обеспечением монопольными файлами каждого приложения централизованное управление данными имеет ряд важных преимуществ.

1. Сокращение избыточности хранимых данных. Может быть обеспечена минимально необходимая (например, только для обеспечения требуемой производительности системы) избыточность (дублирование) хранимых данных. При установлении факта использования несколькими программами одинаковых данных такие данные интегрируют и хранят в единственном экземпляре. В дальнейшем их используют во всех соответствующих прикладных программах.

2. Устранение противоречивости хранимых данных. Следствием устранения избыточности данных является устранение возможности возникновения противоречивости одних и тех же данных в различных приложениях. Действительно, поскольку устраняется возможность возникновения противоречивости одного и того же данного в различных записях, устраняется ситуация, когда при фактическом изменении значения данного оно окажется измененным не во всех записях.

3. Многоаспектное использование данных. Централизованное управление позволяет в полной мере решать такой вопрос, как обеспечение новых приложений за счет уже имеющихся данных, т.е. обеспечивается реализация принципа однократного ввода и многоаспектного использования данных.

4. Комплексная оптимизация. В максимальной степени устраняются противоречивые требования, например на основе анализа требований пользователей можно выбрать структуры хранения данных, которые обеспечат наилучшее обслуживание в целом.

5. Обеспечение возможности стандартизации. Обеспечивается стандартизация в представлении данных, что упрощает эксплуатацию банка данных, обмен данными с другими автоматизированными системами, облегчает выполнение процедур контроля и восстановления данных.

6. Обеспечение возможности санкционированного доступа к данным. Интеграция (объединение) данных приводит к тому, что данные, используемые различными пользователями, могут пересекаться самым различным образом. В этих условиях особенно важно наличие механизма защиты данных от несанкционированного доступа к ним, т.е. доступ к определенным группам данных должен разрешаться только пользователям с соответствующими полномочиями.

Предоставляя определенные преимущества, централизованное управление данными выдвигает на первый план проблему обеспечения независимости прикладных программ от данных. Эта проблема стояла и до появления банков данных, так как ее решение обеспечивало снижение затрат ручного труда на написание и корректировку программ. Однако с появлением банков данных проблема потребовала кардинального решения, поскольку при интеграции данных и оптимизации структур хранения с целью улучшения характеристик процессов обслуживания запросов пользователей требуется изменять хранимое представление данных и методы доступа к ним. Обеспечение независимости прикладных программ от изменений в хранимых данных становится насущной необходимостью. В противном случае требуется выполнять трудоемкие ручные операции по внесению соответствующих изменений в прикладные программы.

Рассматривая данные как один из ресурсов автоматизированной системы, можно сказать, что банк данных централизованно управляет этим ресурсом в интересах всей системы. Наличие централизованного управления данными - главная отличительная черта банков данных. Таким образом, банк данных – это информационная система, реализующая централизованное управление данными в интересах всех пользователей автоматизированной системы, в состав которой она входит.

Наряду с достоинствами банкам данных присущи и недостатки. Прежде всего увеличивается сложность создаваемых информационных систем. Создание банков данных требует высокой квалификации разработчиков. Использование интегрированных баз данных может привести к потере эффективности отдельных приложений. Применение сложных структур данных увеличивает долю служебной информации в общем объеме хранимых данных. Банки данных предъявляют повышенные требования к применяемым в системе техническим и программным средствам. Часть ресурсов ЭВМ, иногда довольно значительная, расходуется собственно на нужды самой системы управления базами данных. Недостатком банков данных является также то, что последствия сбоев становятся более чувствительными и их труднее исправлять по сравнению с традиционной файловой обработкой.

Банк данных как автоматизированная система.

Банк данных включает следующие основные компоненты: базу данных (БД); систему управления базой данных (СУБД); администратора базы данных (АБД); словарь данных; вычислительную систему; обслуживающий персонал (два последних компонента здесь не рассматриваются).

База данных - это датологическое представление информационной модели предметной области. Приведенное определение базы данных является обобщенным. В зависимости от используемого представления возможна конкретизация определения базы данных.

Система управления базой данных - это специальный пакет программ, посредством которого реализуется централизованное управление базой данных и обеспечивается доступ к данным.

 
 


В каждой СУБД прежде всего имеются трансляторы либо интерпретаторы с языка описания данных (ЯОД) и с языка манипулирования данными (ЯМД), единые для всей базы данных. При создании интегрированных банков данных, т.е. банков данных, включающих в свой состав несколько разнотипных СУБД, каждая из которых используется в отдельном локальном банке и характеризуется наличием своего, отличающегося от других языков описания данных и языков манипулирования данными, разрабатываются единые для всего интегрированного банка язык описания данных и язык манипулирования данными, обеспечивающие работу с данными любого локального банка.

Описание структуры данного некоторого типа на формализованном языке называют схемой этого данного. Язык описания данных - это язык высокого уровня, предназначенный для задания схемы базы данных. С его помощью описываются типы данных подлежащих хранению в базе или выборке из базы данных, их структура и связи между собой.

Язык манипулирования данными (или язык запросов к базе данных) представлен системой команд манипулирования данными. В нем могут быть, например, следующие команды:

1) произвести выборку из базы данных конкретного данного, значение которого удовлетворяет заданным условиям;

2) произвести выборку из базы данных всех данных определенного типа, значения которых удовлетворяют заданным условиям;

3) найти в базе позицию данного и поместить туда его новое значение либо удалить данное и т.д.

В каждой СУБД существует собственный алгоритмический язык, позволяющий кроме операций манипулирования данными выполнять арифметические операции, операции ввода-вывода и т.п.

Во многих СУБД имеются специальные средства обеспечения защиты данных от некомпетентного их использования и сбоев технических средств, средства контроля достоверности данных, средства автоматического накопления статистики использования тех или иных данных различными категориями пользователей (с целью оптимизации размещения данных в памяти). В некоторых системах разработаны специальные языки запросов, ориентированные на пользователей-непрограммистов.

Словарь данных, представляющий собой специальную систему в составе базы данных, предназначенную для хранения единообразной и централизованной информации обо всех ресурсах данных конкретного банка данных, является следующим важным компонентом банка данных. В словаре данных содержатся сведения: об объектах, их свойствах и отношениях для данной предметной области; о данных, хранимых в базе данных (их наименования, смысловое описание, структура, связи с другими данными); о возможных значениях и форматах представления данных; об источниках возникновения данных; о кодах защиты и разграничения доступа к данным и т.п.





Дата публикования: 2014-11-28; Прочитано: 464 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.016 с)...