Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Основные компоненты информационной технологии обработки данных



Сбор данных. По мере того как фирма производит продукцию или услуги, каждое ее действие сопровождается соответствующими записями данных. Обычно действия фирмы, затрагивающие внешнее окружение, выделяются особо как операции, производимые фирмой.

Обработка данных. Для создания из поступающих данных информации, отражающей деятельность фирмы, используются следующие типовые операции:

- классификация или группировка. Первичные данные обычно имеют вид кодов, состоящих из одного или нескольких символов. Эти коды, выражающие определенные признаки объектов, используются для идентификации и группировки записей.

- сортировка, с помощью которой упорядочивается последовательность записей;

- вычисления, включающие арифметические и логические операции. Эти операции, выполняемые над данными, дают возможность получать новые данные;

- укрупнение или агрегирование, служащее для уменьшения количества данных и реализуемое в форме расчетов итоговых или средних значений.

Хранение данных. Многие данные на уровне операционной деятельности необходимо сохранять для последующего использования либо здесь же, либо на другом уровне. Для их хранения создаются базы данных.

Создание отчетов (документов). В информационной технологии обработки данных необходимо создавать документы для руководства и работников фирмы, а также для внешних партнеров. При этом документы или в связи с проведенной фирмой операцией так и периодически в конце каждого месяца, квартала или года.

4. Модель «Сущность-связь». Базовые понятия.

Эта модель была предложена в 1976 году П. Ченом и с тех пор неоднократно усовершенстволась самим Ченом, Баркером и другими. Модель содержит аналоги всех семантических объектов, которые присутствуют на инфологическом уровне. Базовые понятия модели:

1. Сущность (entity) - используется для моделирования типов (классов) объектов. Экземпляры сущности отличаются друг от друга и однозначно идентифицируются.

2. Атрибут (property) сущности - описывает свойства объекта. Все объекты одного типа обладают общими свойствами. Значения свойств каждого типа извлекаются из некоторого множества значений, называемых доменом.

Атрибуты могут быть однозначными и многозначными. Как правило, атрибут конкретного экземпляра сущности должен иметь одно значение. Однако в ER-модели допускаются повторяющиеся группы атрибутов.

Могут быть также простые, составные, производные и отсутствующие атрибуты. Простому соответствует один атрибут, составному - группа атрибутов, производный - вычисляемый, отсутствующий может не иметь конкретного значения (NULL).

3. Ключ сущности - атрибут или набор атрибутов, используемых для идентификации экземпляров сущности.

4. Cвязь (Relationship) - означает поименованную ассоциацию между сущностями, значимую для предметной области. Связь- это ассоциация между сущностями, при которой каждый экземпляр одной сущности (E1) ассоциируется с призвольным, в том числе и нулевым количеством экземпляров другой сущности (E2).

Сущности, включенные в данную связь, называются ее участниками, а количество участников, степенью этой связи. Часто предполагается, что все связи являются бинарными, т.е. степени 2. Но в связь могут быть вовлечены более чем 2 сущности, также может существовать связь между сущностью и ее самой (рекурсивная связь). Между сущностями может быть несколько типов связей. Тип связи означает связь между экз сущ. Типы связей могут быть 1:1, 1:M, N:M.

Связь между экземплярами двух сущностей может быть обязательной или необязательной. Обязательная означает, что каждый экземпляр одной сущности должен быть связан с экземплярами другой (одним или более). Необязательная означает, что экземпляр одной сущности может быть не связан с экземплярами другой. Обязательное участие сущности в связи называют полным, а в противном случае – частичным (необязательным).

5. Сущности, которые зависят от других, называются слабыми, они не могут существовать, если нет связанного с ними экземпляра другой сущности.

6. Подтипы и супертипы.

Эти концепции не были первоначально включены в модель”сущность - связь” и появились в процессе развития этой модели.

Как правило, каждая сущность имеет один тип, но у некоторых сущностей могут быть несколько подтипов. Такая сущность называется супертипом. Подтипы представляют собой сущности, которые наследуют атрибуты супертипа и имеют свои собственные. Все подтипы полной сущности являются взаимоисключающими. В модели необходимо представить полный набор подтипов. Например, супертип - Служащие и подтипы: программисты, инженеры, экономисты и т.д.

Интернет как информационный ресурс, структура и содержание.

Обычно под словом «Интернет» понимается глобальная компью­терная сеть. С точки зрения пользователя Ин­тернет можно рассматривать как мощное глобальное средство обмена инф-ей. Одним из распространенных и перспективных серви­сов Интернет является сервис прямого доступа Word Wide Web — WWW, представляющий собой систему документов, включающих текстовую и графическую инф-ю, размещенных на узлах Интер­нет и связанных между собой гиперссылками.

Классификация источников инф-и в Интернете может про­водиться по разным основаниям.

По способам представления инф-и могут быть выделены следующие виды:

web-страницы — наиболее распространенный и используемый из ИР. Этот ресурс представляет собой страницы гипертекста. Страницы наряду с текстовой могут со­
держать графическую, звуковую, видеоинф-ю; файловые серверы представляют собой реализацию в Интернете традиционного способа представления инф-и; телеконференции могут являться важным источником инф-и. Базы данных могут быть доступны через сеть Интернет. В них часто содержатся, кроме текстовой, также и другие виды инф-и.

ИР также могут быть разделены по языко­вому признаку. В сети Интернет представлены практически все ос­новные языки, однако главным является английский. Ряд сайтов представляет инф-ю на нескольких языках.

Наиболее важным аспектом классификации ИР сети Интернет является содержание инф-и. Деловая инф-я, необходимая в предпринимательской деятельности, по этому критерию может быть разделена на следующие группы.

1. Сведения о фирмах, организациях. Различают три типа серверов данной группы:

- серверы присутствия в Интернете. Эти серверы могут быть разделены на рекламные и информирующие серверы.
- инф-е серверы. Цель - предоставление различного рода инф-и потребителям.
- интерактивные магазины. Серверы этой группы обеспечивают продажи товаров посредством Интернета.

2. Сведения о состоянии мировой экономики и экономики отдельных стран. Данная инф-я представлена достаточно широко в профессиональных базах крупнейших инф-но-анали­тических агентств мира. Однако сама инф-я, как правило, платная. Инф-я о состоянии национальной экономики обычно размещается на серверах гос.структур, отвечающих за гос. поддержку экономики, гос. статистических органов, различных экономических институтов.

3. Сведения о состоянии отраслевых рынков. Анализ отраслевых рынков осущ-ют специализированные маркетинговые и консал­тинговые агентства, а также маркетинговые службы фирм или орг-ий.

4. Деловые новости. Подавляющее большинство мировых инф-х агентств предоставляют потребителям доступ к про­фессиональным базам, содержащим деловые новости. Зарубежные агентства - LEXIS-NEXIS, Dialog, Reuters. Среди отечественных агентств следует выделить:

«Интегрум-Техно», предоставляющий доступ к материалам 250 центральных и крупнейших региональных газет, а также к зарубежным новостям; РИА «Новости» — государственное информационно-аналити­ческое агентство РФ; «ИТАР-ТАСС» — государственное инф-ое телеграфное агентство РФ; агентство «Интерфакс», входящее в состав международной инф-ой группы Interfax Information Services.

Интернет предоставляет бесплатный доступ к ежедневной элек­тронной интернет-газете «Gazeta.ru». Ряд крупнейших газет име­ют в Интернете электронные версии. Доступ к некоторым из них платный («Коммерсантъ»). К другим, напр-р,«Аргументы и факты», — бесплатный. 5. Справочная инф-я представлена в сети Интернет весьма широко: списки web-сайтов компаний, отобранных по опред. принципу, телефонно-адресные справочники с возможностью поиска инф-и по названию фирмы и виду деят-ти, телефонные справочни­ки городов РФ, стран СНГ и Балтии, инф-я о расписании движения поез­дов, авиарейсов, о погоде и др.

Виды инф-и, хранимой в Интернете и профессиональных базах. В соответствии с Законом от 20 февраля 1995 г. № 224-ФЗ «Об инф-и, информатизации и защите инф-и» под терми­ном «инф-я» понимаются сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представле­ния. Лица, предметы, факты, события, явления и процессы являются клас­сами объектов. Предметная область — это классы объектов, инф-я о которых необходима в данном виде деятельности человека. В каж­дой предметной области потребителей интересует четко определенный перечень свойств и глубина описания этих свойств. Очевидно, что перечни интересующих потребителя свойств о лице в экономике и в ме­дицине будут различны.

Инф-я о предметной области, то есть об объектах и их свя­зях, может быть представлена в двух видах: формализованном и в виде текста на естественном языке.

Формализованное описание конкретного объекта включает имя свой­ства (характеристики) и значение этого свойства для данного объекта. Имя свойства отражает ту грамматическую роль, которую играет зна­чение этого свойства по отношению к данному классу объектов. Зна­чение свойства (характеристики) может задаваться нормированным словарем или произвольно. Названия классов объектов, свойств и областей возможных значе­ний этих свойств (характеристик), то есть язык формализованного описания для каждой предметной области, разрабатывают квалифи­цированные специалисты данного вида деятельности. С помощью отдельных свойств устанавливаются связи между объектами. Формализованный язык описания предметной об­ласти выполняет следующие основные функции:

§ позволяет источнику отбирать лишь ту инф-ю и описы­вать ее так, как это необходимо потребителю;

§ позволяет в базах данных отражать инф-ю в том же виде, в каком она отражена в сознании специалиста в данной предметной области;

§ позволяет в информационных системах по указанию потреби­теля производить автоматическую обработку формализованной инф-и;

§ существенно облегчает поиск необходимой инф-и в базах данных.

Другим видом инф-и о предметной области является инф-я, представленная в виде текста на естественном языке.

Индивидуальное знание предметной области источником и потребителем инф-и складывается из совокупно­сти представлений и понятий. Представления — это чувственно наглядные образы объектов реального мира. Представления носят субъективный харак­тер, который определяется внутренним психологическим миром данного человека. Понятия образуются в результате логического осмысления пред­ставлений об объектах реального мира и являются формой абстракт­ного мышления, отражающей и фиксирующей существенные призна­ки данных объектов. Понятия более объективны и в большей степени отражают коллективный опыт. Понятия и представления тесно связа­ны друг с другом и являются формой отражения реальной действи­тельности в мышлении.

Язык — это средство, с помощью которого люди передают друг дру­гу инф-ю о реальном мире. Общими недостатками естественного языка с позиций оценки эффективности поиска являются избыточ­ность и недостаточность.(одно и то же слово приобретало множество различных зна­чений, и для одного и того же слова использовалось несколько словес­ных выражений). Работы в области машинного перевода и теории построения доку­ментальных информационных систем, проводимые в течение последних 50 лет в нашей стране и за рубежом, показали, что процесс выявления смысла произвольного текста на естественном языке не подлежит ав­томатизации и может быть реализован лишь человеком, обладаю­щим глубокими знаниями в данной предметной области. Однако общество нуждалось в построении документальных ИС, в первую очередь в области научно-технической инф-и. Для того чтобы облегчить поиск в больших массивах текстовой инф-и, стали строить инф-поисковые системы, в которых документы описывались с помощью специальных поисковых языков. С помощью элементов этих же языков описывались и запросы. Для отбора документов в ответ на запрос осуществ­лялось сравнение поисковых образов запросов и поисковых образов документов, которое проводилось на одном и том же искусственном язы­ке. Такой подход является вынужденным.

Из-за недостатков естественного языка, отмеченных выше, доку­ментальные инф-е системы не дают ответа на вопрос по­требителя, а выдают ему документы, в которых может содержаться ответ на его запрос, предоставляя потребителю самому выявить смыс­ловое содержание этих документов. Вопросы оценки эффективности поиска инф-и в документальных информационных системах будут рассмотрены ниже





Дата публикования: 2015-02-03; Прочитано: 1043 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.013 с)...