Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Современные ИС, основанные на обработке баз данных



В течение последних лет особенно значительное расширение практического применения информационных технологий и ИС, основанных на обработке баз данных, произошло в экономике. Информационные потоки и созданные для управления ими информационные системы сопровождают все стадии цикла «производство-потребление» и соответствующего этим стадиям движения денежных средств в общественном производстве. Основное назначение таких информационных систем – обеспечить обработку и выдачу информации для принятия решений по управлению функционированием и развитием экономического объекта. Необходимая для выполнения этой задачи информация включает базы данных и модели анализа объекта управления, его окружения, внешних неконтролируемых факторов. Современные ИС в экономике все более дифференцируются по областям применения (ИС бухгалтерского учета, системы поддержки принятия решений, информационные системы менеджмента и др.). Рассмотрим основные особенности и возможности некоторых из них.

Информационные системы менеджмента. Информационными системами менеджмента (ИСМ, от англ. MIS – Management Information System), или управленческими системами, называют комплексы программ, обеспечивающие выполнение таких основных управленческих функций, как управление финансовыми и товарными потоками, себестоимостью продукции и персоналом на этапах стратегического и оперативного планирования, оперативного и бухгалтерского учета. Интегрированные системы менеджмента – наиболее полные и наиболее сложные из таких систем. Их называют корпоративными или комплексными, информационными системами.

Галактика. Эта система использует единую базу данных и объединяет более 40 модулей, предназначенных для автоматизации решения задач бухгалтерского и управленческого учета, анализа хозяйственной деятельности, планирования, технико-экономической подготовки производства и т. д. Хотя система уже имеет целостную информационную систему управления предприятием, продолжается развитие её компонент, связанных с управлением финансами, ресурсами и производственным планированием.

IFS Applications™ (разработка шведской компании IFS – Industrial & Financial Systems). Комплекс охватывает основные сферы деятельности предприятия вне зависимости от его профиля и является полномасштабным интегрированным продуктом класса ERP (Enterprise Resource Planning – планирование ресурсов предприятия). ERP-системы строятся на основе единого хранилища данных, содержащего всю деловую информацию, накопленную компанией в процессе ведения бизнеса, и автоматизируют всю работу современной компании.

Platinum ERA (разработка американской корпорации Epicure Software. Platinum ERA), – система класса ERP. Комплекс ориентирован на автоматизацию работы с клиентом и в меньшей степени на автоматизацию производства. Пакет приложений Platinum ERA для финансового планирования – это набор средств планирования и анализа в масштабе предприятия. Благодаря использованию технологии OLAP (Online Analitical Processing – оперативная аналитическая обработка данных) можно выбирать, подытоживать и анализировать информацию, необходимую для выявления тенденций в динамике стратегически важных характеристик.

ORACLE Applications. В состав этого комплекса входят модули, обеспечивающие возможность планирования, контроля и анализа финансовой деятельности, проектных работ, снабжения, производства, сбыта и послепродажного обслуживания. Хранилище данных и финансовый анализатор обеспечивают поддержку решений по продажам и маркетингу, выявляя скрытые рыночные тенденции и возможности.

Все названные выше системы выполняют как информационно-справочные, так и расчетные функции, но алгоритмы расчетов однозначно заданы и какое-либо их изменение в рамках системы невозможно.

Системы поддержки принятия решений (СППР, от англ. DSS – Decision Support System). СППР могут быть предназначены для анализа вариантов и выбора стратегического плана развития предприятия либо инвестиционного проекта на основе многокритериального анализа и экспертных оценок. Этот класс систем содержит программные решения, приближающие его к ИИС. В них реализованы значительно более гибкие аналитические процедуры за счет предварительного вычисления производных показателей (агрегатов), более дружественный интерфейс, использующий элементы естественного языка; применяются специальные структуры хранения (Хранилища данных – Data Warehouse), отражающие сложные пространственно-временные и концептуальные зависимости между данными.

Хранилища данных. Хранилище данных (ХД) выполняет функции предварительной подготовки и хранения данных для лиц, принимающих решения (ЛПР). Концепция ХД предполагает единый логический взгляд на данные организации и его реализацию в виде единого многоаспектного информационного ресурса. При этом данные об объекте управления собираются в одном месте, приводятся к единому формату, согласовываются, агрегируются до требуемого уровня обобщения. ХД используют специальные схемы данных, получившие названия звезда, созвездие, и снежинка. Смысл построения этих схем – в выделении из общего объема анализируемых данных информации по измерениям. В процессе подготовки решения пользователь анализирует срез фактов по одному или нескольким измерениям.

Идея схемы звезда (star schema) состоит в том, что все факты помещаются в одну таблицу, индексируемую множественным ключом, составленным из ключей отдельных измерений, и для каждого измерения строятся таблицы. Каждый луч схемы звезда задает направление консолидации данных по соответствующему измерению (например, магазин-город-район-регион).

В задачах с многоуровневыми измерениями используются схемы созвездие (fact constellation schema) и снежинка (snowflake schema). В этих случаях таблицы фактов создаются для возможных сочетаний уровней обобщения различных измерений.

При заполнении ХД решаются три взаимосвязанные задачи: сбор данных (Data Acquisition), очистка данных (Data Cleaning) и агрегирование данных (Data Consolidation). Сбор данных – это процесс передачи данных из внешних источников в хранилище и пополнения хранилища. При заполнении хранилища агрегированными данными должна быть обеспечена выборка данных из источников в соответствии с метаданными. Поскольку агрегирование происходит в терминах бизнес-понятий, должны быть определены правила агрегирования (правила вычисления показателей для составных бизнес-понятий на основе их значений для более простых бизнес-понятий). Очистка данных – это процесс модификации данных по ходу заполнения хранилища: исключение нежелательных дубликатов, восстановление пропущенных данных, приведение данных к единому формату, удаление нежелательных символов, унификация типов данных, проверка на целостность. Большинство поставляемых сегодня продуктов располагают тем или иным набором средств очистки данных и соответствующими средствами диагностики.

Витрины данных. Витрина данных (иногда говорят рынок данных) – это специализированное хранилище, обслуживающее одно из направлений деятельности компании (например, учет запасов или маркетинг). Происходящие здесь бизнес-процессы должны быть достаточно однородны, круг пользователей ограничен сотрудниками одного подразделения, количество сотрудников, вовлеченных в данную деятельность, невелико.

Оперативная аналитическая обработка данных (OLAP – Online Analytical Processing). В основе технологии OLAP лежит многомерное концептуальное представление (multi-dimensional conceptual view) – естественный взгляд управляющего персонала на объект управления. Многомерный анализ – это одновременный анализ данных по нескольким измерениям.Каждое измерение включает направления консолидации данных в последовательности уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению (например, измерение Исполнитель может определяться направлением консолидации предприятие-подразделение-отдел-служащий). Операция раскрытия или спуска (drilling down) соответствует движению от высших уровней консолидации к низшим, а операция свертки или подъема (rolling up) означает движение от низших уровней к высшим.

Продукты OLAP строятся так, чтобы аналитик имел возможность: выполнять анализ в рамках общей концептуальной схемы; задавать определяемые им преобразования на функционально полном формальном языке в естественном и удобном пользовательском интерфейсе; осуществлять доступ к данным на языке пользователя (как правило, не владеющего языками программирования); составлять запросы самостоятельно, используя язык бизнес-терминов вместо языка программирования. Для этого система должна скрывать от конечного пользователя физическую структуру и способы хранения данных. Делается это введением семантического слоя, где каждому бизнес-термину ставится в соответствие способ получения данных.

Различают системы MOLAP (Multidimensional OLAP) и ROLAP (Relational OLAP). МOLAP ориентирована на использование специальной, нереляционной модели хранения. ROLAP основана на применении определенных структур базы данных (схем звезда и снежинка, индексации и хранения агрегатов), что позволяет использовать реляционные системы управления базами данных. Разработаны также гибридные решения для OLAP, называемые иногда HOLAP (hybrid OLAP). Используя одновременно архитектуры ROLAP и MOLAP, они соединяют в себе лучшие черты тех и других. Для большинства продуктов OLAP предварительное вычисление агрегатов является основной стратегией, обеспечивающей выигрыш в производительности. Вместе с тем предварительная агрегация данных связана со значительными затратами, так как число агрегатов легко может превысить число исходных детальных данных, что приводит к резкому росту («взрыву») объема хранимых данных.

Инструментарий современных ИС. В качестве средства хранения в реляционных хранилищах и витринах данных используется сервер Oracle8i, в многомерных витринах – Express Server. Центральное инструментальное средство – Oracle Warehouse Builder – построено на базе современной архитектуры Common Warehouse Metadata и позволяет спроектировать структуру целевого хранилища, создать процедуры извлечения, согласования и загрузки данных из различных источников и сгенерировать метаданные.

Для решения аналитических задач высокого уровня применяется особая технология, реализуемая семейством OLAP-продуктов Oracle Express. Express Server предоставляет мощный набор аналитических вычислений, включающий в себя более сотни встроенных функций, которые можно использовать для быстрого построения новых расчетных показателей, а также алгоритмы прогнозирования, средства регрессионного и частотного анализа, моделирования сценариев что-если.

Инструментальная среда ORACLE Darwin Data Mining Suite предназначена для анализа данных методами Data mining (извлечение знаний), позволяющими выявлять в больших наборах данных скрытые закономерности, зависимости и взаимосвязи, полезные при принятии решений на различных уровнях управления. Darwin поддерживает все этапы технологии извлечения знаний, включая постановку задачи, подготовку данных, автоматическое построение моделей, анализ и тестирование результатов, использование моделей в реальных приложениях. Darwin обеспечивает построение пяти различных типов моделей – нейронные сети, классификационные и регрессионные деревья решений, ближайшие k-окрестности, байесовское обучение и кластеризация.

Корпорация Microsoft предлагает инструмент для поддержки систем принятия решений Microsoft DSS (Microsoft Decision Support Services), являющийся полноценной реализацией системы OLAP. Microsoft DSS поставляется как отдельный компонент в составе SQL Server 7.0 и реализован в виде отдельной службы операционной системы, оптимизирующей исполнение запросов, не изменяющих данные.

Для повышения эффективности применения MS SQL Server в системах принятия решений используют хранилища данных. Корпорация Microsoft совместно с другими компаниями, разработала также платформу Microsoft Data Warehouse Framework, позволяющую снизить стоимость владения хранилищами данных и повысить эффективность их администрирования и эксплуатации.

English Query – инструментарий для создания приложений, использующих естественный английский язык в построении запросов при обращении к базам данных. Специальные средства выполняют преобразование запроса, построенного с помощью обычного разговорного языка, в структурированный запрос Transact-SQL. Это позволяет пользователям, не имеющим опыта работы с SQL-запросами, успешно работать с базами данных. Независимые разработчики могут использовать предоставляемые English Query возможности при написании программ или при создании Web-страниц, обращающихся к базам данных SQL Server 7.0.

1.4. Интеллектуальные информационные системы [13, 15]

Общим недостатком традиционных информационных систем, к которым относятся охарактеризованные выше типы ИС, является их недостаточная адаптивность к изменениям предметной области и информационных потребностей пользователей, а также неспособность решать слабоформализуемые задачи, с которыми в реальных условиях постоянно приходится иметь дело.

ИС, основанные на обработке знаний, или нтеллектуальные информационные системы (ИИС) в значительной мере избавляются от этих недостатков ИС за счет разделения операционального знания на две компоненты: базу знаний (общие для различных задач правила преобразования данных, представленные в декларативной форме) и механизм вывода (универсальная управляющая структура). Механизм вывода составляет из правил базы знаний алгоритмы решения конкретных задач, формулируемых в запросах как цель и условия решаемой задачи. ИС, построенные по этому принципу, известны как системы, основанные на обработке знаний (СБЗ, от англ. KBS – Knowledge Based Systems). Схематически их структуру можно представить в следующем виде:

СБЗ = (База знаний, Механизм вывода, База данных).

Такая организация ИИС значительно расширяет круг возможных информационных запросов, так как формулировка запроса сводится теперь лишь к описанию цели и условий решения задачи в декларативной форме.

Как можно видеть из предыдущего раздела, современные базы данных используют целый ряд механизмов и технологий, повышающих их интеллектуальные возможности. Это относится прежде всего к многомерной организации данных в хранилищах данных, организации естественноязыкового интерфейса, реализации сценариев что-если. Все эти механизмы почерпнуты из исследований по искусственному интеллекту.

Системы поддержки принятия решений DSS можно рассматривать как квазиинтеллектуальные системы, поскольку они автоматизируют не сам процесс оценки предпочтительности гипотез или выбора варианта решения, а лишь готовят аналитические обобщенные данные для окончательного выбора решения специалистом. Важность этих систем для теории и практики применения искусственного интеллекта определяется двумя обстоятельствами: во-первых, в DSS осуществляется поиск аналитических зависимостей или агрегатов, использование которых упрощает правила принятия решений; во-вторых, в структуре специализированных процессоров и архитектур этих систем реализуются некоторые начальные этапы обработки данных, характерные для технологии искусственного интеллекта (организация хранения и обработки больших объемов многомерных данных с учетом семантических взаимосвязей). Иначе говоря, ИИС объединяют в себе как возможности СУБД, на которых основаны обычные ИС, так и методы искусственного интеллекта, благодаря чему хранение информации сочетается с ее обработкой и подготовкой к использованию при принятии решений.

В экономике наибольшее распространение ИИС получили для решения самых разных задач: анализа деятельности предприятия, стратегического планирования, инвестиционного анализа, оценки рисков и формирования портфеля ценных бумаг, финансового анализа, маркетинга. Особенно эффективно применение ИИС совместно со стандартными методами исследования операций, динамического программирования и методами нечеткой логики при решении сложных комплексных проблем.

Первоначально ИИС использовали знания экспертов в каждой из конкретных областей. В настоящее время базы знаний частично формируются посредством машинного обучения с использованием методов индукции, генетических алгоритмов и некоторых других методов извлечения знаний. Наиболее очевидным преимуществом интеграции некоторых форм искусственного интеллекта в процессе принятия решений по сравнению с постоянным консультированием с группой экспертов обычно является более низкая стоимость и большее соответствие результатов поставленной задаче.

Требования к возможностям ИИС, предъявляемые сегодня, в соответствии со сложившейся уже традицией привлечения результатов исследований по искусственному интеллекту для совершенствования ИС, сводятся к следующему:

· наличие развитых коммуникативных способностей (естественно-языкового интерфейса, обеспечивающего возможность обработки произвольных запросов пользователя в диалоге с системой на языке, максимально приближенном к естественному);

· способность к решению слабоформализуемых задач (реализации так называемых мягких моделей, когда зависимости являются не вполне определенными или даже неизвестными);

· способность работать с неопределенными и динамичными данными (когда методы обработки данных могут изменяться и уточняться по мере поступления новых данных);

· способность к развитию системы, в том числе путем извлечения знаний из накопленного в конкретных ситуациях опыта;

· возможность получения и использования информации, которая не хранится явно, но может быть выведена из имеющихся в базе данных;

· способность определять границы своей компетентности за счет использования моделей не только предметной области, но и самой системы;

· способность к абдуктивным выводам (выводам от конкретного к конкретному по аналогии);

· способность объяснять свои действия и предупреждать пользователя о действиях и ситуациях, могущих повлечь нарушение целостности данных.

Наличие у ИИС развитых коммуникативных способностей дает возможность пользователю формулировать запросы и получать информацию и комментарии на языке профессиональных терминов конкретной предметной области, близком к естественному.

Способность ИИС к решению слабоструктурированных, плохо формализуемых задач существенно расширяет область их применения, так как ИИС особенно эффективны в решенении именно тех задач, строгая формализация которых пока отсутствует, вследствие чего для решения применяются эвристические процедуры, позволяющие получить решение в большинстве случаев. Отчасти поэтому диапазон применения ИИС столь широк: от управления непрерывными технологическими процессами в реальном времени до оценки последствий от нарушения условий поставки товаров по импорту.

По мере совершенствования применяемых в ИИС методов логического и правдоподобного вывода, основанных на достижениях в таких областях, как нечеткая, немонотонная и модальная логики, байесовские сети вывода, ИИС начинают использовать и в таких высокоинтеллектуальных областях, как разработка стратегических комплексных решений. Этому способствуют и ставшие более совершенными методы и алгоритмы анализа и синтеза предложений естественного языка, облегчающие общение пользователя с системой.

Включение в состав ИИС классических экономико-математических моделей, методов линейного, квадратичного и динамического программирования позволяет сочетать анализ объекта на основе экономических показателей с учетом факторов и рисков политических и внеэкономических факторов, оценивать последствия полученных решений.

Классификация ИИС. Список рассмотренных выше требований к ИИС может быть расширен и каждое их них может быть использовано в качестве признака классификации. Поэтому, в зависимости от целей классификации, классифицировать ИИС можно по разным основаниям. Например, в работе [13] предлагается классифицировать ИИС по следующим признакам:

· по предметной области (в экономике) – ИИС менеджмента, ИИС риск-менеджмента, ИИС инвестиций;

· по степени интеграции ИИС в корпоративную информационную систему – автономные ИИС в виде самостоятельных программных продуктов с собственной базой данных, сопрягаемые интерфейсом с корпоративной системой, полностью интегрированные в корпоративную систему;

· по оперативности – ИИС реального времени, советующие ИИС (обычно различают динамические и статические ИИС, но фактор времени всегда присутствует и полностью статических ИИС не бывает);

· по адаптивности – настраиваемые ИИС (системы, параметры которых изменяются администратором базы знаний), обучаемые ИИС (системы, параметры которых и, возможно, структура могут изменяться в результате обучения или самообучения);

· по моделям знаний – по наиболее часто применяемым моделям знаний (таким, как исчисление предикатов, продукционные системы, нечеткие системы знания, марковские и байесовские сети вывода, немонотонные и модальные логики, каузальные деревья и др.).

Такой способ классификации позволяет систематизировать всё многообразие ИИС для последующего их анализа и получения обобщающих выводов.

В других случаях цель классификации ставится более конкретно: осуществить деление ИИС на классы по видам и степени интеллектуальности функций, реализумых компонентами ИИС, для чего в работе [15] в качестве признаков классификации используются свойства их структурных компонент.

Традиционно считается, что ИИС содержит базу данных, базу знаний, механизм вывода (машину вывода, интерпретатор правил, механизм манипулирования знаниями), компоненту приобретения знаний (средства получения знаний: модуль усвоения знаний, обучения, самообучения), компоненту интеллектуального интерфейса (средства общения с ИИС: модуль объяснения, естественно-языковый интерфейс).

Схематически взаимодействие названных компонент между собой и с проблемной областью представлено на рис. 1.2.

В самом общем виде интеллектуальность компонент ИИС можно охарактеризовать по степени проявления следующих свойств:

· коммуникативные способности;

· способность к решению сложных трудноформализуемых задач;

· способность к самообучению.

Коммуникативные способности ИИС характеризуют интеллектуальность взаимодействия (удобство, «дружественность» интерфейса) конечного пользователя с системой, наличие возможности формулировать запрос в диалоге с системой на языке, близком к естественному.

Сложные трудноформализуемые задачи – это задачи, не поддающиеся решению строгими методами и потому требующие построения оригинального алгоритма решения в каждой конкретной ситуации, которая может характеризоваться динамизмом, неполнотой, неточностью, нечеткостью, неопределенностью данных и знаний, действием субъективных, неучтенных и случайных факторов.

Способность к самообучению – это способность системы к самостоятельному извлечению, накоплению, систематизации и обобщению знаний на основе приобретенного опыта решения задач в конкретных ситуациях.

Нетрудно заметить, что от интеллектуальных информационных систем фактически требуется наличие человеческих свойств: способности понимать естественную речь; способности рассуждать и решать сложные задачи; способности обучаться, чтобы сохранять актуальность и адекватность оказываемых пользователю информационных услуг, вопреки изменчивости, неопределенности и сложности проблемной области.

 
 

Рис. 1.2. Архитектура интеллектуальной информационной системы

Сегодня различным ИИС эти свойства присущи в разной степени и редко бывает, когда все они реализуются в одной системе. Какие именно аспекты интеллектуальности становятся определяющими и получают преимущественное развитие, зависит от области их применения и назначения.

С учетом сказанного выше в работе [15] предлагается классифицировать ИИС с использованием следующих известных на сегодня форм и уровней проявления интеллектуальности их компонент.

По коммуникативным способностям (видам интеллектуального интерфейса) предлагается различать: интеллектуальные базы данных, естественно-языковый интерфейс, гипертекстовые системы, контекстные системы помощи, системы когнитивной графики.

По способности решать сложные слабоформализуемые задачи предлагается различать системы: классифицирующие, доопределяющие, трансформирующие, мультиагентные.

По способности к самообучению предлагается различать: настраиваемые (неспособные к самообучению) системы, индуктивные системы, нейронные сети, системы на основе прецедентов, информационные хранилища.

Системы с интеллектуальным интерфейсом. От обычных баз данных интеллектуальные базы данных отличаются возможностью получать по запросу информацию, которая в явном виде не хранится в базе данных, но может быть получена (выведена) из хранимой. В таких запросах требуется осуществить поиск по условию, которое должно быть доопределено в ходе решения задачи. Выполняя это, интеллектуальная информационная система без помощи пользователя по структуре базы данных сама находит и строит путь доступа к запрошенным данным. Формулирование запроса осуществляется в диалоге с пользователем. При этом последовательность шагов диалога выбирается наиболее удобной для пользователя.

Наличие естественно-языкового интерфейса дает возможность пользователю самому выбирать наиболее удобную для него форму диалога. Естественно-языковый интерфейс предполагает трансляцию естественно-языковых конструкций на внутримашинный уровень представления знаний. Для этого решаются задачи: морфологического анализа (распознавание и проверка правильности написания слов); синтаксического анализа (определение структуры входных сообщений и проверка их соответствия грамматическим правилам внутреннего представления знаний); семантического анализа (установление смысловой правильности синтаксических конструкций); синтеза высказываний на естественном языке (преобразование внутреннего представления информации в естественно-языковое). Естественно-языковый интерфейс дает возможность конечному пользователю получать доступ к интеллектуальным базам данных, осуществлять контекстный поиск текстовой информации, осуществлять голосовой ввод команд в системах управления.

Гипертекстовые системы предназначены для реализации поиска по ключевым словам в базах текстовой информации. Интеллектуальные гипертекстовые системы отличаются возможностью более сложной организации ключевых слов, которая отражает различные смысловые отношения терминов. Таким образом, механизм поиска работает прежде всего с базой знаний ключевых слов и лишь после этого – непосредственно с текстом. Этот принцип распространяется и на поиск мультимедийной информации.

Системы контекстной помощи можно рассматривать, как частный случай интеллектуальных гипертекстовых и естественно-языковых систем. В системах контекстной помощи конечному пользователю достаточно описать проблему (ситуацию), после чего система в ходе дополнительного диалога конкретизирует ее и сама выполняет поиск относящихся к ситуации рекомендаций. Такие системы относятся к классу систем распространения знаний (Knowledge Publishing) и создаются как приложение к системам документации.

Системы когнитивной графики обеспечивают интерфейс пользователя с ИИС посредством графических образов, которые генерируются в соответствии с происходящими событиями. Такие системы применяются для мониторинга и управления процессами в реальном масштабе времени. Графические образы наглядно и целостно описывают множество параметров наблюдаемой ситуации (например, состояние сложного управляемого объекта отображается в виде человеческого лица, на котором каждая черта отвечает за какой-либо параметр, а общее выражение лица дает интегрированную характеристику ситуации). Системы когнитивной графики широко используются также в обучающих и тренажерных системах, построенных по принципу виртуальной реальности.

Признаки и классы сложности решаемых задач. Интеллектуальные информационные системы в работе [15] предлагается делить на четыре класса по уровню сложности решаемых задач, используя следующие признаки.

По способу формирования решения системы можно разделить на два класса: аналитические и синтетические. Первые осуществляют анализ множества известных вариантов и выбор подходящих решений, вторые – генерацию неизвестных решений согласно заданным условиям.

По влиянию фактора времени системы можно разделить на статические и динамические. Статические системы решают задачи при неизменных в ходе решения данных и знаниях. Динамические системы могут работать с изменяющимися в ходе решения данными и знаниями, допуская возможность пересмотра в процессе решения полученных ранее результатов.

По видам используемых данных и знаний системы можно разделить на системы, работающие с четко определенными знаниями, и системы, способные работать с неопределенными знаниями. При этом под неопределенностью данных или знаний понимается их неполнота (отсутствие части знаний), недостоверность (неточность измерения каких-то величин), двусмысленность (многозначность понятий) или нечеткость (качественная оценка величин вместо количественной).

По числу используемых источников знаний экспертные системы могут быть ориентированы на использование одного или нескольких исключающих или дополняющих друг друга источников знаний.

С использованием перечисленных признаков классификации, выделяются следующие четыре основных класса интеллектуальных информационных систем по уровню сложности решаемых ими задач.

Классифицирующие системы – это аналитические системы, использующие неизменное, определенное знание от одного источника. К аналитическим задачам относятся прежде всего задачи распознавания ситуаций. В таких задачах по заданному набору значений признаков (факторов) относят анализируемую ситуацию к одному из возможных классов, чем определяется последовательность действий в ситуации, наилучшим образом удовлетворяющая поставленной цели и ограничениям. В качестве метода поиска решений в таких системах обычно используется метод логического дедуктивного вывода (от общего к частному), а теоретической основой служит исчисление предикатов.

Доопределяющие системы – это аналитические системы, использующие неизменное, но неопределенное знание. В этом случае системе приходится восполнять недостающие данные и знания, в результате может получаться несколько решений, с разной вероятностью (или уверенностью) удовлетворяющих условиям задачи. В качестве математического аппарата обычно используются условные вероятности, коэффициенты уверенности, нечеткая логика. Использование нескольких источников знания тоже можно рассматривать как неопределенность знания, поэтому доопределяющие системы можно применять для снятия неопределенности и формирования решения и в этом случае.

Трансформирующие системы – это синтезирующие системы, использующие изменяющееся, но определенное знание от одного источника. Причинами изменений в знаниях о ПО в ходе решения задачи могут быть получение новых данных, меняющих представление о ПО, или качественные изменения в самой ПО. В качестве методов решения задач в трансформирующих системах используются разновидности немонотонной логики (гипотетический вывод, логика умолчаний, использование общих закономерностей – метаправил).

Многоагентные системы – это синтезирующие системы, использующие изменяющееся, неопределенное знание от многих источников. Эти системы способны: выполнять альтернативные рассуждения на основе использования знаний из различных источников с устранением противоречий между ними; осуществлять распределенное решение проблем путем их разбиения на параллельно решаемые подпроблемы, соответствующие самостоятельным источникам знаний; примененять различные стратегии работы механизма вывода заключений в зависимости от типа решаемой проблемы; использовать различные математические модели и внешние процедуры, хранимые в базе моделей и знаний; прерывать решения задач при необходимости получения дополнительных данных и знаний от пользователей, моделей, параллельно решаемых подпроблем. Математической основой для построения такого рода систем служат различные версии модальной логики.

Самообучающиеся системы. В основе работы самообучающихся систем лежат методы обучения на примерах конкретных ситуаций путем их автоматической классификации. Примеры конкретных ситуаций, накопленные за некоторый достаточный период, составляют обучающую выборку. Каждый из примеров описывается набором признаков классификации. Способы обучения делятся на два типа: с учителем, когда каждый пример явно относится к некоторому классу ситуаций; без учителя, когда система сама выделяет классы ситуаций по степени близости значений признаков классификации.

В результате обучения система автоматически строит обобщенные правила (или функции) определения принадлежности ситуаций классам, которыми она затем пользуется при анализе новых возникающих ситуаций. В результате автоматически формируется база знаний для решения задач классификации и прогнозирования. Эта база знаний периодически автоматически корректируется по мере накопления опыта.

Общие недостатки, свойственные всем самообучающимся системам, заключаются в следующем:

· возможна неполнота или избыточность (зашумленность) обучающей выборки, и следовательно, недостаточное соответствие базы знаний реальному положению вещей;

· возникают проблемы с объяснением пользователям получаемых результатов из-за слабого соответствия автоматически установленных правил правилам человеческого мышления;

· ограничения по размерности признакового пространства вынуждают ограничиваться либо весьма узкой проблемной областью, либо неглубоким ее описанием.

Индуктивные системы. Обобщение примеров ситуаций по принципу от частного к общему сводится к выявлению подмножеств примеров, относящихся к одним и тем же подклассам, и определению для них значимых признаков. Процесс классификации примеров осуществляется следующим образом:

1) выбирается признак классификации из множества заданных (либо последовательно, либо по какому-либо правилу (например, по максимуму числа получаемых подмножеств);

2) по значениям выбранного признака множество примеров разбивается на подмножества;

3) выполняется проверка, принадлежит ли каждое образовавшееся подмножество примеров одному подклассу;

4) если в каком-то подмножестве все примеры имеют одно и то же значение классообразующего признака, то это подмножество примеров принадлежит одному подклассу, для него процесс классификации заканчивается и остальные признаки классификации не рассматриваются;

5) для тех же подмножеств, где есть примеры с несовпадающими значениями классообразующего признака, процесс классификации продолжается, начиная с пункта 1 (каждое такое подмножество примеров становится классифицируемым множеством).

Анализ ситуации в рабочем режиме сводится к выбору ветви дерева, полностью определяющей эту ситуацию. Примерами инструментальных средств, поддерживающих индуктивный вывод знаний, могут служить 1st Class (Programs in Motion), Rulemaster (Radian Corp.), ИЛИС (ArgusSoft).

Нейронные сети. Нейронные сети используются для решения задач классификации и прогнозирования путем их обучения распознаванию или предсказанию ситуаций по наборам значений признаков. Искусственный нейрон – математическая функция, отображающая зависимость значения выходного признака y от взвешенной суммы значений входных признаков , где вес входного признака определяет степень его влияния на выходной признак: . Функциональная зависимость f может быть линейной, но, как правило, используется логистическая (сигмоидальная) функция, которая позволяет вычленять более сложные пространства значений выходных признаков.

Путем связывания выходов одних нейронов со входами других строится нейронная сеть. Обучение нейронной сети заключается в настройке весов связей между нейронами. Упрощенно можно сказать, что алгоритмы обучения нейронной сети сводятся к назначению весового коэффициента связи двух нейронов в зависимости от числа примеров, подтверждающих эту связь. Наиболее распространенным способом обучения нейронной сети является алгоритм обратного распространения ошибки, обеспечивающий при обучении минимизацию квадрата ошибки по всем примерам.

Достоинство обучаемых нейронных сетей перед системами индуктивного вывода заключается в их способности решать не только классификационные, но и прогностические задачи. Использование в нейронах нелинейной функциональной зависимости выходных значений от входных позволяет строить более точные классификации. Сам процесс решения задач, благодаря применению матричных преобразований, проводится очень быстро. Фактически имитируется процесс параллельного прохода по нейронной сети, в отличие от последовательного в индуктивных системах. Нейронные сети могут быть реализованы и аппаратно в виде нейрокомпьютеров с ассоциативной памятью.

В последнее время нейронные сети получили стремительное развитие и очень активно используются в финансовой области. В качестве примеров внедрения нейронных сетей могут служить: «Система прогнозирования динамики биржевых курсов для Chemical Bank» (фирма Logica); «Система прогнозирования для Лондонской фондовой биржи» (фирма SearchSpace); «Управление инвестициями для Mellon Bank» (фирма NeuralWare). В качестве инструментальных средств разработки нейронных сетей следует выделить инструментальные средства NeurOn-line (фирма GENSYM), NeuralWorks Professional II/Plus (фирма NeuralWare), отечественную разработку FOREX-94 (Уралвнешторгбанк).

Системы, основанные на прецедентах (Case-based reasoning). В этих системах база знаний содержит описания не обобщенных ситуаций, а собственно сами ситуации (прецеденты). В этом случае решение проблемы сводится к поиску по аналогии (абдуктивному выводу от частного к частному), включающему:

1) получение подробной информации о текущей проблеме;

2) сопоставление полученной информации со значениями признаков прецедентов из базы знаний;

3) выбор прецедента из базы знаний, наиболее близкого к рассматриваемой проблеме;

4) осуществление (при необходимости) адаптации выбранного прецедента к текущей проблеме;

5) проверку корректности каждого полученного решения;

6) занесение детальной информации о новом прецеденте (о проблеме и полученном решении) в базу знаний.

Так же, как и для индуктивных систем, прецеденты описываются множеством признаков, по которым строятся индексы быстрого поиска. Но, в отличие от индуктивных систем, допускается нечеткий поиск с получением множества допустимых альтернатив. Далее наиболее подходящие решения адаптируются к реальным ситуациям. Обучение системы сводится к запоминанию каждой новой обработанной ситуации и принятых решений в базе прецедентов.

Системы, основанные на прецедентах, применяются как системы распространения знаний с расширенными возможностями или как системы контекстной помощи. В качестве примера инструментального средства поддержки баз знаний прецедентов, распространяемого в России, можно назвать систему CBR-Express (Inference, дистрибьютор – фирма Метатехнология).

Информационные хранилища (Data Warehouse). Как уже говорилось, информационное хранилище – это хранилище извлеченной из оперативной базы данных значимой информации, предназначенное для оперативного анализа данных (реализации OLAP-технологии). Для извлечения значимой информации из баз данных используются специальные методы (Data Mining или Knowledge Discovery). Разработкой информационных хранилищ в настоящее время занимаются многие компьютерные фирмы: IBM (Intelligent Miner), Silicon Graphics (MineSet), Intersolv (DataDirect, SmartData), Oracle (Express), SAS Institute (SAS/Assist) и др.

Контрольные вопросы и задания

1. Что составляет математический и технический инструментарий исследований по искусственному интеллекту?

2. Назовите этапы первых исследований по искусственному интеллекту, их содержание, теоретические и практические результаты.

3. Перечислите основные черты, характеризующие экспертные системы как вид систем искусственного интеллекта.

4. Назовите основные признаки, характеризующие области, в которых целесообразно применение экспертных систем.

5. Каковы основные компоненты архитектуры экспертной системы, их взаимосвязь и функции?

6. Что представляет собой база знаний экспертной системы? В чем сходны и чем отличаются база знаний и база данных?

7. Что представляет собой машина вывода экспертной системы?

8. Как осуществляются прямая, обратная и смешанная цепочки рассуждений?

9. Что представляет собой модуль усвоения знаний экспертной системы?

10. Опишите процесс извлечения знаний из экспертов и процесс обучения машин.

11. Что представляет собой пользовательский интерфейс экспертной системы?

12. Перечислите функции интерфейса экспертной системы и требования к нему.

13. Перечислите классы компьютерных систем, основанных на знаниях, по видам и источникам знаний.

14. Перечислите основные направления современных исследований по искусственному интеллекту и охарактеризуйте их содержание.

15. Раскройте понятие и назначение информационной системы.

16. Каковы этапы эволюции и каковы схемы информационных систем на каждом этапе?

17. Каковы требования к интеллектуальным информационным системам, их архитектура, назначение и функции компонент?

18. Каковы возможные признаки и способы классификации интеллектуальных информационных систем.

19. Назовите признаки классификации и основные классы интеллектуальных информационных систем по уровню интеллектуальных способностей к взаимодействию, решению сложных проблем, самообучению.

20. Опишите системы с интеллектуальным интерфейсом: интеллектуальные базы данных, естественно-языковый интерфейс, гипертекстовые системы, системы контекстной помощи, системы когнитивной графики.

21. Охарактеризуйте классы интеллектуальных информационных систем по уровню сложности решаемых задач: классифицирующие, доопределяющие, трансформирующие, многоагентные системы.

22. Охарактеризуйте классы самообучающихся систем: индуктивные системы; нейронные сети; системы, основанные на прецедентах; информационные хранилища.





Дата публикования: 2014-11-02; Прочитано: 1268 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.027 с)...