Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Извлечение информации



Источниками информации могут являться данные, знания, документы. Источниками данных в любой предметной области являются объекты и их свойства, процессы и функции, выполняемые этими объектами или для них.

В процессе извлечения информации можно выделить следующие фазы:

− накопление – системное или бессистемное (стихийное) накопление информации в рамках предметной области;

− структурирование – выделение основных понятий, выработка структуры представления информации, обладающей максимальной наглядностью, простотой изменения и дополнения;

− формализация – представление структурированной информации в форматах машинной обработки, т. е. на языках описания данных и знаний;

− обслуживание – корректировка формализованных данных и знаний (добавление, обновление), удаление устаревшей информации, фильтрация данных и знаний для поиска информации, необходимой пользователям.

При извлечении информации важное место занимают различные формы и методы исследования данных:

− нахождение ассоциаций, связанных с привязкой к какому- либо событию;

− нахождение последовательностей событий во времени;

− нахождение скрытых закономерностей по наборам данных путем определения причинно-следственных связей между значениями определенных косвенных параметров исследуемого объекта (ситуации, процесса);

− оценка влияния (важности) параметров на события и ситуации;

− классифицирование (распознавание), осуществляемое путем поиска критериев, по которым можно было бы относить объект (события, ситуации, процессы) к той или иной классификационной категории;

− кластеризация, основанная на группировании объектов по каким-либо признакам;

− прогнозирование событий и ситуаций.

Развитие методов и средств извлечения информации направлено на стандартизацию и унификацию. Характерным примером является создание и внедрение технологий Data Mining и Text Mining.

Data Mining – это направление в информационных технологиях, которое связано с автоматизированным извлечением знаний (неявным образом присутствующих в обрабатываемой информации) и базируется на интеллектуальном анализе данных.

Text Mining является разновидностью Data Mining, ориентированной на обработку текстовой информации и широко применяемой для мониторинга ресурсов Internet. Задача Text Mining – проанализировать не синтаксис, а семантику значения текстов, выбрать из него наиболее значимую информацию.





Дата публикования: 2015-09-17; Прочитано: 2626 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.005 с)...