Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Источниками информации могут являться данные, знания, документы. Источниками данных в любой предметной области являются объекты и их свойства, процессы и функции, выполняемые этими объектами или для них.
В процессе извлечения информации можно выделить следующие фазы:
− накопление – системное или бессистемное (стихийное) накопление информации в рамках предметной области;
− структурирование – выделение основных понятий, выработка структуры представления информации, обладающей максимальной наглядностью, простотой изменения и дополнения;
− формализация – представление структурированной информации в форматах машинной обработки, т. е. на языках описания данных и знаний;
− обслуживание – корректировка формализованных данных и знаний (добавление, обновление), удаление устаревшей информации, фильтрация данных и знаний для поиска информации, необходимой пользователям.
При извлечении информации важное место занимают различные формы и методы исследования данных:
− нахождение ассоциаций, связанных с привязкой к какому- либо событию;
− нахождение последовательностей событий во времени;
− нахождение скрытых закономерностей по наборам данных путем определения причинно-следственных связей между значениями определенных косвенных параметров исследуемого объекта (ситуации, процесса);
− оценка влияния (важности) параметров на события и ситуации;
− классифицирование (распознавание), осуществляемое путем поиска критериев, по которым можно было бы относить объект (события, ситуации, процессы) к той или иной классификационной категории;
− кластеризация, основанная на группировании объектов по каким-либо признакам;
− прогнозирование событий и ситуаций.
Развитие методов и средств извлечения информации направлено на стандартизацию и унификацию. Характерным примером является создание и внедрение технологий Data Mining и Text Mining.
Data Mining – это направление в информационных технологиях, которое связано с автоматизированным извлечением знаний (неявным образом присутствующих в обрабатываемой информации) и базируется на интеллектуальном анализе данных.
Text Mining является разновидностью Data Mining, ориентированной на обработку текстовой информации и широко применяемой для мониторинга ресурсов Internet. Задача Text Mining – проанализировать не синтаксис, а семантику значения текстов, выбрать из него наиболее значимую информацию.
Дата публикования: 2015-09-17; Прочитано: 2626 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!