Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление



Технология обработки информации – упорядоченная последовательность взаимосвязанных действий, выполняемых с момента восприятия информации до момента получения заданных результатов.

Информационная технология – это система методов, способов и средств для сбора, регистрации, хранения, поиска, накопления, обработки [..] информации.

Поиск информации – одна из основных функций ИТ.

Поиск – это процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве.

Особенности поиска:

· сравниваются не сами объекты, а поисковые образы

· сам процесс поиска является неодноактным и многоитерационным

Алгоритм поиска:

· выборка очередного объекта из массива для выполнения сравнения с запрашиваемым

· процесс сравнения

· принятие решения о соответствии

· переход к следующему объекту или завершение процесса

Выделяют два вида поиска:

· поиск целостного объекта (выдается весь документ)

· поиск информации по содержанию (некоторой части содержания)

Технология поиска может осуществляться по массиву двух видов:

· с прямой организацией – документы расположены в произвольном порядке (по мере занесения)

· с инвертированной организацией – имеется дополнительное разбиение на категории, обозначенные идентификаторами (с инвертированным справочником)

Критерий смыслового соответствия – это формула, в соответствии с которой производится логическое и лингвистическое преобразование (развертывание) ПП с тем, чтобы найти ПОД, содержащий релевантную информацию, независимо от ее лексического представления.

Теоретико-множественная модель(??)

  релевантные нерелевантные
выданные a b
не выданные c d

· Частные критерии оценки:

· полнота – доля выданных релевантных документов: r = a/(a+c)

· точность – доля релевантных среди выданных: р=а/(а+b)

· специфичность – доля невыданных и нерелевантных среди невыданных: σ = d/(b+d)

· относительный объем выдачи: ν = (a+b)/(a+b+c+d)

· общность – доля релевантных документов среди всего информационного массива






Дата публикования: 2015-01-26; Прочитано: 363 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...