Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Классификация поисковых систем Интернет



Существующие поисковые системы Интернет можно классифицировать по нескольким критериям:

1 Объем поискового индекса

поисковые системы периодически посматривают узлы Интернет и формируют постоянно обновляемые индексы документов. Из-за экспоненциального расширения всемирной сети исчерпывающие индексирование всего содержимого сети.

Самый большой объем индексируемой информации собран на узле HotBot – 34%; AttaVista – 28%. Список замыкает Lycos, поисковая машина, которая индексирует только около 3% всей информации.

2 Метод выбора серверов для просмотра

генерация поискового индекса требует систематического обхода Web-узлов и определения местонахождения каждого документа. Структура Web аналогична структуре ориентированного графа, поэтому здесь применимы алгоритмы обхода графа.

3 Используемые поисковые технологии

По этому критерию поисковые системы можно разделить на четыре категории:

q тематические каталоги;

q специализированные каталоги;

q поисковые машины;

q средства мета-поиска.

Тематические каталоги предусматривают обработку документов и отнесение их к одной их к одной из нескольких категорий, перечень которых заранее задан. Фактически это индексирование на основе классификации.

Индексирование может проводиться автоматически либо в ручную с помощью специалистов, которые просматривают популярные Web-узлы и составляют краткое описание документов-резюме.

Специализированные каталоги или справочники – это каталоги, созданные по отдельным отраслям и типам: каталог по новостям, каталог по городам и т.п.

Поисковые машины реализуют технологию коллективного поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах документов.

Запрос может быть сформирован как запрос к полнотекстовой базе данных, распределенной в сети. Поскольку эта база огромных размеров, то характер запроса значительно влияет на результат.

При формировании запроса в ЗС могут использоваться следующие инструменты:

q отдельные ключевые слова;

q логические операторы;

q средство контекстного поиска;

q запрос по образцу;

q поиск фразы;

q запрос на соответствующем языке.

q

В конкретных поисковых системах может быть предложен различный набор этих инструментов.

Средства метопоиска. Запрос одновременно осуществляется несколькими поисковыми системами, результат поиска объединяется в общей, упорядоченной по степени релевантности список. Поскольку каждая система обрабатывает только часть узлов сети, это позволяет значительно расширить базу поиска. К этому классу можно также отнести так называемые персональные программы поиска, которые позволяют формировать собственные инструменты метопоиска.

Для качественной оценки эффективности ИПС используются формальное измерение точности и полноты поиска, полученное на основе экспериментов в контролируемых условиях. Это требует наличия экспериментальной системы и фиксированием числом документов.

Таким образом, объективное сравнение эффективности поиска различных поисковых систем осуществить достаточно сложно

Література

1. Грищенко В.І., Панишин Б.М. Інформаційна технологія: питання розвитку і застосування. – К.: Наукова думка, 1990, с.10-27

2. Лившиц Я.І. Документознавство як наукова дисципліна, - М.: МДІАС, 1990, с. 144

3д ПавлюкЛ.В., Воробйов Н.І.. Довідник по діловодству і основам роботи

на комп’ютері. М- Санкт-Петербург, ТД “Герда”, 1998, 187 -200





Дата публикования: 2015-07-22; Прочитано: 1941 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.005 с)...