Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Глава 12. Сеть Интернет растет очень быстрыми темпами, и найти нужную информацию среди миллиардов Web-страниц и фай­лов становится все сложнее




12.11. Поиск информации в Интернете

Сеть Интернет растет очень быстрыми темпами, и найти нужную информацию среди миллиардов Web-страниц и фай­лов становится все сложнее. Для поиска информации исполь­зуются специальные поисковые серверы, которые содержат более или менее полную и постоянно обновляемую информа­цию о Web-страницах, файлах и других документах, храня­щихся на десятках миллионов серверов Интернета.

Различные поисковые сервера могут использовать различ­ные механизмы поиска, хранения и предоставления пользо­вателю информации. Поисковые серверы Интернета можно разделить на две группы:

• поисковые системы общего назначения;

• специализированные поисковые системы. Современные поисковые системы часто являются инфор­мационными порталами, которые предоставляют пользова­телям не только возможности поиска документов в Интерне­те, но и доступ к другим информационным ресурсам (новостям, информации о погоде, о валютном курсе, инте­рактивным географическим картам и так далее).

12.11.1. Поисковые системы общего назначения

Поисковые системы общего назначения являются базами данных, содержащими тематически сгруппированную ин­формацию об информационных ресурсах Всемирной паути­ны. Такие поисковые системы позволяют находить Web-сай­ты или Web-страницы по ключевым словам в базе данных или путем поиска в иерархической системе каталогов.

Интерфейс таких поисковых систем общего назначения содержит список разделов каталога и поле поиска. В поле поиска пользователь может ввести ключевые слова для по­иска документа, а в каталоге выбрать определенный раздел, что сужает поле поиска и таким образом ускоряет его.

Заполнение баз данных осуществляется с помощью специаль­ных программ-роботов, которые периодически «обходят» Web-серверы Интернета. Программы-роботы читают все встре­чающиеся документы, выделяют в них ключевые слова и за­носят в базу данных, содержащую URL-адреса документов.

Так как информация в Интернете постоянно меняется (создаются новые Web-сайты и страницы, удаляются ста­рые, меняются их URL-адреса и так далее), поисковые робо-


Коммуникационные технологии



ты не всегда успевают отследить все эти изменения. Инфор­мация, хранящаяся в базе данных поисковой системы, может отличаться от реального состояния Интернета, и тог­да пользователь в результате поиска может получить адрес уже не существующего или перемещенного документа.

В целях обеспечения большего соответствия между содер­жанием базы данных поисковой системы и реальным состо­янием Интернета большинство поисковых систем разреша­ют автору нового или перемещенного Web-сайта самому внести информацию в базу данных, заполнив регистрацион­ную анкету. В процессе заполнения анкеты разработчик сай­та вносит URL-адрес сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт.

Сайты в базе данных ранжируются по количеству их по­сещений в день, неделю или месяц. Посещаемость сайтов определяется с помощью специальных счетчиков, которые могут быть установлены на сайте. Счетчики фиксирует каж­дое посещение сайта и передают информацию о количестве посещений на сервер поисковой системы.

Поиск по ключевым словам. Поиск документа в базе дан­ных поисковой системы осуществляется с помощью введе­ния запросов в поле поиска. Простой запрос содержит одно или несколько ключевых слов, которые, по вашему мнению, являются главными для этого документа. Можно также ис­пользовать сложные запросы, использующие логические операции, шаблоны и так далее.

Через некоторое время после отправки запроса поисковая система вернет аннотированный список URL-адресов доку­ментов, в которых были найдены указанные вами ключевые слова. Для просмотра этого документа в браузере достаточно активизировать указывающую на документ ссылку.

Если ключевые слова были выбраны неудачно, то список URL-адресов документов может быть слишком большим (может содержать десятки и даже сотни тысяч ссылок). Для того чтобы уменьшить список, можно в поле поиска ввести дополнительные ключевые слова или воспользоваться ката­логом поисковой системы.

Наиболее мощными поисковыми системами общего на­значения в русскоязычной части Интернета являются серве­ры Rambler (http://www.rambler.ru), Апорт (http://www.aport.ru), и Яндекс (http://www.yandex.ru), а по всему Интернету — сервер Yahoo (адрес http://www.yahoo.com).





Дата публикования: 2014-10-30; Прочитано: 631 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.005 с)...