Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Поисковые системы



Интернет буквально кишит самыми разнообразными, а порой и невероятными поисковыми системами. А как же иначе? Ведь объём информации растёт катастрофически, растёт и потребность пользователя находить именно нужную ему информацию. Без поисковых систем – никуда.

Два года назад, у меня родилась идея попытаться как-то систематизировать поисковые системы по роду деятельности и способу представления информации.
Собранная коллекция не претендует на полноту и объективность, так как за это время появились новые поисковики, кто-то кого-то купил, кто-то переименовался и т.д.
Большинство этой информации было актуально в 2003-2004 году, когда информация только начинала собираться. За прошедшее время в некоторых поисковых системах произошли кардинальные изменения, но всё же, я решил оставить всё как есть – пусть это будет своего рода архивом.

По возможности эта коллекция будет дополняться и модифицироваться.

* Часть информации взята с SearchEngineWatch.com

Поисковая система – это сито. Она пропускает то, что не имеет отношения к запросу и выводит в результатах поиска, ту информацию, которая является релевантной, то есть содержит ключевые слова запроса. Язык запросов - это специальный набор служебных команд, позволяющих максимально конкретизировать передаваемый поисковой системе запрос с использованием простейших логических функций объединения или исключения слов. Кому это нужно? Почти 40 процентов американцев делают это. Около 115 миллионов граждан США пользуются поисковыми системами. Это составляет почти 80 процентов активного населения страны. У нас доля людей, которые на «ты» с поисковиками – не более 10 процентов всего населения, в мегаполисах больше – в глубинке меньше. Но с каждым днем число впервые приобщившихся к поисковым системам растет, причем рост этот происходит гораздо более высокими темпами, чем в США и поэтому так важно дать этим людям максимум информации о поисковых системах, новостях поисковой жизни и нововведениях, облегчающих задачи пользователя. Около 40 процентов российских пользователей ищут информацию с помощью Yandex, многие отмечают, что в Rambler неудобно работать. Правда, есть жалобы и на яндексовские глюки, когда люди просят что-нибудь конкретное, а поисковик выдаёт какую-нибудь цитату с Богом забытого форума. Правда наши приспособились учитывать его тупость и размещая ключевые слова в другом порядке, сохраняя страницу и используя опцию "искать в найденном", получают то, что им хотелось получить. В последнее время в России становится все более популярным Google. Многие, как выясняется не знают, что Гугль - многоязычный поисковик. Даже если набрать www.google.com, происходит редирект на www.google.ru, т.к. Гугль сканируя IP запроса, определяет что этот IP принадлежит провайдеру из России и переходит в русскоязычный раздел. Какую информацию можно найти на сайте? На сайте www.relevantno.ru всегда предлагается самая свежая отечественная и переводная информация о новостях и основных принципах поиска. В результате исследований статей, где Google рекомендовался в качестве решения какой-то задачи, были определены самые популярные его применения. Эксперты проанализировали частоту использования поисковой системы Google для удовлетворения различных потребностей. Из 400 вариантов поиска - 123 были запросами пользователей информации о себе лично; 64 пытались проверить состояние чего-либо на Google, 56 стремились выявить плагиат, 47 человек хотели найти информацию о другой стране; найти место продажи продукта/сервиса рассчитывали - 43; найти информацию об известном человеке - 23; получить новости/информацию о здоровье - 19; проверить факт - 15. Из вышеприведенной статистики следует, что более 10% (43 из 400), пользующихся поисковыми системами являются потенциальными покупателями. Сами подсчитайте, сколько это от общего числа пользователей Интеренет. Поэтому неудивительно, что компании, сайты которых продвигаются в поисковых системах, занимают лидирующие позиции в своем сегменте рынка. Результатом продвижения сайта в поисковых системах является наращивание клиентской базы и рост объемов продаж. Поэтому, все то новое, что происходит в мире поисковых систем опосредованно сказывается на результатах бизнес-деятельности. Эту ценную информацию вы сможете найти на нашем сайте.  
Характеристики поисковых сиcтем
Для того, чтобы правильно оптимизировать страницы, будь то дорвеи или обычные страницы, необходимо знать, что любят поисковые системы. В этом разделе я приведу данные о каждой поисковой системе в отдельности, а также в общем виде. Посмотрите некоторые сводные таблицы:
  • таблица особенностей выдачи результатов поиска
  • требования основных поисковых систем для оптимизации страниц
  • сводная таблица характеристик поисковых систем (русских)
  • сводная таблица характеристик поисковых систем (зарубежных)
  • Факторы влюяющие на индексацию в поисковых системах
  • Допустимый размер Tilte, Description и Keywords в зарубежных поисковиках.
  • Размер баз данных поисковых систем и каталогов
  • Реклама на поисковых системах
  • Индексация динамических страниц западными поисковыми системами
  Поисковая система Rambler
адрес: http://www.rambler.ru Полезные разделы Рамблера и их описания:
  • Поисковая система
  • Рейтинг Rambler's Top 100
  • Рейтинг Rambler's Top Shop
Советы по продвижению в Рамблере:
  • Оптимизация страниц для Рамблера
  • Использование рейтинга Top 100, как инструмента раскрутки
  • Вопросы и ответы
Краткий обзор Поисковая система Рамблер начала свое существование с 1996 года. На сегодняшний день она является одной из самых популярных в РуНете, уступая лишь Яндексу (по популярности). По оценкам SpyLog на Рамблер приходится 20-25% от всех поисковых запросов РуНета. Поисковая система Рамблер при поиске учитывает морфологию русского языка, что дает больше возможностей для эффективного поиска информации. Реализована также система так называемых "перевязок", которая позволяет выдавать в результатах поиска не только страницы содержащие запрос, но и слова, которые являются синонимами запроса. Еще одной функцией "перевязок", думаю более значимой, является выдача контекстной рекламы не только по конкретному запросу, но и по запросам, которые тесно связаны с исходным, это позволяет перекрыть большее количество целевой аудитроии. На Rambler функционирует также рейтинговая система Rambler's Top 100 (http://www.top100.rambler.ru/, здесь можно прочитать его описание), в которой можно найти наиболее посещаемые сайты по определенной тематике. На данный момент это самый популярный рейтинг РуНета, даже можно сказать, что это один из немногих рейтингов РуНета, в которых стоит участвовать. Публикации о Рамблере
  • Rambler индексирует Flash. 18.03.2003
  • Рамблер сделал поиск на Mail.ru 10.04.2002
  • Рамблер переехал в Силиконовую слободу. 07.02.2002
  • Болгарский "Рамблер" закрывается, немецкий уже закрылся. 02.02.2002
  • Rambler подводит итоги года. 31.12.2001
  • Rambler с человеческим лицом... и не одним. 26.12.2001
  • Рамблер убыточен, но это не страшно. 06.12.2001
Поисковая система Yandex.  
URL's:
  • www.yandex.ru
  • www.ya.ru - текстовая версия
Русскоязычная поисковая система. На сегодняшний день имеет самую большую базу данных, которая имеет кластерную структуру и размещена на нескольких серверах. У Яндекса достаточно быстрый поисковый робот, после 2-4 часов регистрируемая страница появляется в поисковых результатах. Но это означает лишь то, что страница поставлена в очередь на полную индексацию. После того, как страница проходит полную индексацию, она может пропасть из поисковых результатов, если поисковый робот сочтет ее за спам, либо из-за каких-нибудь технических проблем. Т.е. если ваша станица после первичной индексации вышла на первые места по тому или иному запросу, то после полной индексации, возможно, она будет совсем на других позициях, вывод: положение страницы нужно отслеживать в течение нескольких дней, пока не пройдет полная индексация. Не стоит волноваться, если попадете в следующую ситуацию: Страница после полной индексации заняла хорошую позицию. Но после одной из проверок ее место в списке результатов ниже, чем обычно. А на следующий день опять все по-прежнему. Список результатов может меняться в зависимости от загруженности серверов. Т.к. база данных имеет кластерную структуру и разнесена на несколько серверов. Советы по оптимизации: Не нужно делать очень маленькие или очень большие документы. Яндекс любит документы средних размеров, насыщенные текстом (статьи и т.п.). Следует умеренно повторять ключевые слова. Ключевые слова можно писать в ALT описании, но вес слов в этом тэге ниже. Хорошо индексируются страницы созданные скриптами cgi, php. Это касается гостевых книг, форумов и т.п. Для индексации остальных (кроме главной) страниц сайта требуется примерно 2 недели. Если сайт на русском языке, а домен не в зоне.ru, то Яндекс все равно проиндексирует. Я ждал индексации raskrutka.net -16 дней, но за это время проиндексировано только 2 страницы, немного позже все страницы были проиндексированы. UserAgent Имя поискового робота: Yandex/1.03.00х, где х - тип паука, в зависимости от типа индексации (первичная, полная). Поддержка мета тэгов Мета тэги keywords и description: ключевые слова в них особенно не помогают достигать хороших позиций. В мета тэгах нужно писать лишь те слова, которые встретятся в тексте страницы. Однако мета тег description, используется для выдачи описания страницы в результатах поиска. Это нужно учитывать при его составлении, т.к. это будет один из критериев, по которым пользователь решает приходить к ваи, или нет. Мета тэги, такие как revisit-after, content - не поддерживаются. Советы по улучшению позиции сайта. ключевые слова в: Title, заголовки (h1-h6), содержание страницы, ALT. В формулу вычисления релевантности включен Взвешенный Индекс Цитирования, аналог Page Rank в Google. Обычный Индекс Цитирования используется только при сортировке сайтов в каталоге Яндекса. Влияние на положение в результатах поиска оказывает ВИЦ. Спам Разработана технология определения спама, но пока она является кране не эффективной. Часто встречаются спамерские страницы. Но команда разработчиков работает над этим. По сему, крайне не рекомендую использовать спамерские методы. Публикации о Яндексе
  • Преобразования в Яндекс.Новости 09.07.2003
  • Яндекс повысил стоимость включения в свой каталог. 01.04.2003
  • Яндекс.Директ – объявления в вашем городе. 27.03.2003
  • На Яндексе - только живые души 12.03.2003
  • Совет директоров компании Яндекс. 14.02.2002
  • Яндекс. Вирусы? К доктору! 10.10.2001
Поисковая система Апорт! - описание
Регистрация сайта в Апорте производится со страницы http://www.aport.ru/addurl.asp, Эта страница доступна по ссылке "Добавить URL" почти с любой страницы Апорта, например, с главной страницы Апорта. Что нужно и что не нужно добавлять Сайтом, в понимании Апорта, может являться как целый сервер (например, www.agama.com), так и самостоятельная по содержанию часть сервера (например, www.company.ru/~vasya/). Добавлять следует корень сайта, остальные страницы будут найдены Апортом по ссылкам. Апорт является поисковой системой по российскому интернету, поэтому добавлять в нее следует русскоязычные сайты, а также сайты имеющие непосредственное отношение к российскому интернету. В случае отказа в автоматическом добавлении сайта, что может произойти, например, если робот не найдет на его корневой странице русскоязычного текста, вы можете обратиться с просьбой о добавлении сайта по e-mail [email protected] Когда сайт появится в результатах поиска С момента добавления сайта в Апорт до момента его появления в поисковой базе проходит от двух-трех дней до двух недель. В отдельных случаях, например, в случае нестабильной связи с добавленным сайтом, это время может оказаться несколько больше. Как обновить информацию об уже зарегистрированном сайте Апорт периодически проверяет уже имеющиеся в его базе сайты и приводит свою базу в соответствие с произошедшими там изменениями. Период проверки в значительной степени зависит от конкретного сайта (учитывается его популярность, динамичность обновления по данным собранным апортом при предыдущих заходах на сайт и ряд других факторов). Как сделать, чтобы Апорт качественно проиндексировал сайт: Какие документы на сервере индексирует Апорт При просмотре содержимого сервера для индексирования Апорт обязательно проверяет файл ROBOTS.TXT. Так что вы можете использовать его, чтобы ограничить "деятельность" Апорта на своем сервере. При желании установить селективные ограничения только для Апорта следует использовать в качестве имени робота слово Aport. Также поддерживаются мета таги Robots, позволяющие, в частности, установить правила поведения робота на вашем сайте даже в случае, если вы не имеете возможности изменять файл robots.txt на сервере. Апорт по умолчанию не индексирует документы, в Url которых встречается символ "?". Если вы считаете, что для вашего сайта такие документы следует индексировать, вы можете обратиться к нам с подобной просьбой по [email protected] Какие части документа индексирует Апорт Апорт — полнотекстовая поисковая система. Это означает, что она индексирует все слова, которые бы увидел на экране человек, просматривая конкретную страницу вашего сервера. В результате любое слово из текста ваших документов может служить критерием последующего поиска. Для документов HTML кроме основного текста документа индексируются также: заголовок документа (TITLE), ключевые слова (META KEYWORDS), описания страниц (META DESCRIPTION) и подписи к картинкам (ALT). Кроме того, Апорт индексирует как принадлежащие документу, тексты гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами, а также составленные (или проверенные) редакторами описания сайтов из нашего каталога. Как поднять релевантность своего сайта Если вас интересует, на каких принципах построена сортировка найденных сайтов в Апорте, то есть почему одни сайты появляются на первой странице результатов поиска, а другие, также содержащие слова из запроса пользователя на первые страницы выдачи не попадают, советуем поcетить нашу страничку http://www.aport.ru/info/. Здесь же мы только остановимся на наиболее распостраненных заблуждениях:
  • Сортировка результатов поиска в Апорте основана исключительно на объективных критериях Если вас интересует возможность небесплатной раскрутки своего сайта с помощью Апорта, мы можем предоложить вам целый ряд эффективных вариантов направленной рекламы, в полной мере использующих специфику поисковой системы http://www.aport.ru/adv, однако вы не сможете купить более высокое место для своего сайта в результатах поиска.
  • Ключевые слова (META KEYWORDS) не имеют определяющего значения при определении релевантности документа Разумное использование этого тага рекомендуется и может поднять ваш сайт в результатах поиска по соответствующим словам, однако, не следует думать, что именно на него Апорт обращает внимание в первую очередь.
  • Релевантность документа по конкретному слову нельзя поднять в десять раз повторив это слово в тексте (или в другой части документа) десять раз подряд В отличие от многих других поисковых систем, Апорт не применяет каких-либо специальных санкций к сайтам, пытающимся обмануть поисковую систему с помощью спама, однако добиться подобным способом желаемого результата не получится. Поэтому не стоит писать невидимые тексты, вбивать сотни ключевых слов, не имеющих никакого отношения к содержанию документа и т.д. Помните, что во многих поисковых системах предусмотрены жесткие меры для борьбы со спамом, включая полное удаление сайта из системы.
Теперь мы просто вынуждены перейти к обсуждению вещей, которые трудно увидеть на страничке Апорта невооруженным глазом, но которые довольно существенно влияют на качество поиска. Всем понятно, что поиск может считаться хорошим, если удается найти нужную информацию на одной из первых страниц с результатами поиска. В этом смысле грамотная сортировка очень важна. В Апорте-2000 она существенно переработана и использует ряд новаторских идей. По нашим собственным ощущениям, качество сортировки в Апорте-2000 на голову выше всего, что мы видели до этого. Если вам интересно, то вот перечень основных критериев, которые Апорт учитывает при сортировке документов (сайтов): 1. количество искомых слов в тексте документа (в процентах) расстояние между поисковыми словами в тексте документа 2. место в тексте, где встречаются поисковые слова (заголовок, описание, мета-таг и т.п.) 3. внешний вид шрифта, которым набраны в тексте искомые слова (размер, жирность, цвет) 4. количество ссылок из Интернета на данный документ 5. использование искомого слова в тексте ссылок из Интернета на данный документ Окончательный процент соответствия документа запросу строится как некая функция от всех этих показателей. Часть из них просты и понятны (хотя учитываются далеко не всеми поисковыми машинами), часть требует пояснения, поскольку это новые, практически уникальные решения. Во-первых, пункт 4 - учет числа ссылок на сайт из Интернета. Идея проста: чем чаще ссылается Интернет-общественность со своих страниц на сайт, тем он популярнее, а потому, видимо, интереснее и заслуживает того, чтобы оказаться в результатах поиска выше. Важно, что этот критерий объективен, его трудно подделать, он является результатом труда множества web-мастеров и владельцев ресурсов, каждый из которых дает ссылки на то, на что хочет. Данный критерий мы называем Site Rank (для сайтов, или Page Rank - для страниц). Развивая идею учета ссылок, Апорт-2000 идет дальше. Если мы считаем ссылки, то давайте еще будем учитывать и их текст. Если на какой-то сайт есть ссылка, состоящая из слов «современная музыка», то разумно предположить, что эти слова (которые выбрал человек, писавший ссылку) могут довольно хорошо описывать содержимое сайта. Причем, даже в том случае, если на самом сайте эти слова не употребляются (например, автор сайта оперирует исключительно термином «джаз»). В результате, при поиске по слову «музыка» данный сайт должен получить в результатах довольно высокое место, поскольку по данному слову на него ссылаются с других сайтов. Подобный подход также, как и предыдущий, довольно значительно улучшает качество сортировки найденных документов. Но кроме этого он приносит еще один очень интересный результат. Ищем все Представьте себе, что Апорт-2000, добавляя в свою базу некий документ с сайта X, нашел ссылку на документ с другого сайта Y, который пока отсутствует в базе Апорта. Благодаря возможности находить документы и сайты по словам из ссылки, Апорт сможет теперь найти сайт Y, хотя он еще не индексировался, а, возможно, и не будет индексироваться (например, если это зарубежный сайт). Это замечательная возможность позволяет находить гораздо больше сайтов меньшими усилиями и искать в зарубежных сайтах, которые Апорт не индексирует, причем использовать запросы с русскими словами. Таким образом, благодаря индексированию ссылок (что требует небольшого дополнительного времени) поисковое пространство Апорта значительно расширяется, В итоге, Апорт не только быстро добирается до различных закоулков российского Интернета, но и позволяет искать в зарубежной Сети, причем весьма неплохо (поскольку на многие интересные зарубежные ресурсы есть ссылки и с российских сайтов).
  List.ru - поисковый каталог, описание
адрес сайта: Mail.Ru (List.ru) Каталог Mail.Ru (List.ru), один из самых известных в РуНете. С его помощью можно осуществлять полнотекстовый поиск ресурсов по их названиям, описаниям и ключевым словам. Для поиска по Интернету используется БД Google. Выдача результатов поиска осуществляется в зависимости от категории: Название сервера, краткое описание. Возможность сортировки серверов в каждой категории по алфавиту, по времени добавления, по переходам.
Русскоязычные поисковые системы.
Сейчас в РуНете существует три основные поисковые системы, это: 1. Рамблер 2. Яндекс 3. Апорт В этом списке я расположил их по степени популярности, а не по качеству поиска. Но, проблема качества поиска, это уже тема требующая отдельного раздела. А здесь же, вы сможете найти описания и характеристики русскоязычных поисковых систем. Щелкайте на имя интересующего вас поисковика и читайте о нем все подробности. А ниже привожу сводную таблицу некоторых характеристик.
Поисковая система Рамблер Яндекс Апорт
Появление в индексах после регистрации Ближайший выходной 7 дней 7 дней
Период обновления страницы в индексах. От недели до месяца 7 дней От недели до месяца
Глубина индексирования Не ограничена Не ограничена Не ограничена
Появление в индексах не зарегистрированных страниц От недели до месяца Около 7 дней От недели до месяца
Поддержка фреймов Да Да Да
Поддержка ImageMaps Да Да Да
Индксация закрытых разделов Да Да Да
Индексация внешних ссылок Нет Планируется Нет
Robots.txt Да Да Да
Определение частоты обновления Нет Да Да
Возможность проверки страницы на наличие в индексах $url:www.raskrutka.net При попытке регистрации, Yandex проверит наличие сайта в своей базе. url=www.raskrutka.net
Возможность проверки внешних ссылок Нет Нет link=www.raskrutka.net
       

по данным promo.ru


Вы также можете посмотреть другие характеристики и особенности поисковых систем, в разделе характеритстики.





Дата публикования: 2014-12-10; Прочитано: 508 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...