Поисковые системы - статьи

       

Как работают поисковые системы


Все поисковые машины состоят из трех основных частей. Первая - так называемый "паук" или "червяк" - постоянно "ползает" по всему веб-пространству, следуя многочисленным ссылкам как в пределах одного сайта, так и с одного сайта на другой. "Паук" считывает содержимое всех страниц и передает эти данные гигантскому централизованному хранилищу своего поисковика (называемому также индексом).

Индекс является второй из трех упомянутых составных частей поисковой машины.

Третья, самая сложная составляющая системы - алгоритм поиска, тот самый механизм, который, за несколько секунд отсортировав необозримую базу данных, выдает нам искомую страничку со ссылками на ресурсы, которые он счел соответствующими нашему запросу (релевантными). Наиболее релевантные ресурсы оказываются наверху списка, и именно они, скорее всего, окажутся просмотренными тем пользователем, который воспользовался услугами данного поисковика. Поэтому каждый сайтовладелец должен стремиться к тому, чтобы поисковая машина посчитала именно его ресурс наиболее релевантным тем ключевым словам, по которым его мнению, его будут искать.
http://www.searchenginewatch.com/webmasters/article.php/2168031

Алгоритм определения релевантности - свой для каждого поисковика - охраняется владельцами поисковой машины как самый большой коммерческий секрет. Однако, существуют некоторые принципы, общие для всех, и о них мы расскажем в следующей главе.
http://www.yandex.ru/articles/art033.html
http://www.searchenginewatch.com/webmasters/article.php/2167961



Содержание раздела