-->

Общие принципы работы поисковых систем

В составе современных поисковых систем имеются следующие компоненты:

— программа для скачивания веб-страниц Spider (или паук);

— программа, которая выполняет автоматический переход по всем ссылкам, имеющимся на странице, Crawler (или паук-путешественник);

— программа-индексатор, выполняющая анализ скаченных при помощи «спайдера» веб-страниц;

— база данных, которая является хранилищем скаченной и обработанной информации;

— система, занимающаяся выдачей результатов, их поиском и извлечением из базы данных;

— веб-сервер, осуществляющий взаимодействие пользователя и компонентов поисковой системы.

Разные поисковые системы могут отличаться некоторыми деталями при выполнении поиска, но имеются также и общие черты. Среди них:

— программа-«паук», скачивающая веб-страницы по «браузерному» принципу. Разница в том, что браузер отражает информацию на экране, а Spider нет;

— программа «паук-путешественник» определяет все присутствующие на странице ссылки. Crawler задает «маршрут», по которому дальше будет двигаться «паук», на основании ссылок или заданных адресов, а также занимается поиском новых еще неизвестных поисковикам документов;

— при помощи программы-индексатора страница разбирается на компоненты, которые потом анализируются. Анализу подвергаются следующие элементы: заголовки, тексты, особенности структуры и стиля, специальные html-теги и другие;

— в базу данных заносятся все данные, которые система скачала и проанализировала. Нередко подобное хранилище именуют индексом поисковых систем;

— система, которая выдает результаты, занимается сортировкой страниц. Она отбирает то, что по ее «мнению» подходит под запрос пользователя, и ранжирует найденные страницы, согласно поисковому алгоритму. Данная информация представляет наибольшую ценность, поскольку именно с системой выдачи результатов сотрудничает оптимизатор, стремящийся поднять позиции сайта в поисковиках;

— на веб-сервере имеется html-страница с окошком под ввод нужного для пользователя термина. Этот же сервер выдает результаты под видом html-страниц.

Все факторы, влияющие на позиционирование сайта в поисковиках, условно разделяются на внутренние и внешние. Внутренние факторы контролируются владельцем сайта, то есть текстовая информация, его дизайн и прочие.

Есть что сказать? Оставьте комментарий!

bestwebsite.biz © 2017. All Rights Reserved.