Поисковые системы состоят из трех главных механизмов:
1. Поисковый робот:
Поисковый робот - это специализированное приложение (другое название "поисковый паук"), которая сканирует сеть интернет и собирает новую информацию о страницах веб-сайтов, перенаправляя ее в следующий механизм – индекс, т.е. в базу данных.
2. Индекс:
Индекс – это некий склад данных, т.е. база данных, которая хранит дубликат каждой найденной страницы веб-сайта. База данных обновляется каждый раз, когда поисковый робот находит и перенаправляет новые страницы.
3. Система ранжирования:
Система ранжирования - это приложение, которое определяет релевантность каждой страницы соответствующему поисковому запросу, с использованием семантического анализа каждого документа, его плотности и принадлежности ключевых слов, ссылок с тематических ресурсов и других факторов. От того насколько релевантна страница веб-сайта зависит ее место расположение при выдаче результатов поиска.
Обработка поискового запроса определяется следующим образом:
1. Поисковый запрос обрабатывается и проверяется на присутствие дополнительных команд и ошибок в запросе (в тои случаи если присутствует ошибка, то, как правило, предлагается выбрать правильный или подходящий вариант).
2. По поисковому запросу выбираются страницы веб-сайтов из базы данных - индекса и выдаются в соответствии порядка релевантности.