Зарубежные поисковые машины

 Altavista Excite HotBot InfoSeek Lycos OpenText WebCrawler
ТипПолнотекстовая ПолнотекстоваяПолнотекстовая ПолнотекстоваяАбстрактная ПолнотекстоваяПолнотекстовая
Размер30 миллионов 55 миллионов54 миллиона 20-50 миллионов20-25 миллионов 5 миллионов2 миллиона
Период обновления от 1 дня до 3 месяцев 1 - 3 неделине позднее 3 недель от минут до месяца ещемесячное обновление 1 - 4 неделиеженедельное обновление
Дата индексирования документа ДаНет ДаНет НетНет Нет
Указанные (submitted) страницы 1 день1 неделя 3 недели1 месяц 1 месяц2 - 4 недели 2 - 4 недели
Неуказанные (non-submitted) страницы 1 - 3 месяца3 недели 3 недели1 месяц 1 месяц2 4 недели 2 4 недели
Глубина индексирования НеограниченаНеограничена НеограниченаНеограничена Неограничена
-
Ограничена популярностью того или иного сервера
Поддержка фреймов НетДа НетДа ДаНет Нет
Поддержка ImageMap ДаНет НетДа ДаНет Да
Защищенные паролями директории и сервера НетДа НетДа ДаНет Нет
Частота появления ссылок НетНет ДаНет ДаНет Да
"Обучаемость" ДаНет ДаДа НетНет Нет
Контроль индексации robots.txt robots.txt (в будущем и метаданные) И то, и другоеrobots.txt robots.txt robots.txt И то, и другое
Перенаправление (redirect) ПоддерживаетПоддерживает
-
-
-
-
Поддерживает
Стоп-словаДа ДаДа НетДа НетНет
Влияние на алгоритм определения релевантности Нет
-
Ключевые слова в метаданных НетНет НетЧастота появления ссылок
Spam-штрафы ДаДа ДаДа ДаДа Да
Поддержка META-тагов ДаНет ДаДа ДаНет Только NOINDEX таг
Title Заголовок страницы или No Title Заголовок страницы или Untitled Заголовок страницы или URL Заголовок страницы или первая строка документа Заголовок страницы или первая строка документа Первые 100 символов из документа Заголовок страницы или URL
Description Метатаг или первые несколько строк из документа Формируется из наиболее релевантных к запросу фраз документа Метатаг или первые несколько строк документа Метатаг или первые 200 символов после тага <body> Метатаг или экстакт из содержимого страницы Первые 100 символов документа Создается из содержания; обещается поддержка метатагов в будущем
Проверка статуса URL ДаНет НетНет ДаНет Да
Удаление старых данных Удалить содержимое и указать новый адрес Удалить содержимое или переписать robots.txt Переписать robots.txt Удалить содержимое и указать новый адрес или переписать robots.txt
-
-
-
Имя поискового робота (Spider User Agent) Scooter Architext Spider Slurp the Web Hound Side winder T-rex
-
Spidey

Calafia Consulting
Информация приведена по состоянию на начало 1998 года.