Яndex - search & research engine
Алексей Амилющенко, Елена Колмановская
Доклад прочитан на конференции Интернет-маркетинг-99
Реклама на поисковой машине
Баннерная реклама
Тип рекламы |
CTR мин. |
CTR ср. |
CTR макс. |
Стоимость одного клика мин. |
Стоимость одного клика ср. |
Стоимость одного клика макс. |
Динамический баннер |
0,15% |
0,64% |
1,37% |
$ 0,51 |
$ 2,28 |
$ 5,88 |
Контекстный баннер |
0,30% |
1,44% |
6,72% |
$ 0,33 |
$ 3,60 |
$ 10,00 |
|
Проанализированы данные по нескольким десяткам рекламных кампаний, прошедших на Яndex.
Текстовая реклама
Пример:
Карта Югославии бесплатно (ZIP-архив 500 КБайт) |
Показано |
Число нажатий |
CTR |
10,543 |
200 |
1,90% |
|
Показывается по словам:
нато, война, косово, албания, албанец, серб, сербия, югославия, милошевич, солана, бомбардировка, бомбежка, бомбовый, хорватия, македония, хорват, югослав
Логотипы (квадратная реклама)
Показывается на первой странице сервера. Это - имиджевая реклама. На сегодня такая реклама показывается примерно 40,000 раз в сутки.
Нестандартная реклама на странице выдачи результатов поиска
Эта реклама может быть контекстно-зависимой, т.е. показываться не всегда, а только при определенных запросах пользователей. Более того, можно сделать рекламу даже внешне зависящей от запроса - например, в рекламе Интернет-магазина оЗон запрос Яndex'а отображался в строчке ("Поискать ... в оЗоне") и при нажатии передавался поисковой системе сервера о3.
Реклама на выдаче поисковой машины (если не контекстная) показывается большее число раз, чем на первой странице Яndex. Многие пользователи задают запросы из формочек, расположенных на их собственных страницах, или на страницах провайдеров, а результат поиска видят абсолютно все посетители.
Ссылки с Яndex для удобства посетителей
В результатах поиска Яndex ссылается на другие поисковые машины, каталоги, энциклопедии. Эти ссылки также можно считать рекламой, но они размещены бесплатно - мы считаем, что пользователь, пришедший на Яndex, должен получить максимально качественный ответ на свой вопрос, а где именно (на Яndex'е, в каталоге и т.д.) - не так важно.
Вот как выглядят такие ссылки:
А вот статистика нажатия на эти ссылки за один день:
- Rambler - 1294
- AltaVista - 1211
- Апорт! - 1142
- List.ru - 798
- Кирилл и Мефодий - 787
- АУ - 588
Данные от 16 июня 1999
Советы рекламодателям
Про каждое слово мы знаем, в каких сочетаниях его ищут в Яndex:
- только слово отдых 679
- отдых, 6057
- крым, 612
- дом, 581
- сочи, 411
- подмосковье, 344
- море, 295
- туризм, 277
- турция, 222
- детский, 190
- болгария, 149
Приведены данные за две последние недели
Мы готовы давать нашим рекламодателям информацию о том, что больше всего интересует посетителей Яndex. На основе этих данных можно более грамотно спланировать рекламную кампанию.
Поиск - не простое занятие
Объем русской Сети уже достаточно велик и постоянно растет. Поэтому поиск нужной информации становится непростой задачей. Практически не имеет смысла делать запросы из одного слова - будет найдено слишком много "мусора". Сейчас средняя длина запроса в Яndex - 2,5 слова, и количество слов в запросе постепенно растет.
Тем не менее, запросы из одного слова задают, вот примеры:
реферат 9018
порно 4886
секс 3706
mp3 2795
sex 2717
эротика 2292
знакомство 2215
чат 2197
|
анекдот 1705
porno 1537
погода 1465
халява 1442
гороскоп 1436
игра 1322
москва 1279
работа 1243
|
Данные с 28 апреля по 17 мая 1999 года
Используя эту информацию, мы получили возможность давать советы посетителям Яndex:
Вот что из этого получается (переходы за один день):
бесплатное порно=93
русское порно=48
жесткое порно=36
эротические фото=31
рефераты и курсовые=30
работа и вакансии=28
бесплатный секс=28
порно фото=27
коллекция рефератов=25
|
russian sex=23
архив mp3=22
русские mp3=22
русский секс=21
работа в москве=19
компьютерные игры=18
photo sex=18
музыка mp3=18
служба знакомств=17
|
Всего переходов за день набирается сейчас примерно 1,500. Думаю, что так можно оценить количество новых (неопытных) пользователей.
Аудитория Яndex
Посетители (уникальные IP):
- в день - около 20,000
- в месяц - около 100,000
Поисковые запросы:
Количество слов в запросах (в неделю):
- около 100,000 разных слов
- около 1,000,000 слов
Поисковая система знает обо всей Сети
- Количество уникальных серверов - 33 460
- Количество уникальных URL - 7 237 683
- Объем проиндексированной информации - около 60,84 Гб
Данные за 10 июня 1999 со страницы http://yandex.ru/chisla.html
Это означает, что:
- В среднем на одном сервере - 216 страниц
- Средний объем страницы в русской Сети - 8,8 Кб
Вот как изменялись эти цифры со временем:
Дата |
Количество серверов |
Количество URL |
Объем проиндексированной информации (Гб) |
январь 1999 |
23,466 |
3,230,199 |
25.80 |
февраль 1999 |
24,772 |
4,512,231 |
35.54 |
март 1999 |
27,233 |
5,130,119 |
38.45 |
апрель 1999 |
29,463 |
6,555,621 |
51.17 |
май 1999 |
32,529 |
7,512,649 |
60.20 |
июнь 1999 |
33,460 |
7,237,683 |
60.84 |
|
Количество проиндексированных URL в июне немного уменьшилось. Это объясняется двумя причинами. Во-первых, как вы знаете, 1-го июня был запущен новый Яndex. При этом нам пришлось заново обойти всю Сеть, чтобы предоставить возможность поиска таких элементов, как, например, картинки. Во-вторых, мы почистили базу Яndex, исключив из нее некоторые страницы, содержащие ошибки. Об этом чуть подробнее.
Проблемы русской Сети (взгляд со стороны поисковой машины)
- Сервера не присылают дату
Многие сервера некорректно настроены и не сообщают поисковому роботу дату создания (изменения) документа. В этом случае в характеристике такого документа мы указываем unknown date. Это создает неудобство пользователям при поиске в диапазоне дат или при сотрировке по датам. И не только пользователям, а и владельцам сайтов - при работе с датами такие сервера просто исключаются из результатов поиска.
- Неправильно отрабатывается ошибка 404
Особенно часто такая ошибка встречается у серверов, которые динамически генерируют страницы (обычно из базы данных). Если запрошенная информации уже не существует, или в параметры запроса вкралась ошибка, то скрипт выдает страницу с сообщением об ошибке типа "Неверный запрос", но при этом сервер не сообщает код ошибки 404. Поисковый робот, который ориентируется по коду возврата сервера, честно индексирует такие страницы. Скорость обхода робота тормозится, а объем базы увеличивается за счет "мусора".
- Не присылается кодировка документов
Многие сервера не сообщают поисковому роботу кодировку индексируемого документа. В таком случае робот пытается эту кодировку определить самостоятельно, но, если он ошибется, документ будет нечитаем.
- Кладется несколько экземпляров документов в разных кодировках
Иногда на сервере держат несколько копий одного и того же документа в разных кодировках. Это неудобно как самим веб-мастерам (приходится больше работать), так и поисковой машине (дополнительная нагрузка на робота), кроме этого, иногда не удается определить, что это копии одного и того же (в случае, если на странице есть изменяющаяся информация, например, текущее время). Более разумно выдавать документы в разных кодировках средствами самого веб-сервера. Все современные веб-сервера умеют перекодировать документы "на лету" по запросу клиента.
- Скрипты с бесконечным числом состояний
Попадаются страницы с меню, которые могут иметь достаточно большое число состояний (открыть первый пункт, потом, не закрывая его, открыть пятый пункт и т.д.). С точки зрения робота это огромное количество разных страниц (поскольку разные URL и разное содержание). Такие страницы мы исключаем из индексирования.
- Спам
Некоторые веб-мастера всеми правдами и неправдами пытаются попасть на первую страницу выдачи поисковой машины. Их можно понять, но очень жалко пользователей, которые ищут какую-то важную информацию, а находят страницу такого спамера. Начиная с недавнего времени мы начали бороться с таким "популизмом". У спамерских страниц теперь понижается релевантность, то есть они находятся, но не "в первых рядях", а значительно дальше.
Мы знаем, кто на кого и сколько раз ссылается
counter.rambler.ru |
9349 |
counter.list.ru |
1807 |
www.zhurnal.ru |
1142 |
www.microsoft.com |
4501 |
www.orc.ru |
1597 |
www.w3.org |
1136 |
www.geocities.com |
3970 |
www.online.ru |
1577 |
www.lgg.ru |
1134 |
www.stars.ru |
3738 |
www.lycos.com |
1543 |
www.osp.ru |
1122 |
www.chat.ru |
3689 |
www.dux.ru |
1538 |
www.design.ru |
1100 |
www.linkexchange.ru |
3045 |
www.halyava.ru |
1486 |
www.ropnet.ru |
1062 |
www.aha.ru |
3007 |
members.aol.com |
1446 |
www.citycat.ru |
1057 |
www.yahoo.com |
2851 |
www.guestbook.ru |
1422 |
www.ras.ru |
1014 |
www.ru |
2563 |
www.excite.com |
1393 |
www.novdom.ru |
1011 |
www.rambler.ru |
2511 |
www.altavista.digital.com |
1386 |
www.apache.org |
1001 |
www.glasnet.ru |
2393 |
www.user.cityline.ru |
1372 |
www.angelfire.com |
996 |
www.bizlink.ru |
2354 |
www.cityline.ru |
1359 |
www.hp.com |
995 |
weblist.ru |
2233 |
people.weekend.ru |
1312 |
www.sun.com |
993 |
members.xoom.com |
2073 |
hits1.infoart.ru |
1297 |
www.intel.com |
987 |
home.netscape.com |
1988 |
www.reklama.ru |
1277 |
www.dejanews.com |
969 |
www.infoart.ru |
1953 |
www.adobe.com |
1255 |
www.cnn.com |
961 |
kulichki.rambler.ru |
1860 |
www.rbc.ru |
1251 |
www.ibm.com |
959 |
www.au.ru |
1859 |
www.nns.ru |
1230 |
www.anekdot.ru |
937 |
members.tripod.com |
1859 |
www.infoseek.com |
1222 |
altavista.digital.com |
919 |
www.netscape.com |
1844 |
www.hotbot.com |
1202 |
ourworld.compuserve.com |
905 |
yandex.ru |
1810 |
www.aport.ru |
1189 |
www.altavista.com |
904 |
|
Данные от 13 мая 1999
НИНИ-индекс
Мы изучаем и то, что ищут посетители Яndex, что их волнует больше всего. Результаты исследования публикуются на странице http://yandex.ru/nini.html
Неделя 24 |
7 - 13 июня 1999
|
1,82
+0,34
|
Находки недели |
Потери недели |
бесплатный секс футбол кондиционер погода |
[+1,26] [+1,03] [+0,72] [+0,66] [+0,46] |
|
сочинение реферат тема пушкин экзамен |
[-1,98] [-1,30] [-1,18] [-0,86] [-0,55] |
|
Школьные рефераты, сочинения и экзамены сданы. Новая тема после Пушкина - победа российского футбола. Погода располагает к поиску кондиционеров, которые, к сожалению, не бывают бесплатными (в отличие от секса).
|
Расчет НИНИ-индекса проводился по выборке, содержащей 917695 слов (455759 + 461936)
|
|
Такие исследование интересны не только сами по себе (что интересует интернетчиков), но и для рекламодателей (т.к. показывает, что именно наиболее эффективно рекламировать в данный момент). Так, например, в одну из недель сильно выросло количество запросов слова "кондиционер" (выделено жирным шрифтом). Понятно почему - жара стоит дикая. Но с жарой можно бороться многими способами - это и мороженое, и газировка, и купание. А вот оказалось, что многие задумались об установке кондиционеров. Самое время запустить рекламу, продающую кондиционеры.
Политический НИНИ-индекс
Если обычный НИНИ-индекс считается по всем словам, которые ищут в Яndex, то, рассматривая только некоторые из них, также можно получить весьма любопытные данные. Например, недавно мы стали изучать интерес к политическим и общественным деятелям России. Из этого получился политический НИНИ-индекс (http://yandex.ru/nini_polit.html):
Неделя 24 |
7 - 13 июня 1999
|
Абсолютный интерес |
Список политиков, которые наиболее часто встречаются в запросах нашей поисковой машины |
Кириенко |
Ельцин |
Лужков |
Скуратов |
Немцов |
Рост интереса |
Список политиков, интерес к которым возрос за последнюю неделю |
Лужков |
Немцов |
Зюганов |
Лукашенко |
Лимонов |
Примечание:
Интересно, что Кириенко, Ельцин и Скуратов, хотя и остаются в списке абсолютных лидеров, теряют популярность. Т.е. количество запросов с данными фамилиями упало, правда не настолько, чтобы вывести политиков из первых строк рейтинга. |
|
В Полит-НИНИ указываются:
Абсолютный рейтинг - 5 фамилий, которые наиболее часто встречаются в запросах Яndex.
Относительный рейтинг - 5 фамилий, интерес к которым вырос наиболее сильно.
А также
Аналогичным образом можно считать:
- Компьютерный НИНИ-индекс (совместный проект Яndex + Компьютерра)
- Маркетинговый НИНИ-индекс
- Хакерский НИНИ-индекс
- ...
Опросы на Яndex
Недавно мы начали проводить опросы. Опрос является хорошим средством изучения аудитории. Что интересно, данные наших опросов совпали с данными серьезных исследований Сети такими известными компаниями как Gallup или Комкон. С помощью опросов можно быстро получить мнение достаточно большого количества людей, чем активно пользуются журналисты (ИД "Коммерсантъ", Computer Reseller News/RE, Бюллетень "Петербургский аналитик"). Кроме этого, на основе результатов опросов можно писать сказки Яndex.
В конце хочу привести данные одного из наших последних опросов. Мы спрашивали "Какому источнику информации Вы больше доверяете?". Оказалось, что Интернету доверяют больше, чем информации, полученной от телевидения, газет или журналов и слухов вместе взятых. Впрочем, столько же народу не доверяют ничему.