В среду на yandex.com заработал поиск «Яндекса» по зарубежным сайтам. Кроме того, теперь, если ввести запрос на латинице на www.yandex.ru, то над результатами поиска появятся фильтры: «все», «в Рунете» и «в мировом Интернете». Фактически, решив выделить yandex.com в отдельный домен, компания бросила вызов Google в мировом масштабе. О том, не боится ли российская компания соперничества с мировым поисковым гигантом и в чем видит свои конкурентные преимущества, газете ВЗГЛЯД рассказала один из основателей «Яндекса» Елена Колмановская.
«Уже несколько лет индексируем западные сайты»
– В среду «Яндекс» предложил своим пользователям новую возможность – поиск только по зарубежным сайтам. Что представляет собой данная функция?
– Когда-то давно, когда «Яндекс» начинал свой поиск, мы позиционировались как поиск по России и для российских пользователей. «Яндекс» хорошо и качественно искал сайты, которые либо находятся в России и странах СНГ, либо русскоязычные сайты, которые зарегистрированы в других странах, либо англоязычные сайты о России.
Как раз это и интересовало пользователей в первую очередь. В связи с расширением Интернета и расширением привычки им пользоваться, а также увеличением количества российских, белорусских, казахстанских и других пользователей, их интересует уже не только русский Интернет и не только Интернет, «написанный» по-русски.
Это стало понятно довольно давно. И мы уже несколько лет индексируем западные сайты. Пару лет назад начали интенсивно их добавлять в результаты поиска.
«Доля запросов на латинице высока»
– Но тут возникает вполне понятная проблема…
− Да. Проблема такая: когда человек задает запрос на латинице, нельзя однозначно сказать, что этим он изъявляет желание искать именно в зарубежном Интернете. Потому что, например, масса моделей бытовой техники или, к примеру, наименования компаний пишутся латиницей.
В таких случаях «Яндекс» добавляет в результат поиска зарубежные сайты, но большинство составляют сайты «местного разлива». Дело в том, что и наши эксперименты, и статистика показывают, что массовому пользователю именно такой результат кажется релевантным.
При этом мы понимаем, что иногда человека интересуют именно зарубежные сайты. До сегодняшнего дня поиск не позволял человеку сказать: «Я хочу искать только за рубежом». Мы пришли к выводу, что, во-первых, такие люди есть, а во-вторых, их не так уже и мало. В итоге «Яндекс» и решил предоставить им такую возможность.
– Известно, что доля запросов к поиску «Яндекса» на латинице составляет порядка 12−15%. Тогда каково число пользователей, которых интересует исключительно информация, скажем так, на неродном языке?
– Доля запросов на латинице высокая, и она, конечно, превышает число запросов тех людей, которые реально ищут только зарубежный Интернет. Сколько таких пользователей, мы скоро узнаем, потому что сейчас у них есть возможность «переключиться» на зарубежный поиск.
«Мы ко всему готовы»
– Но, согласитесь, выделяя подобный поиск в отдельный домен на yandex.com, вы бросаете вызов Google? Не страшно?
− Мы ко всему готовы. Мы конкурируем с Google в России уже много лет, причем весьма успешно. Конечно, сейчас мы не заявляем ни о каком мировом поиске. Более того, в некотором смысле мирового поиска не существует.
– То есть?
− Поясню. У поиска есть две составные части. Первая – это база данных, которую надо собрать, к настоящему моменту мы собрали порядка 4 млрд документов – они в первую очередь ориентированы на интересы российских пользователей.
Мы видим, что интересует пользователей, какие документы они ищут, на что «кликают». Мы видим, на что ссылаются русские сайты. Из всего этого собирается база первоочередных нужных материалов индексации.
Вторая часть поиска – ранжирование. Всемирную базу данных собрать можно, однако нужно учитывать, что ранжирование зависит от того, где находятся пользователи.
У нас, например, разное ранжирование для России и для Украины. Так, делая запрос «день рождения президента», украинский пользователь подразумевает дату рождения Виктора Януковича, российский – Дмитрия Медведева. Соответственно, и результаты поиска должны быть разными.
«Нельзя говорить о мировом поиске»
– Получается, ваше конкурентное преимущество вы видите именно в ранжировании?
− Более того, с помощью нового алгоритма Матрикснет (MatrixNet), который мы внедрили в прошлом году, «Яндекс» способен менять ранжирование даже в зависимости от города, в котором находится пользователь. Потому что, к примеру, по запросу «доставка пиццы» в Москве и Казани должны выдаваться разные результаты.
Поэтому нельзя говорить о мировом поиске, можно говорить о поиске для США, для Германии, Израиля, Китая и так далее.
Сейчас мы сделали поиск для своей текущей аудитории. У нас нет задачи бросать кому-то вызов. Когда-то «Яндекс» работал только в России, сейчас он пришел в страны СНГ. В первую очередь мы это делаем для людей, говорящих по-русски, по-украински, по-казахски…
«Больше возможностей создавать контент»
– Что ж, ваша скромность похвальна, но все-таки: в чем вы видите свои конкурентные преимущества перед Google?
– По-хорошему, про конкурентные преимущества нужно спрашивать не у меня, а у наших пользователей. Это они нас выбирают по каким-то причинам. Судя по доле рынка, которую занимает «Яндекс», многим в «Яндексе» удобнее искать, чем в Google.
Мы думаем, что у нас больше возможностей пристальнее относиться к интересам российских пользователей, больше про эти интересы знать, больше находить контента или же создавать этот контент.
– Приведите пример.
− Яркий пример – сервис «Яндекс. Пробки». Когда Google или Yahoo делают американский вариант этого сервиса, они, грубо говоря, приходят в муниципалитет и получают там информацию. У нас же устроено все наоборот.
Мы придумали, как собирать данные (датчики, камеры, треки от пользователей), начали показывать их в Интернете, и теперь к нам приходят из муниципалитета и говорят: «Отлично, дайте нам информацию, потому что у нас нет своих данных». И такой инфраструктуры не было, пока мы не сделали Интернет-систему по сбору информации.
Мировым поисковикам в этом плане труднее. Они могут работать на уровне стран, а мы − на уровне городов.
«Многое представляет собой лишь копирование»
– Вы уже сказали, что сейчас в индексе «Яндекса» около 4 млрд зарубежных веб-страниц на латинице. Между тем мировые поисковики проиндексировали около 100 млрд страниц. Google пару лет назад заявлял, что знает триллион сайтов. Не маловато ли у вас индексации?
− Во-первых, о том, что такое 100 млрд страниц. Когда Google заявил о триллионе сайтов, он же говорил, что многие из них являются дубликатами. Задачи проиндексировать все в Интернете не стоит. Заметная часть всего того, что существует во Всемирной паутине, никогда никому не потребуется. Многое представляет собой лишь копирование чего-то, существующего ранее, или же набор бессмысленной информации по типу «я и моя кошка».
Поэтому на самом деле «Яндекс» знает гораздо большее количество страниц, чем те, которые «кладет» в индекс. У нас нет задачи «нагонять» количество, есть задача – обеспечить качество. При этом мы продолжаем индексировать, начав с самого интересного. Но круг интересов наших пользователей расширяется.
«Очень важно настроить релевантность»
– Есть мнение, что для конкуренции с мировыми поисковиками «Яндексу» достаточно проиндексировать 20 млрд страниц, а также рекламировать свой поиск за рубежом. Вы с этим согласны?
– Про 20 млрд я не знаю, это такая оценка. Наверное. Мировые поисковики проиндексировали около 100 млрд страниц, но это по совокупности. Скорее, каждый отдельно взятый поисковик называет десятки миллиардов страниц. Конечно, хорошо проиндексировать больше. Что же касается зарубежного Интернета, то, как я уже говорила, нет мирового поиска.
Очень важно настроить релевантность. Чтобы сделать немецкий, американский или российский поиск, надо иметь, вообще говоря, хорошую информацию по настраиванию машинно-обучаемого алгоритма. То есть надо знать статистику запросов пользователей, их поведение. Существует огромный набор информации, который позволят хорошо построить релевантность.
Собственно для этого мы вынесли поиск в отдельный домен на yandex.com, чтобы люди могли прицельно «поиграть» с ним, прислать нам какие-то свои соображения и комментарии на этот счет, а к тому же дать нам статистику.
– Ну и последний вопрос. Google получает огромные доходы от контекстной рекламы. Надеетесь ли вы повторить его успех и, если да, то как?
– Вообще-то 85% наших доходов – это именно контекстная реклама. Давно известно, что поиск лучше всего монетизируется посредством контекстной рекламы. Так что бизнес-модель у нас такая же, как у Google.
По материалам газеты Взгляд