Попробуем почитать между строк

Очередное интервью с представителями Яндекса, на этот раз на Roem.Ru. Никаких особенных откровений, конечно, нет. Что же вы хотели, чтоб яндексоиды всем бесплатно раздали рекомендации, как выбраться на первое место в выдаче по любому запросу? Но все-таки что-то надо говорить и из обтекаемых формулировок можно выстраивать разные забавные предположения. Лично я не завсегдатай SEO-форумов, возможно, все это уже где-то обсуждалось — если баян, извините.

Сегалович:

Ровно в этих рамках (борьба с «глупостью») мы относительно недавно реализовали алгоритм определения запросов и ответов, которые можно трактовать двояко: и как поиск эротического и порнографического содержания, и как невинный информационный запрос. Например, запрос [девочки] может быть поиском повести Людмилы Улицкой, а вовсе не «девочек по вызову». Для человека, ищущего Улицкую, ответ с порнографией не просто нерелевантен, он «явная глупость».

Опираясь на классификаторы запросов и сайтов по порнографическому и непорнографическому содержанию, и построив соответствующие метрики, отражающие долю резко нерелевантного поведения нашей системы по «двояким» запросам, мы смогли реализовать механизм понижения в выдаче сайтов порнографического содержания.

Было бы логично, если бы Яндекс подсовывал разным посетителям разные варианты выдачи, основываясь на данных предыдущих запросов, статистики из Метрики и т.д. Не специально для каждого пользователя, а для каких-то условных групп, типа «любитель клубнички», «книжный червь» или каких-то таких. А что? Статистика по запросам есть, статистика посещенных сайтов и проведенного на них времени — то же (Метрика, различные кнопки ТИЦ, блогов и т.д.) — нарисовать схему интересов пользователя можно. И потом соотнести с какой-то своей внутренней классификацией. А вот слова о том, что ответ не подвергается модификации — это, возможно, и временно. На паре «порно/непорно» алгоритм просто обкатывается.

Если Яндекс все-таки реализует модификацию выдачи в зависимости от вычесленных предпочтений пользователя — вот будет головная боль оптимизаторам! Почистил куки, походил по сайтам с пластиковыми окнами — получи выдачи про строительство и остекление балконов, почистил куки, походил по сайтам с программным обеспечением — получи выдачу про Windows. И все в ответ на один и тот же запрос «окошки».

Сегалович:

по ряду запросов мы мониторим выдачу других поисковых машин, всех, кто хоть как-то ищет по-русски, включая все версии самого Яндекса — рабочую версию и внутренние, экспериментальные (у Яндекса много версий). И складываем все результаты в один котел. Если какой-то сайт присутствует в этом «котле», если он там имеет достаточно хорошие оценки, и при этом отсутствует в Яндексе, мы начинаем разбираться – почему

Садовский:

Чтобы было понятно, «котел» какого объема оценивается, подчеркну, что это речь идет о десятках тысяч запросов, которые мы проверяем таким образом. Мы проверяем первые 30 позиций по каждому запросу. Считайте: десятки тысяч запросов, умножить на 30 первых позиций, умножить на количество версий, — это десятки миллионов URL.

Мониторят конкурентов. Очевидно, Google, Bing и Рамблер. Наверное и Yahoo. Об остальных можно только догадываться. Составляют множество сайтов, попадающих в выдачу всех или бОльшей части конкурентов. Потом сравнивают со своими результатами. Конкретная позиция, наверное, не очень важна — главное присутствие в первых 30-ти результатах. Смотрят, какие сайты попали к ним — если различие сильное, это повод задуматься. Т.е. если после получения результатов от конкурентов оказывается, например, что 22 сайта присутствуют у всех, а у Яндекса только 5 из этих сайтов — это повод побеспокоиться.

Сразу возникает интересная идея — путь к первой странице выдачи Яндекса может лежать и через результаты выдачи его конкурентов.

Сегалович:

Так вот, практически все обращения в службу техподдержки — я думаю, в цифрах это будет более 90% — касаются именно таких сайтов из «серой зоны». Пишут грамотные аргументированные письма: «А вот смотрите, почему вы этот сайт выбросили, он качественный, контент уникальный, ссылки по теме. Объясните почему.» Цель таких писем – методом перебора уточнить безопасные границы в этой «серой зоне». Предприняли какое-то действие – смотрят результат. Если результат отрицательный, сайт попал под санкции, они пытаются получить от нас обратную связь, проанализировать причины.

Певцов:

…как показывает практика, большинство сайтов, по поводу отсутствия которых в выдаче к нам обращаюся вебмастера, создавались специально с целью обмана поисковой системы и манипуляции результатами поиска…

Садовский:

Я хочу заметить, что если мы видим, что имела место ошибка с нашей стороны, то в алгоритмы вносятся изменения, улучшающие работу системы в целом, и это касается других сайтов, которые тоже могли бы пострадать в аналогичной ситуации.

Ну все уже догадались? Жаловаться на то, что сайт выпал из индекса, хотя соответствует «техническим параметрам» — ссылки, качество контента и т.д. — не надо. Ищите другую аргументацию. Вам же не робот отвечает, человек. И он понимает, что вебмастер беспокоящийся о технической стороне вопроса — не их союзник. И еще. Удалось убедить, что «сателлит» белый и пушистый? Будьте готовы к тому, что из под санкций могут выползти и «сателлиты» конкурентов. Любите жаловаться на «сателлиты» конкурентов, присутствующие в выдаче? Будьте готовы к тому, что вместе с ними пойдут ко дну и ваши такие-же.

Певцов:

уникальность контента совсем не определяющая вещь. О ней много говорят, но более важная характеристика — не уникальность, а полезность контента [и далее по тексту]

«У вас на сайте неуникальный текст! Ужас-ужас-ужас!» — страшилка. То есть, если скопировать все подряд, санкции будут. Но умеренное разбавление своих статей статьями, взятыми из других источников, может не повлечь никаких санкций. Таким образом, если где-то в интернетах нашлась удачная статья, подходящая сайту и автор не против ее распространения, можно спокойно скопировать ее к себе или процитировать. Ссылка на оригинал, как мне кажется, в данном случае будет лишним подтверждением «добрых намерений».

Четвертая часть о воровстве контента. Авторам стОит отдавать свои статьи в RSS. Не жмотитесь, отдавайте всю статью. Роботы, сканирующие блогосферу быстрее и чаще забирают контент. Если статья у кого-то скопирована, не надо расстраиваться, страница с этим текстом не первая в выдаче. Еще не факт, что посетителя заинтересует первый сайт. 2-5 место тоже хороши. И до конца первой страницы — нормально. Кроме того, скопированная страница может придать общий тематический вес сайту, подняв его по другим, похожим, низкочастотным запросам.

Торговля и обмен ссылками яндексоидов раздражают. Но, если уж они научились находить «продажные ссылки», то зачем банить всю страницу, она может оказаться вполне нормальной, а ссылки — результатом баловства наемного вебмастера. Ну неучитывали-бы тихонько эти самые ссылки молча. Дятлы бы продолжали бы заниматься бесполезным трудом и не искали бы каких-то иных методов воздействия на поисковик.

Ну вот как-то вот так. Спасибо, что дочитали до конца. :)

Автор

Сергей Родовниченко

Родился, учился, работал и все такое. Занимаюсь поддержкой сайтов на Shop-Script, Joomla, Wordpress, Prestashop. А также на самописных движках на базе CakePHP.

One thought on “Попробуем почитать между строк”

  1. Подозреваю, что Google уже работает по такому принципу — отдай пользователю то, что часто ищет, с учетом его страны.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *