Вылепливая PageRank
Этот пост является переводом статьи Мэта Катса (Matt Cutts) PageRank sculpting, выполненный в рамках акции 50 лучших SEO-постов 2009 года. Оригинал статьи появился 15 июня 2009 года и в свое время получил достаточно широкую огласку в интернете. Тем не менее, интереснее прочитать об этом из “первых рук”.
Разные люди понимают PageRank по разному. Одни сравнивают PageRank с моделью “случайного интернет-пользователя”, в которой PageRank — это вероятность, с которой случайный интернет-пользователь кликает по ссылкам на странице. Другие люди представляют Web как матрицу ссылок, в которой значение в позиции (i,j) показывает наличие ссылок со страницы i на страницу j. В этом случае PageRank соответствует главному собственному вектору этой нормализованной матрицы ссылок.
Предупреждение (disclaimer): даже тогда, когда я пришел в компанию в 2000 году, Гугл производил намного более сложный подсчет ссылок, чем вы могли бы полагать на основании традиционных статей о PageRank. Если вы думаете, что Гугл прекратил вводить инновации в анализе ссылок, то это ошибочное предположение. Хотя мы все еще называем это PageRank, возможность Гугла рассчитывать репутацию на основе ссылок улучшилась значительно за последние годы. В этой статье я буду использовать структуру “классического PageRank”, но имейте в виду, что это не лучшая аналогия.
Наверное, наиболее понятно представить PageRank как перетекание между документами, проходящее через исходящие ссылки. В недавней лекции на WordCamp я показал картинку из одной из первоначальных работ по PageRank:
На изображении выше документ в левом нижнем углу имеет PageRank, равный девяти пунктам и три исходящих ссылки. Результирующее перетекание PageRank по каждой исходящей ссылке в результате будет 9 / 3 = 3 пункта.
Однако, эта упрощенная модель не работает идеально. Представим, что имеется петля:
Ни одна капля PageRank не покинет этой петли, в то время как входящий PageRank продолжает втекать в петлю, что очевидно приведет к тому, что PageRank достигнет бесконечности. Бесконечный PageRank не очень полезен :-), поэтому Лари и Сергей ввели коэффициент ослабления, который приводит к тому, что 10-15% PageRank на любой странице исчезает прежде, чем PageRank перетечет через исходящие ссылки. В модели случайного интернет-пользователя этот ослабляющий коэффициент представлен ситуацией, когда случайному интернет-пользователю стало скучно и он решил уйти на совершенно другую страницу.
Теперь давайте поговорим об атрибуте rel=nofollow. Nofollow — это способ (введенный в 2005 году и поддержанный многими поисковыми системами) отметить ссылку для поисковых систем: “я не могу или не хочу голосовать за эту ссылку”. Для Гугла nofollow ссылки не передают PageRank и не передают якорный текст (*).
Давайте теперь разберемся, что происходит в случае, если у нас есть страница с десятью пунктами PageRank и десятью исходящими ссылками, причем пять из этих ссылок имеют атрибут nofollow. Для простоты не будет рассматривать ослабляющий коэффициент, сосредоточившись на ключевой части вопроса. Первоначально пять ссылок без nofollow передавали по два пункта PageRank каждая (по существу, ссылки с nofollow не учитывались при делении пунктов PageRank между исходящими ссылками). Более года назад Гугл изменил передачу PageRank так, что пять ссылок без nofollow передадут по одному пункту PageRank каждая.
Вопрос. Почему Гугл изменил то, как он учитывает эти ссылки?
Ответ. Одна из причин связана с тем, что владельцы некоторых сайтов пытались изменить то, как передается PageRank внутри их сайтов, исключая в результате разделы сайта с качественной информацией (например, форумы).
Вопрос. Означает ли это, что “вылепливание PageRank“ (попытка с помощью nofollow изменить то, как PageRank передается внутри вашего сайта) — это плохая идея?
Ответ. Я не рекомендую делать это, т.к. это не самый эффективный способ использовать ваш PageRank. Вообще, лучше позволить PageRank свободно перетекать внутри вашего сайта. Идея “вылепливания PageRank” всегда будет второ- или третье-степенной рекомендацией для нас. В качестве первостепенных вещей я рекомендую обратить внимание на 1) создание качественного контента, который будет притягивать к вам ссылки и 2) выбор архитектуры сайта, которая сделает ваш сайт дружественным для людей и поисковых роботов.
Например, намного важнее сделать так, чтобы люди (и роботы) могли попасть на страницы вашего сайта, нажимая на ссылки, чем заниматься перераспределением PageRank. В случае интернет магазина примером хорошей архитектуры будет размещение товаров в центре внимания посетителей, а не закапывание их в глубину сайта так, что посетителям и поисковым системам необходимо пройти по множеству ссылок, чтобы добраться до ваших продуктов.
Имеется очень небольшое количество страниц (такие, как ссылки на корзину покупок или на страницу входа), которым бы я мог добавить атрибут nofollow, просто потому, что они различны для каждого пользователя и они бесполезны для поисковых систем. Но в общем случае я не рекомендую заниматься перераспределением PageRank.
Вопрос. Почему вы это рассказали сейчас?
Ответ. По нескольким причинам. Во-первых, мы считали, что владельцы сайтов или люди, проводящие тесты, заметят, но они не заметили. Оглядываясь назад, мы изменяли другие, более весомые подходы того, как мы рассматриваем ссылки и люди не замечали эти изменения тоже. Так что, наверное, это не было таким сюрпризом. Поэтому мы стали предоставлять другие руководства, в которых говорилось, что перераспределение PageRank является не лучшим использованием времени. Когда мы добавили страницу помощи в нашу документацию о nofollow, мы сказали: “правильная информационная архитектура – интуитивно понятная навигация, удобные для пользователей и поисковых систем URL и т. д. – обеспечивает намного более продуктивное использование ресурсов, чем концентрация на управлении индексацией с помощью nofollow ссылок”. В недавнем webmaster video я сказал: “лучшая и более эффективная форма формирования PageRank — это, например, выбор того, на что ссылаться с вашей главной страницы”. На Google I/O, в течение сессии обзора сайтов я сказал это даже более явно: “Мой короткий ответ — нет. В общем случае, на что бы вы не ссылались внутри вашего сайта, не используйте nofollow. Просто возьмите и поставьте ссылки на все, что вам надо”. Но на SMX Advanced 2009 кто-то спросил прямо и это оказалось хорошей возможностью прояснить этот момент. Хочу сказать еще раз, что это не то, о чем большинство владельцев сайтов должны знать или беспокоиться, но я хотел рассказать про это сеошникам.
Вопрос. Если у меня есть блог и я добавляю nofollow атрибут к ссылкам, оставляемым комментаторами, значит ли это, что меньше PageRank перетекает внутри моего сайта?
Ответ. Если вы подумаете, то PageRank работал точно так же еще до появления атрибута nofollow.
Вопрос. Хорошо, но не поощряет ли это меня ссылаться меньше? Может стоит выключить комментарии на моем блоге?
Ответ. Я не рекомендую закрывать комментарии на блоге, пытаясь “накопить” PageRank. Так же как Гугл меньше доверяет тем сайтам, которые ссылаются на спамные или плохие ресурсы, некоторые из наших систем поощряют ссылки на хорошие сайты.
Вопрос. Если Гугл изменил свои алгоритмы для учета исходящих ссылок на странице один раз, может ли это произойти снова? Мне нравится идея формирования внутреннего PageRank.
Ответ. Хотя мы не можем сказать, что ничего не изменится в наших алгоритмах, мы не ожидаем, что эти моменты изменятся снова. Если это произойдет, то я постараюсь сообщить вам об этом.
Вопрос. Как вы используте nofollow для внутренних ссылок на вашем персональном сайте?
Ответ. Я просто позволяю PageRank перетекать свободно везде на моем сайте и я рекомендую вам делать то же самое. Я не добавляю nofollow для страниц категорий или архивов. Единственное место, куда я умышленно добавил nofollow — это ссылка на мой фид, т.к. не очень полезно иметь RSS/Atom фид в результатах выдачи. Но даже это не является необходимым, т.к. Гугл и другие поисковые системы умеют хорошо разделять фид от обычных веб страниц.
(*) Nofollow ссылки определенно не передают PageRank. За несколько лет я был свидетелем небольшого количества случаев, когда nofollow ссылка передавала якорный текст, но это происходило в результате багов, которые мы затем исправили. Основная вещь, которую вы должны знать — это то, что nofollow ссылки не помогают сайтам ранжироваться выше в результатах поиска Гугл.