Интервью с Мэттом Каттсом

Не так давно Мэтт Каттс заглянул к знакомым из Сеомоза и между ними состоялся занимательный диалог. Сотрудники сеомоза не растерялись и запечатлели весь разговор на камеру, а готовый ролик опубликовали на своем блоге, предварительно наделив его понятной аннотацией в форме «вопрос-ответ». Ниже мы предлагаем вам свою версию этого поста, в которую включено все самое главное.

Интервью с Мэттом Каттсом

Имеет ли смысл вебмастерам использовать HTTP-заголовки If-Modified-Since?

HTTP-заголовки If-Modified-Since дают возможность собственноручно оповестить Гугл менялось ли вами наполнение страницы либо нет. Как сказал Мэтт, поддержка опции была запущена в 2003 году, когда проблема малой ширины каналов особенно обострилась. В наши дни роль HTTP-заголовков существенно спало на нет. Мэтт же, как и ранее, уверен, что их использование является достаточно полезным, однако уточняет, что оно не обязательно повлечет за собой более ускоренный краулинг вашего ресурса.

Возникает ли необходимость отдавать статус-код 503 в случае даунтайма

С помощью статус-кода 503 можно обойти нежелательное индексирование тех страниц, которые в настоящий период времени некорректно работают либо пребывают на этапе восстановления. Индексация подобного рода документов может повлечь за собой массу негативных последствий, что особенно актуально в случае больших и хорошо раскрученных сайтов (Рэнд ставит в пример сайт Диснея). Дабы оградить себя от такого рода неприятностей, Мэтт рекомендует пользоваться кодом 503. У вас нет возможности задать Гуглу требуемое время повторного краулинга, но все же поисковый бот рано или поздно к этому вернется и не проиндексирует страницу до того момента, пока она не будет подходить для этого.

Имеет ли значение количество исходящих ссылок для PageRank?

Предположим, что вы решили максимально уменьшить потери ссылочного веса и/или расставаться с весом как можно более минимальными потерями. Есть ли какие-либо различия между двумя и тремя исходящими ссылками, находящимися на странице? В базовой формуле расчета PageRank эта разница бы ощущалась – в ней теряемый вес был эквивалентен сквозному PR (Passable PR), деленному на число исходящих ссылок. Но в настоящее время для подсчетов PR практикуются на порядок более сложные технологии, состоящие из многочисленных ухищренных циклов и итераций. Мэтт уверен, в реальности эти различия намного слабее, чем считается. Специалисты говорят, что старания запереть всю ссылочную массу на одной странице не совсем разумное решение. Стоит сказать, что добавление внешних ссылок, в некоторых случаях, оставит вас в выигрыше.

Поисковые боты Гугла распознают триллион адресов. Какие же страницы ими быстрее распознаются?

Так как краулеры перемещаются в зависимости от приоритета PageRank, то они, прежде всего, оказываются на лучших страницах и обходят стороной большую часть малоценного мусора. Единственная сложность на этом этапе – обход неуникального и, естественно, забаненного контента. Со слов Мэтта, порядка 28% всего отобранного из сети материала является неуникальным. Ко всему прочему, Мэтт дал четкое определение качественному и популярному контенту, а также заявил, что трафик, по сути, не является основополагающим фактором ранжирования: «PR не представляет собой какой-либо ориентир популярности, к примеру, по тому, что порно пользуется огромной популярностью, но никто на него не ставит ссылки. PR сайтов порно характера намного меньше того уровня, который бы должен быть, опираясь на фактическую популярность этих ресурсов».

Какова важность закрывающего знака / в конце url-адресов?

Не существенно, но все же: тип какого адреса вами используется: url.com/folder или url.com/folder/? Мэтт более, чем уверен, что в конце необходимо закрывать адрес слешем. Хотя бы потому, что слеш гарантирует, что перед нами ссылка на папку, а не на документ. Однако не смотря на все Гугл и сам отлично ориентируется в различии, поэтому этот нюанс можно считать не столь важным.

Краулит ли Гугл из различных географических положений?

Имеет ли мне смысл, основываясь на IP передавать юзеру специфический контент, ориентированный на определенную географическую точку? Данный вопрос особенно важен для лиц, отвечающих за крупные ресурсы с многонациональным контингентом пользователей. Что же будет видеть Гугл, если вы представляете пользователям географически ориентированный контент и как это повлияет на ранжирование?

Мэтт не отказывается от утверждения, что Гугл ведет сбор данных по всему миру с одного IP-адреса. Все дело в том, что его индекс является одинаковым для всех стран мира, так как компания не подбирает индивидуальный индекс для каждого государства в отдельности.

Основываясь на этом можно сказать, что необходимо избегать ситуаций, когда разным странам показывается очень сильно различающийся контент. Со слов Мэтта, основная загвоздка заключается в том, что при показе различного текстового контента различным категориям пользователей (например, англоязычный контент для юзеров с английским IP –адресом), бот Гугла не сможет этого увидеть.

Последовательности редиректов (например 301–>301–>301) это не очень хорошо?

Так и есть. Как утверждает Мэтт, у Гугла есть возможность качественно обработать не более двух редиректов. Последовательность, состоящая из трех редиректов – это уже слишком и, наиболее вероятно, что бот на этом остановится. Ко всему прочему Мэтт заметил, что 302-е редиректы обязаны применяться исключительно для временного перенаправления. Хотя, это вы, скорее всего, знаете и без его подсказок.

http://www.seomoz.org/blog/whiteboard-interview-googles-matt-cutts-on-redirects-trust-more