Предлагаем вашему вниманию статью Рэнда Фишкина (Rand Fishkin), одного из создателей SEOMoz и признанного СЕО-эксперта. Рэнд объясняет, почему Google по-разному оценивает ссылки.

В 1997 году основатели Google создали алгоритм для оценки популярности и авторитетности (важности) сайтов. Метод базировался на следующих принципах:

 

-ссылки в сети могут быть интерпретированы как голоса в пользу сайта-акцептора;

-первоначально все голоса считаются равными;

-чем больше голосов получает страница в ходе выполнения алгоритма, тем более авторитетной она становится;

-чем авторитетней страница, тем авторитетней её голос;

-голоса, которые может отдать страница, являются функцией важности страницы, разделённой на количество голосов/ссылок, которые она отдаёт.

 

Метод получил название “алгоритм ранжирования” (PageRank). Уже тогда Google начал масштабную работу по улучшению качества и релевантности поиска. PageRank стал настоящим прорывом в этом направлении.

Алгоритм быстро распространялся. Сеошники начали активно использовать его для продвижения сайтов.

Google продолжал анализировать ссылки/ работать над качеством ссылок и улучшать алгоритм. При расчёте ценности/веса ссылки PageRank стал учитывать такие факторы как анкор, доверие, хабы, полномочия и даже человеческое поведение. К сожалению, некоторые сеошники до сих пор не осознают, как эти изменения влияют на маркетинг и методы сбора ссылок.

 

В этой статье я хочу рассказать о 10 принципах оценки поисковой ценности ссылок. Отдельное спасибо Биллу Славски (Bill Slawsky) из SEO By the Sea. Его отличные статьи “Reasonable Surfer Mode” и “What Makes a Good Seed Site for Search Engine Web Crawls?”, недавно опубликованные в Google, вдохновили меня на написание этого поста.

 

Ссылка на SEO By the Sea — http://www.seobythesea.com/;

статья “Reasonable Surfer Mode” — http://www.seobythesea.com/2010/05/googles-reasonable-surfer-how-the-value-of-a-link-may-differ-based-upon-link-and-document-features-and-user-data/;

статья “What Makes a Good Seed Site for Search Engine Web Crawls?” — http://www.seobythesea.com/?p=3790.

 

 

Мои 10 принципов ни в коем случае не являются аксиомами. Я создал их на основе собственных наблюдений, экспериментов и опыта. Т.е. мои 10 принципов, как и многие вещи в СЕО, — это всего лишь мнение. Поэтому я предлагаю вам не принимать их на веру, а проверить самим. Ведь самая крутая вещь в СЕО — это ломать рамки и экспериментировать на неизученном поле.

 

1. Ссылка в начале HTML-кода страницы весит больше

 

“Для ключевого слова “fuzquatziik” сайт А занимает позицию выше, чем сайт В, а сайт В выше, чем С (остальные условия равны)”.

 

Мы много раз тестировали страницы и ссылки в контролируемой (надеюсь, именно так и было) веб-среде. И каждый раз убеждались, что ссылки в начале кода HTML весят больше. Это согласуется с недавней заявкой Google на патент Ranking Documents Based on User Behavior and/or Feature Data (Ранжирование сайтов на основе поведения пользователей и/или функциональных данных).

 

С текстом заявки можно ознакомиться здесь http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&r=1&p=1&f=G&l=50&d=PTXT&S1=7,716,225.PN.&OS=pn/7,716,225&RS=PN/7,716,225

 

 

Высокий ранг ссылки ценится больше, чем остальные факторы.

Сотни тестов доказали, что ссылки с ключевыми словами в начале заголовка имеют лучшее ранжирование. Т.е. ссылка В должна “обогнать “ ссылку А. В данном случае, благодаря принципу “выше ссылка — больше вес”, хуже оптимизированная ссылка А “побеждает” В”.

 

С принципом “выше ссылка — больше вес” довольно сложно бороться. Иногда это требует высокой оптимизации всей страницы.

 

2. Внешние ссылки имеют большее влияние, чем внутренние

 


Внешние ссылки ценнее внутренних

Для поисковых систем то, что говорят о вас другие, важнее, чем то, что вы говорите о себе сами. Внешние ссылки ценнее, чем внутренние. Первоначальный PR-алгоритм, возможно, оценивал эти ссылки одинаково. Теперь дела обстоят совершенно иначе”.
В принципе, здесь нет ничего удивительного. Но если вы помните, в оригинальной концепции Google не говорится о том, что внешние ссылки отличаются от внутренних. Я думаю, “виноваты” метрики, созданные после 1997 года. Они действительно придают большее значение внешним ссылкам.

На рисунке ниже я отобразил ранжирование моего поста “The Science of Ranking Correlations: How Does PageRank Perform?”, опубликованного 3 недели назад. Хорошо видно, что внешний PageRank (полученный с внешних страниц) выше, чем обычный:

 

 

Конечно, это не значит, Google отдельно вычисляет внешний PageRank и внутренний PageRank и по-разному использует их в общем ранжировании. Просто внешние ссылки имеют больше влияния, чем внутренние.

 

3. Ссылки с уникального домена ценятся больше, чем ссылки с доменов, уже ссылавшихся на вас

 

Чем разнообразнее домены, ссылающиеся на вас, тем лучше

Поисковые системы высоко оценивают разнообразие доменов-доноров. При равных условиях, ещё одна ссылка 1 на домен А будет иметь меньшую ценность, чем единственная ссылка 4”.

Чем больше уникальных доменов ссылаются на вас, тем выше ранжирование. Ссылки с одного и того же домена имеют меньше веса, чем ссылки с разных ресурсов. Google ценит разнообразие. Лучше иметь 50 ссылок с разных сайтов, чем 500 с одного.

Любопытно, что, опять же, оригинальная концепция Google ни о чём таком не упоминает. Поэтому на заре веб-поиска хорошо работали ссылки с разных страниц одного и того же сайта с высоким PageRank. Сейчас это уже не так.

 

4. Ссылки с ресурсов, которые ближе к авторитетному источнику, ценятся больше

 

 

“Ссылки с авторитетных и надёжных ресурсов ценятся выше, чем с сомнительных или несхожих по тематике сайтов.

Этот принцип упоминается в многочисленных патентах и IR-документах. Это эффективный способ борьбы со спамом”.

 

Мы уже говорили о доверии к ссылкам на SEOMoz в посте “Domain Trust and Authority”.

Почитать статью в англоязычном варианте можно здесь http://moz.com/blog/whiteboard-friday-domain-trust-authority

В статье мы использовали данные исследования Yahoo “Combating Webspam with TrustRank”.

исследование в PDF-формате доступно по ссылке http://www.vldb.org/conf/2004/RS15P3.PDF

 

Чем выше доверие к сайту-донору, тем ценнее ссылка.

 

Автор рекомендует прочесть полный текст заявки на патент Google (доступен по ссылке http://appft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.html&r=1&p=1&f=G&l=50&d=PG01&S1=20100114858.PGNR.&OS=dn/20100114858&RS=DN/20100114858) и статью Билла Славски “Google Trust Rank Patent Granted” (англоязычный текст статьи здесь http://www.seobythesea.com/2009/10/google-trust-rank-patent-granted/).

 

5. Ссылки, которые находятся непосредственно в “теле” уникального контента, ценятся выше, чем ссылки с панели навигации, “подвала” или меню

 

7

 
Ссылки непосредственно из тела контента ценятся выше, чем периферийные.

Поисковые системы годами анализировали веб-страницы с помощью деления на блоки, сегменты и другие элементы. Мы пришли к тому, что ссылки, которые размещены в блоках контента, имеют большую ценность, чем ссылки в служебных блоках”.

 

Автор ссылается на Microsoft’s VIPS (Vision Based Page Segmentation) и Google’s Document Ranking Based — документы, посвящённые принципам ранжирования. Также он рекомендует прочесть статью Билла Славски “ Reasonable Surfer”.

 

Документы в англоязычной версии доступны по ссылкам:

Microsoft’s VIPS — http://research.microsoft.com/apps/pubs/default.aspx?id=70027;

Google’s Document Ranking Based — http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&r=1&p=1&f=G&l=50&d=PTXT&S1=7,716,216.PN.&OS=pn/7,716,216&RS=PN/7,716,216;

“ Reasonable Surfer” — http://www.seobythesea.com/2010/05/googles-reasonable-surfer-how-the-value-of-a-link-may-differ-based-upon-link-and-document-features-and-user-data/

 

Все эти документы утверждают, что спамные и манипулятивные ссылки чаще размещают в “подвале” сайта или в меню навигации. Как сеошник, я могу подтвердить этот факт. Получить ненатуральные ссылки непосредственно из контента сложнее.

 

6. Ключевые слова в HTML-тексте ценятся выше, чем в ALT — атрибутах залинкованных изображений

 

 

“Текст ссылки ценится выше, чем ALT-атрибут.

Поисковые машины обрабатывают текст внутри ALT-атрибутов залинкованных изображений так же, как анкоры ссылок. Однако ценность ALT-атрибутов ниже, чем анкоров”.
Об этом не говорится ни в одном из известных мне документов или патентов. Но тесты (мои и чужие) показали, что это так. Ссылки в HTML каким-то образом ценятся выше, чем ссылки в ALT-атрибутах залинкованных картинок.

Это не означает, что нужно уничтожить все картинки, знаки премий и ATL-атрибуты. Просто нужно осознавать данный факт. Возможно, это временное смещение.
7. Ссылки с более популярных, авторитетных и надёжных сайтов ценятся выше (даже если они находятся не на главной странице)

 

 

“Чем авторитетней домен, тем ценнее ссылка с него.

Поисковым системам сложно отличать по ценности ссылки с разных страниц популярного и авторитетного ресурса. Поэтому ссылка с непопулярной, неавторитетной страницы авторитетного ресурса имеет высокую ценность. Иными словами, поисковая система доверяет авторитету ресурса в целом, а не авторитету отдельных страниц”

 

Бывает, что сайт со скудными внешними ссылками, размещёнными на неавторитетных страницах, вдруг взлетает в ранжировании. Это можно объяснить только высоким значением домена, c которого идут внешние ссылки. И это не всегда отражается в метриках веб-страницы. Так поисковые системы борются со спамом и повышают качество поиска. Редкие ссылки с авторитетных доменов ценятся выше, чем сотни ссылок с сомнительных ресурсов.

Автор пока не смог найти патентов и документов, подтверждающих его выводы.

 

8. Ссылки в тэге No Script имеют низкую (возможно, нулевую) ценность

 

 
“Ссылки в тэге No Script имеют низкую (или нулевую) ценность.

Во-первых, эти ссылки не видны пользователям. Во-вторых, они сохраняют историю манипуляции поисковыми алгоритмами”.

 

Об этом явлении много писали, то доказывали, то опровергали. Наши тесты показали, что ссылки no script имеют нулевую ценность. Однако это не всегда так. Проверить наши выводы с помощью фильтра ссылок no script на нашем Linkscape мы не смогли, потому что в сети очень мало ссылок в этом тэге.
9. Большое количество свежих ссылок может временно (или навсегда) поднять страницу в ранжировании выше, чем страницы с лучшими показателями

 

 

“Большое количество свежих ссылок имеет высокую, почти исключительную ценность.

Предположим, веб-страница за короткое время получает большое количество свежих ссылок. Поисковик интерпретирует это как показатель, что данная страница является полезной и востребованной пользователями. Это ценнее, чем хорошая оптимизация. Ранг такой страницы выше, даже если она оптимизирована хуже остальных”

 

Во-первых, доказательством этому служит QDF-алгоритм Google. (QDF расшифровывается как “Query Deserves Freshness”, т.е. “запрос заслуживает свежего ответа”/”ответ на запрос должен быть свежим”). Google ценит недавно созданный контент с большим количеством входящих ссылок.
Подробнее об этом написано в статье “Query Deserves Freshness”, ссылка http://moz.com/blog/whiteboard-friday-query-deserves-freshness

 

Во-вторых, мне кажется, что поисковая система отслеживает временные сигналы вокруг ссылок. Таким образом она выявляет как спам, так и топовые страницы.

Google был первым, кто начал использовать временные данные (сигналы). См. патент Google “ Information Retrieval Based on Historical Data”. Но патент существует уже давно, и мне кажется, его не раз пересматривали и улучшали.
Англоязычный текст патента здесь http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.html&r=1&f=G&l=50&s1=%2220050071741%22.PGNR.&OS=DN/20050071741&RS=DN/20050071741
10. Ссылка на очевидный спам снижает ценность остальных ссылок на странице

 

 

“Спам в контенте или ссылке снижает общую ценность сайта.

Ссылки на очевидный спам (даже закрытые атрибутом no follow), вирусные ключевые слова, избыток платных ссылок снижают общую ценность ресурса и ценность его ссылок”.

 

Я был очарован экспериментами Ричарда Бэкстера, о которых тот рассказал в своей статье “Google Page Level Penalty for Comment Spam”.

 

оригинал статьи http://seogadget.com/google-page-penalty-for-comment-spam-rankings-and-traffic-drop/
Я сам не раз наблюдал, как популярные и авторитетные посты в блоге быстро теряли в ранжировании, получив спамную ссылку в комментариях. Советую веб-мастерам регулярно вычищать спамные ссылки, чтобы не ухудшить ранжирование страниц и не обесценить остальные ссылки.

 

Как насчёт классического PageRank? Я почти уверен, что пока мы тут обсуждаем все эти принципы и прочее, классическая концепция PR осталась и остаётся неизменной. Почему я так думаю? Мы собственными силами вычислили PR блога SEOmoz. И он замечательно совпадает с классическим PR от Google. По моему мнению, Google продолжает использовать классический PageRank. Многим этот алгоритм кажется не совсем обоснованным и не вполне корректным. Однако он очень полезен для практического решения сложных задач типа индексирования или ранжирования веб-страниц.