Понимание методов выявления ссылочного спама

Одним из самых разочаровывающих аспектов наращивания ссылочной массы является незнание ценности ссылки.

Опыт и некоторые данные помогут вам в оценке ссылки, но знать, насколько ссылка будет полезна вам невозможно. Практически невозможно узнать и то, помогает ли вам ссылка вообще.

Поисковики не считают все ссылки. Они понижают вес большого количества ссылок и учитывают многие другие факторы вашего ссылочного профиля при оценивании естественности. Это все делается для повышения релевантности и выявления спама.

Понимание основ определения ссылочного спама поможет вам лучше понять как оценивать ссылки и то, как поисковики подходят к проблеме спама. Все это может вылиться в разработку более продвинутых методик наращивания ссылочного профиля.

Сегодня я хотел бы поговорить о нескольких интересных концепциях анализа ссылочного спама, которые возможно используют поисковики при оценке вашего ссылочного профиля.

Отказ от ответственности:
Justin Briggs: Я не работаю на какой-либо поисковик, поэтому я не делаю конкретных выводов по тому, как поисковики оценивают ссылки. Поисковики могут использовать некоторые методики, указанные в данном посте, или не использовать их вообще.

Конечно же они используют гораздо больше методов определения спама, чем я могу описать в данном посте. В данном посте будут только самые интересные, на мой взгляд, методы определения ссылочного спама.

Усеченный PageRank

Усеченный PageRank

Усечение PR – это расчеты, которые отсекают прямой вес ссылок первого уровня. Хотя такие "наивные" методы, как продвижение статьями, и приносят продвигаемой странице PR, было бы гораздо лучше, если бы ссылки на вас ставились со страниц, на которые также ведет большое количество ссылок. Таким образом, вы получите ссылочный вес с дополнительных уровней.

Если на вас ссылается спамная страница, то вам передастся усеченный PR, который значительно меньше обычного. Соотношение усеченного PR к нормальному может стать сигналом тому, что ваш ссылочный профиль является спамным.

Собственный / Доступный вес

Все ссылки можно разделить на три большие группы:

Ссылки с любого из этих источников не могут быть ни плохими, ни хорошими. Ссылки с собственного контента являются идеально естественными. Однако ссылка с недоступного контента может быть платной, поэтому ссылки с этой группы ресурсов не всегда хорошо.

Ценность вашего ссылочного профиля может меняться в зависимости от соотношения групп сайтов, ссылающихся на вас.

Собственный/Доступный вес

Такой вид анализа двух сайтов показывает существенную разницу в ссылочном профиле, все остальные факторы одинаковы. Ссылки, ведущие на первый сайт – это ссылки с контента, который он напрямую контролирует или имеет доступ, чтобы поставить их.

Однако второй сайт имеет существенное количество ссылок с уникальных и независимых ресурсов. Все остальные параметры сайтов одинаковы, но вот второй имеет меньше шансов быть уличенным в спаме.

Относительная масса

Относительная масса

Относительная масса – это процент содержания ссылок определенного типа в ссылочном профиле. Пример ниже показывает концепцию относительной массы.

Анализ относительной массы может также помочь в определении спамности страницы. На схеме выше мы видим красные круги – это спамные страницы.

Целевая страница теперь имеет определенную порцию веса со спамных сайтов. Если соотношение таких сайтов будет велико, то ваша страница может испытать откат позиций, а вес ссылок будет снижен.

Такой тип анализа также можно отнести к методам выявления спама: определение ссылок с комментариев, каталогов, каталогов статей, взломанных ресурсов, собственных страниц, определение платных ссылок и т.д.

Подобный алгоритм может как "прощать", так и "наказывать", когда относительная масса ссылок с доступного уровня значительно превышает количество ссылок с недоступного.

Подсчет ссылающихся сайтов / Скорость появления ссылок

Еще один метод оценки ссылок – это подсчет количества "поддерживающих" вас сайтов и скорости их появления.

Подсчет ссылающихся сайтов
Данная гистограмма распределения сайтов четко демонстрирует разницу между спамными и высококачественными сайтами.

Скорость появления ссылок
Количество "поддерживающих" у хорошо связанных сайтов растет очень быстро, а вот количество спамных сайтов обычно бывает велико на первых уровнях.

Количество спамных сайтов увеличивается мгновенно и точно с такой же скоростью уменьшается, при дальнейшем углублении. Такое распределение может показать, что сайт использует спамные методы наращивания ссылочной массы.

Выявить спамные профили очень просто, ведь если вы прибегаете к продвижению при помощи спамных сетей, то все эти домены будут повторяться вновь и вновь на разных уровнях.

PRO-совет: я думаю, что разнообразие и уникальность доменов сильно связаны с ранжированием. Анализ количества поддерживающих вас сайтов и анализ усечения PR дадут вам идею о получении ссылок с как можно большего количества уникальных доменов. 

TrustRank, Анти-TrustRank, SpamRank и т.д.

Модель TrustRank описывалась уже много раз и является одной из базовых метрик наподобие mozTrust. Основной идеей тут является то, что ссылающийся на вас сайт может иметь значения как Траста, так и Спама, которые передаются через ссылки.

Чем ближе вы к этому сайту, тем у вас больше шансов получить такую же оценку, что имеет он. Чем ближе он к спамному сайту, тем у вас больше шансов попасть в разряд спамных. Чем ближе он к разряду трастовых, тем больше у вас шансов быть отнесенным к трастовому.

Я не хочу сейчас углубляться в детали, но скажу, что все сводится к 4 простым правилам:

  • Добивайтесь ссылок с трастового контента.
  • Не размещайте ссылки на спамном контенте.
  • Ссылайтесь на трастовый контент.
  • Не ссылайтесь на спамный контент.

Такой тип анализа использовался на SEO форумах против спамеров. Поисковый робот заходил на топовые SEO форумы, просматривал ссылки и создавал набор трастовых доменов.

Текстовый анкор vs. Время

Мониторинг текстовых анкоров со временем может дать интересные взгляды на то, как можно определить потенциальные манипуляции. Ниже приведен пример домена, который был куплен специально для передачи ссылочного веса (и спама).

Текстовый анкор vs. Время
У данного домена есть история текстовых анкоров, как брендовых, так и не брендовых. Как видно, старый анкор практически упал на ноль, а вместо него появилось совершенно 2 новых анкора.

Такой анализ текстовых анкоров в комбинации с подходами к определению спама могут указать на момент смены владельца домена. Ссылки, которые были у домена до этого момента смены владельца могут быть переоценены.

Пики роста ссылочного профиля

Сайты, у которых наблюдается резкий рост количества бэклинков в определенный промежуток времени, могут потерять их вес.

Поисковик может легко проверить был ли этот рост вызван реальным событием или распространением вирусного контента, или это была какая-либо ссылочная манипуляция.

Пики роста ссылочного профиля
Вес ссылок, которые появились во время пика роста (произошло отклонение от их обычного появления), может быть уменьшен. Размеренный и естественный ссылочный профиль редко пробивает свои рекордные пики роста.

Здоровый и правильный PR

"Здоровый" PR – это PR, который подсчитывается без учета доноров с высоким значением PR.

Здоровый и правильный PR
Мы можем наблюдать снижение эффекта от самых влиятельных доноров в вашем ссылочном профиле.

На изображении выше мы видим, что 2 самые сильные ссылки были отключены, а передаваемый ими PR был снижен.

Сильные сайты всегда имеют здоровые ссылочные профили, которые не нуждаются в поддержке нескольких сайтов с высоким PR. Вычисления "здорового" PR – это один из способов снижения эффекта от редких влиятельных сайтов.

Разнообразие PR

Разнообразие значений PR доноров может также быть использовано в определении спамности сайта. Естественный ссылочный профиль должен иметь ссылки со страниц с самыми разнообразными значениями PR. Ссылочные профили спамных сайтов однотипны.

Разнообразие PR

Итак, если вы используете какой-либо инструмент или биржу ссылок, чтобы купить 15 ссылок со страниц, имеющих PR 4 под определенный текстовый анкор, тогда вы значительно снижаете разнообразие PR вашего ссылочного профиля и рискуете быть уличенными в манипуляциях.

Количество ссылок с домена

Одним из способов снижения рисков попадания под фильтр поисковика за манипуляции со ссылками, является приобретения нескольких разнообразных ссылок с одного домена. Очень часто люди приобретают сквозные ссылки в блогроле или в футере. Однако такие ссылки в такого количества страниц совсем ни к чему.

Количество ссылок с домена

Первая ссылка с домена на ваш сайт всегда играет первую роль. Дополнительные ссылки с этого же домена продолжат увеличивать передаваемый вес, но только в определенное место вашего сайта, а не на весь домен.

Разные ссылки с одного домена разбавят ваш ссылочный профиль, увеличив ссылочное разнообразие на один домен. Переход с 1 ссылки на 3 с данного домена даст больший эффект, чем переход со 101 ссылки на 103.

PRO-совет: Многие тактики наращивания ссылочной массы со временем теряют свою эффективность. Для того, чтобы хорошо ранжироваться, вы не должны придерживаться какому то одному определенному набору стратегий и вы не должны забывать о разнообразии ссылок, ведущих с одного домена. Избегайте стратегии, когда вы приобретаете одну ссылку с одного домена. 

Алгоритмы выявления ссылочного спама

Все алгоритмы анализа ссылочного спама имеют свои погрешности. Используя комбинацию методов определения спама, поисковики максимизируют свою точность.

Анализ веб-спама имеет больше погрешностей, чем, скажем, определение email спама, где почта попадает либо в папку "входящие", либо в папку "спам". Поисковикам нет смысла создавать два четких определения "спам" или "не спам". Проводя анализ, поисковики просто могут понижать сайт в выдаче или повышать.

Данные методы анализа также предназначены и для определения эффективности тех или других стратегий продвижения. Целью данного поста было не указать на те ссылки которые работают или нет, а демонстративно показать проблемы тех или иных тактик наращивания ссылочной массы.

Источник: Justin Briggs - Better Understanding Link-based Spam Analysis Techniques

Перевод: SEOM.info