Фильтрация ссылок и ошибки сателлитщиков

В очередной раз удивляюсь тому как делают сателлиты для продажи ссылок, специально снял скрин с проекта - который был для меня "контрольным в голову" по одному из показателей, так или иначе оцениваемых при покупке ссылок.

До сего момента рекордом количества внутренних ссылок на странице для меня была цифра в 1500, но то что я недавно увидел - ввело в ступор :)

Запредельное количество внутренних ссылок на странице

Это просто за гранью добра и зла. Зачем делать такие страниц на сателлите? Вы ведь автоматически подставляете свои сайты под фильтрацию по одному из параметров, а параметров достаточно много.

Или это неспособность загнать проект в индекс без применения таких "портянок"?

Кстати, далеко не всегда это видимые ссылки, страница может выглядеть просто идеально, до того как будет просмотрен html-код.

Конечно отдельная тема - это фильтрация доноров по контенту. Здесь есть много тонкостей, но на данный момент фильтр уже настроен так, что с достоверностью в 90% определяет не нужного донора.

Например зафильтровать определенный метод уникализации контента - проще простого, а раньше было несколько сложнее.

Фильтрация определенного метода уникализации текста

Мы видим простые 2 буквы "вi" (в фильтре таких сочетаний больше), которые очень четко дают понять, что использован метод уникализации контента на сателлите который Вы видите ниже.

Уникализация контента сайта

Раньше чуть труднее его было отлавливать, но сейчас уже в легкую. Существует несколько таких методов уникализации контента на сателлитах, все они более или менее схожи и Вам не составит труда зафильтровать эти проекты, чтобы не покупать на них ссылки.

Чуть сложнее дело обстоит с адалт-словариком и специфическими выражениями. Вы ведь не хотите, чтобы на страницах содержащих какую любо "не корректную информацию" располагались ссылки на Ваши проекты и проекты Ваших заказчиков?

Фильтрация сайтов содержащих информацию или ссылки на сомнительные проекты

После включения фильтра - все страницы содержащие "стоп-слова" помечаются, но есть несколько тонкостей, которые не дают возможность настроить фильтр на 100% работу.

Допустим мы видим отметку о том, что страница содержит ключевое стоп-слово "порно". Сразу отмечаем и снимаем ссылку? А не все так просто.

Вот пример того, что может попасть под этот фильтр.

Фильтрация ссылок по стоп-слову порно

Совершенно безобидное слово "бесспорно" на странице дает повод для отметки этого сайта.

Фильтрация ссылок по стоп-словам на примере порно

Аналогичная ситуация может произойти и со словосочетанием "запорной арматуре".

Так что со стоп-словами не все так однозначно. Причем под фильтрацию вебмастера может попасть страница даже не содержащая стоп-слов. Система построена так, что проверяется вся страница, а значит посмотрим еще 1 пример.

Фильтрация ссылок по стоп словам на примере cialis

Вроде бы все хорошо - мы нашли на странице стоп-слово "cialis", а значит можем снять ссылку. Но проверка страницы не дает результата - слова такого в тексте нет. Открываем код страницы и видим то, что было отмечено.

Стоп слово в названии категории сайта

Это всего-лишь название категории на сайте, а уже ссылка помечена :)

Также бывает так, что ключевое стоп-слово не найдено на странице, но умелые сателлитостроители как-то умудряются спарсить и засунуть его в другие элементы кода страницы.

Наличие стоп слова в тайтле ссылки

Для тех кто покупает ссылки

Покупаете ссылки - будьте внимательнее при фильтрации, ведь существует огромная масса исключений, здесь я привел лишь несколько из них.

Для тех про продает ссылки и делает сателлиты

Делаете сателлиты - будьте внимательнее, не жадничайте и делайте "разумное" количество внутренних ссылок на странице, а также внешних.

Что касается контента - то хотя бы на автомате обрабатывайте его на наличие стоп-слов и исключайте их - вы теряете прибыль.

Этапов отсева ссылок достаточно много, но даже на примитивном уровне отсева уже теряется заметное количество площадок.

Каждый день предлагается купить 2-3 тысячи ссылок, после самых примитивных методов отсева остается 150-300 ссылок, которые еще даже не проверялись на индексацию! В результате покупается 5-8% от предложенных ссылок.