Декодирование реферальной строки Google
"Перед тем, как перейти к детальному изучению реферальной строки Google, примерам, и осознанию того, откуда идет ваш трафик, я хочу столкнуть вас с проблемой" - рассказывает Tim Resnik.

В 2011 году, Тим Резник и Мэтью Браун открыли агентство помощи новостным публикациям с техническим SEO и расширением аудитории.

Мэтью работал над New York Times, где мы и почувствовали недостаток данных по поисковым рефералам.

Наша аналитическая платформа принимала переход со страницы выдачи поисковика, переход по ссылке на стороннем ресурсе, и переход со страницы выдачи изображений, за органический поисковый трафик.

Затем появился "Безопасный Поиск Google", и реферальные данные стали еще более скрытыми. Из-за этого мы не только не могли определять вертикальный поиск, но даже не знали ключевого слова более чем в 10% запросов.

Главный вопрос, который никак не покидал нас звучал примерно так – как мы можем помочь своим клиентам в контент-стратегии, если мы даже не знаем, почему они получают поисковый трафик?

К сожалению, "Безопасный поиск" значительно расширил свои границы, и теперь большинство трафика Google остается в тени. В качестве доказательства возьмем недавнюю статистику по поисковым запросам SEOmoz:

190% увеличение за 18 месяцев! Вы что шутите?

Мы с Мэтью знали, что для восстановления потерянных данных нам нужны другие источники. Благодаря тому, что Мэтт немного знает испанский, он наткнулся на блог, автор которого обнаружил, что параметр "ved' в реферальной строке обладает некими удивительными свойствами.

Мы произвели несколько поисковых запросов, проанализировали значения "href", и наткнулись на кое-что.

Мы немедленно настроили фильтры в Google Analytics для извлечения этих параметров из реферальных данных одного сайта, который в сутки получает больше 300 000 посетителей.

Спустя несколько часов мы собрали достаточно данных, чтобы начать проверять наши теории и теории автора того блога. О всем этом по порядку далее.

Для начала давайте разъясним, где мы можем найти данный параметр.

Для начала давайте разъясним, где мы можем найти данный параметр

Все просто, реферальная строка Google – это значения "href", приписанные к каждому URL в списке поисковой выдачи.

Когда на примере выше пользователь кликает по ссылке, то вначале он проходит через URL Google, а затем попадает на конечное направление, в этом случае – Radiohead.com.

Делает это Google в целях генерации своих внутренних данных для строения поисковой выдачи.

Работать мы будем с двумя параметрами: "cd" и "ved".

О параметре "cd" мы говорили раньше, поэтому лишь напомню, что он говорит нам о позиции поискового результата в списке.

Параметр "ved" делится на три части и говорит нам о том, к какой вертикали относится результат, какова позиция в этой вертикали (относительное положение), и позицию между поисковыми результатами (абсолютное позиционирование).

Говорить мы будем об универсальном поиске и проследим относительное и абсолютное позиционирование.

Говорить мы будем об универсальном поиске и проследим относительное и абсолютное позиционирование

Давайте взглянем на несколько примеров.
Когда QFj находится в параметре "ved", то это означает, что производится стандартный поиск в Интернете:

производится стандартный поиск в Интернете

Специальную вариацию параметра "ved" заметил один из посетителей Mozinar:

Специальную вариацию параметра ved заметил один из посетителей Mozinar

Также, запрос "baseball" содержит странный код "DEBY".

Он есть у многих запросов, однако затем он переключается на "EEBY". Довольно интересно.

Выглядит, как будто он обрабатывается "графом знаний" (сеть знаний Google). News OneBox также испытывает смену DEBY на EEBY в поисковой выдаче.

Именно об этом я думал, и хотел завести дискуссию. Сейчас стараюсь детально изучить этот момент. Действительно интересно.

Да, достаточно важно знать, что Google старается размещать свой контент выше в поисковой выдаче, чем ваш, не так ли?

Когда появляется QqQIw (i, а не L), то это означает универсальный результат для новостного блока Google (News OneBox).

Когда появляется QqQIw (i, а не L), то это означает универсальный результат для новостного блока Google News OneBox

Когда присутствует QpwI, тогда это означает то, что у результата присутствовала миниатюра изображения

Когда присутствует QpwI, тогда это означает то, что у результата присутствовала миниатюра изображения

Думаю, суть вы уловили. Ниже представлены некоторые другие значения "ved". Я понимаю, что их гораздо больше, и поэтому хотел бы, чтобы вы делились своими наблюдениями:

Примеры кодов, найденных в ходе исследования

Настройка фильтров Google Analytics

Теперь вы должны хорошо представлять всю силу такой информации.

Упомянул ли я то, что эта информация доступна, даже если ключевое слово скрыто?

Интерпретировать ключевое слово мы можем путем сравнения параметра "ved".

Хотя в безопасном поиске параметр "ved" присутствует примерно в 50% запросов, его можно найти в GA. Если бы хоть кто-то смог пролить на это свет, то остальное сообщество засыпало бы его своими лайками!

Шаг 1: настройка фильтра профиля

Зайдите в панель управления и выберите "Новый профиль". Я не рекомендовал бы устанавливать этот фильтр на существующий профиль, так как он может переписать некоторые данные. Мой называется "Universal Search".

Затем вам следует установить два продвинутых фильтра: первый для извлечения "ved" и "cd" из реферальной строки Google, а второй для вывода данных в Google Analytics.

Настройка фильтров Google Analytics

Настройка фильтров Google Analytics

Вот выражения, которые я использовал:

  • Field A (\?|&)(ved)=([^&]*)
  • Field B (\?|&)(cd)=([^&]*)

Универсальный вывод

Сделать это можно разными способами. Я решил переписать значения в настройках кампании по отслеживанию моего ресурса.

Универсальный вывод

Фильтры работают тогда, когда поступают данные, они не будут переписывать собранную ранее информацию.

Ничего страшного, подождите день или два, и начинайте копаться в информации. Вот как все должно выглядеть:

Универсальный вывод

Шаг 2: Настройка продвинутого сегментирования

Лично я предпочитают делать это в Excel, однако продвинутые сегменты можно создать и в GA, где они также выглядят довольно неплохо. Я лишь покажу пример того, как это можно сделать в GA.

Настройка продвинутого сегментирования

Продвинутый сегмент следует называть при помощи ключа, который даст вам понять то, какую вертикаль вы исследуете.

В этом случае я назвал сегмент: "blue link" (голубая ссылка) в новостном блоке Google (News OneBox).

Теперь вам нужно найти значения QqQIw в параметре "ved", что и означает переход по ссылке из новостного блока в выдаче.

Пример того, что вы должны увидеть:

Пример того, что вы должны увидеть

Ничего себе! Перед мной находится полезный результат.

Наверно нужно оптимизировать изображение. Google уважает новостные ресурсы, но не все из них создают качественные изображения.

"ved" полезен для изучения быстрых ссылок сайта в поисковой выдаче. Быстрые ссылки – это набор ссылок, которые появляются в поисковой выдаче рядом с главными ссылками сайта.

Google алгоритмически определяет какие ссылки включать в выдачу, а какие нет, однако вебмастера могут управлять их порядком в панели вебмастера.

Параметр "ved" поможет вам определить эффективность каждой ссылки, согласно которой вы потом можете упорядочить их. Вот что мы получили в фильтре:

Вот что мы получили в фильтре

Значения "cd" в быстрых ссылках означают следующее:

Значения cd в быстрых ссылках означают следующее

Подобные данные очень ценны и полезны в SEO:

  • Расчет коэффициента возврата инвестиций и распределение ресурсов по различным SEO-задачам: новостная, брендовая и семантическая разметка, разметка изображений. Маркетологи ценны тем, что могут все высчитать. Главная проблема SEO – способность демонстрировать результаты. Это не решает проблемы, однако открывает способы сделать это.
  • Оптимизация быстрых ссылок: как я уже говорил выше, есть определенная ценность в знании того, какие быстрые ссылки приносят вам трафик. Кроме этого, если вы видите значение xxxxQjB в параметре "ved", значит пользователь пришел к вам по брендовому запросу.
  • Оптимизация изображений для Google News: самая верхняя ссылка в новостной выдаче Google обычно отличается от той, которая загружает картинку предпросмотра. Если ved = xxxxQqQIw ÷ ved = xxxxQpwI, тогда это означает, что существуют проблемы с оптимизацией изображения.
  • Оптимизация эскиза видео: изображения видео, которые являются ссылками, обычно хранятся на той же самой ссылке. Маркетологи могут использовать похожее выражение для анализа CTR и внутренней оптимизации страницы, когда ved = xxxxQuAIw.
  • Анализ эффективности семантической разметки: вопрос возможности парсинга и понимания параметров "ved" встал особо остро с появлением в поисковой выдачи расширенных сниппетов и элементов сети знаний Google. Пока я рассматривал только расширенные сниппеты, однако ‘ved’ предполагает и то, какой тип события предшествовал клику по сниппету. Вот несколько примеров:


Разметка событий: ved = xxxBE0MGM

Разметка событий: ved = xxxBE0MGM

Разметка музыкальных композиций: ved = xxxQ6hEw

Разметка музыкальных композиций: ved = xxxQ6hEw

  • Анализ поисковой выдачи: если вы можете прочесть поисковую выдачу Google, значит вы можете увидеть все параметры "ved" и их вертикали. "href" лежит внутри Java Script, поэтому самый простой прочесть код – использовать браузер подобный PhantomJS.

Пока все. В ближайшие месяцы Moz продолжит собирать реферальные данные по самым разным запросам.

Мы подготовим данные, выберем самые полезные находки и вновь покажем вам. Делитесь своими мыслями и наблюдениями в комментариях.

Источник: Decoding Google's Referral String (or, how I surviVED Secure Search)
Перевод: SEOM.info