Глава 6. Месяц 1. Подробнее об основных концепциях веб-аналитики


Теперь, выяснив элементы, формирующие эффективную стратегию веб-аналитики от замысла до внедрения, можно готовиться к погружению в ее глубины. В этой главе описаны некоторые из основных терминов, методов и показателей, которые составляют фундамент веб-аналитики.

Такие показатели, как количество посещений, посетителей, просмотров страниц, время на сайте, самые популярные страницы и наложение данных на сайт (плотность щелчков), способно предоставить любое, даже самое незатейливое приложение веб-аналитики. Хотя их названия кажутся очевидными, не так уж и просто после анализа выработать руководящие действия. Можно потратить целый месяц, чтобы получить полное представление о не таких уж и простых концепциях, лежащих в основе этих на первый взгляд доступных элементов.

В этой главе описано, почему следует заботиться о каждой концепции, показателе и отчете, а также о том, на что необходимо обратить внимание в каждом случае. Каждый раздел содержит советы и примеры из реальной жизни, что будет полезно и новичкам, и тем, кто уже применяет это на практике.

Неделя 1: подготовка к пониманию основ

Чтобы избежать обычной ошибки перехода непосредственно к показателям, первой остановкой на пути к пониманию будет разработка надежной оценки трех основных элементов механизма сбора данных: URL, параметры URL и файлы cookie.

Основной причиной, по которой стоит начать именно с этого, а не непосредственно с показателей, является то, что необходимость измерений на веб-сайте может выдвинуть дополнительные требования к его проекту и архитектуре, которые позволят собрать данные, требующиеся для эффективных решений. Хоть это может походить и на обычное обсуждение соглашений о коде, такова реальность: время на приобретение знаний придется потратить. Все инструменты веб-анализа не слишком “разговорчивы” (GIGO[11]), и не оптимальные данные довольно быстро превращаются в не оптимальные отчеты.

Особо не беспокойтесь о своей технической подготовке. Начните с простого понимания того, почему столь важны URL и файлы cookie, а также что они могут сообщать о веб-сайте. Знание характерных особенностей и ограничений существенно поможет в работе.

URL, параметры URL и файлы cookie имеют, вероятно, наибольшее влияние на все происходящее в веб-аналитике, чем любой другой элемент данных. Они определяют существование веб-сайта, страниц, пользователей, источников, кампаний, регистрационных имен, а также множество анонимных идентификаторов, что упрощает просмотр и многое другое. Чтобы лучше продемонстрировать эти три основных элемента, рассмотрим их на примере веб-сайта New York Times (www.nytimes.com). Возьмем веб-страницу со статьей об удачной посадке космического корабля Discovery на космодроме имени Джона Ф. Кеннеди 22 декабря 2006 года в 17:32.

Понедельник и вторник: URL

Сокращение URL означает Uniform Resource Locator — унифицированный указатель информационного ресурса. Обычно он содержит идентификатор веб-сайта и адрес вебстраницы, которую запросил посетитель. В рассматриваемом примере New York Times URL будет следующим:

http://www.nytimes.com/2006/12/22/science/space/23shuttlecnd.html?hp&ex=1166850000&en=9434ee2697934581&ei=5094&partner=homepage

Первая часть URL — это домен (www.nytimes.com), вторая часть, как правило, представляет структуру каталога (/2006/12/22/science/space/), а третья — это имя файла (23shuttlecnd.html). Все последующее — это параметр (подробнее далее в этом разделе).

ГЛАВА 6. МЕСЯЦ 1. ПОДРОБНЕЕ ОБ ОСНОВНЫХ КОНЦЕПЦИЯХ... ■ 153

На что следует обратить внимание

Домен в URL важен тем, что с точки зрения приложения веб-аналитики URL идентифицирует набор данных, который обычно связан с именем домена в URL. Так, www.nytimes.com отличается от select.nytimes.com. Это могут быть два разных набора данных на основании стандартной реализации. Это также позволяет решить, как реализовать решение веб-аналитики, или применить файл cookie стороннего производителя и рассматривать эти два домена как один.

На что следует обратить внимание еще

Существует два очень важных момента, на которые следует обратить внимание прежде, чем принимать практику веб-аналитики.

Каков идентификатор веб-сайта

Это только www.nytimes.com или www.nytimes.com + select.nytimes.com + travel.nytimes.com + др? URL определит стратегию данных, сеансы клиента, стратегию файла cookie и способность получать представление (все за одного или один за всех) о данных веб-сайта. Документация структуры URL (за исключением базовых параметров) действительно важна, когда дело касается метаданных.

Что URL может сообщать о структуре сайта

При анализе данных, возможно, понадобится упорядочить показатели по разделам World (Мир), Business (Бизнес), Technology (Технологии), Sports (Спорт), Science (Наука), Health (Здоровье), Opinion (Мнение) и т.д. Задокументировав возможности URL, можно получить представление о том, достаточно ли структура URL “интеллектуальна”, чтобы помочь организовать данные. В противном случае может понадобиться передача приложению веб-аналитики специальных переменных, чтобы оно лучше понимало веб-сайт. Это означает, что исполнителю веб-анализа, разработчикам веб-сайта и членам группы веб-аналитики придется больше потрудиться, чтобы гарантировать получение корректной информации для эффективного принятия решений.

Среда: параметры URL

В рассматриваемом примере сайта New York Times все, находящееся после вопросительного знака (?), называется параметром URL (23shuttlecnd.html?hp&ex= 1166850000&en=9434ee2697934581&ei=5094&partner=homepage). По мере увеличения динамичности веб-сайтов параметры URL становились все больше (URL и имени файла было уже недостаточно для управления динамическими страницами), что усложняло процесс их отслеживания для составления отчетов и анализа.

Параметры URL используются веб-платформами для управления динамическими элементами веб-страниц (так что 23shuttlecnd.html плюс комбинация параметров может представлять порядка 50 различных версий веб-страницы без необходимости иметь 50 отдельных физических веб-страниц). Они также применяются для отслежи-

вания целей. Например, в приведенном выше URL параметр “partner” сообщает приложению веб-аналитики, что посетитель пришел на страницу статьи с домашней страницы.

На что следует обратить внимание

Через некоторое время параметры URL придется использовать для несметного количества целей. Это делает их весьма полезными (поскольку они могут быть очень продуктивными), но при этом опасными (поскольку они могут запутать данные в зависимости от того, как их анализирует приложение веб-аналитики). Неправильное определение параметров может привести к неверному подсчету страниц, что, в свою очередь, может повлиять на другие показатели.

На что следует обратить внимание еще

Рассмотрев важность параметров URL, упомянем четыре значимых фактора, которые гарантируют правильность понимания приложением веб-аналитики конкретного веб-сайта.

Документация параметров

Документируйте все параметры, используемые веб-платформой, все их действия и возможные значения.

Проконсультируйтесь в отделе информационных технологий, какие параметры делают страницу уникальной, а какие используются для отслеживания

В данном примере создается впечатление, что ни один из параметров (hp, ex, en, ei, partner) не идентифицирует страницу уникально, это делает только имя файла HTML. Вспомните пример URL сайта Best Buy из главы 5, “Основные вопросы веб-аналитики”:

http://www.bestbuy.com/site/olspage.jsp?skuId=7686998&type=product&cmp

=++&id=1134704163586

В этом случае уникальные идентификаторы страницы — olspage.jsp и skuID.

Удостоверьтесь, что платформа веб-аналитики правильно настроена на обработку каждого параметра

Приложение веб-аналитики обычно на уровне сервера имеет дополнительные функции, позволяющие указать, например, какие параметры URL делают страницу уникальной, а какие нет. Совместно с лицом, ответственным за поддержку веб-аналитики, просмотрите эти параметры и удостоверьтесь, что такие показатели, как количество просмотров страниц, отслеживание идентификаторов и т.д., записываются правильно.

Осуществляйте контроль по крайней мере один раз в месяц

Совместно с отделом информационных технологий проведите проверку текущих параметров и их использования, а также соответствующих настроек аналитического приложения, чтобы удостовериться, что при последнем выпуске сайта ничто не нарушило текущую настройку веб-аналитики. В передаче новых параметров URL для всего хоста нет ничего необычного ни для разработчиков, ни для партнеров веб-сайта.

Четверг и пятница: файлы cookie

Файлы cookie имеют скорее плохую славу, чем хорошую. С ними связано множество параноидальных представлений, особенно в области безопасности. Официальная Ассоциация веб-аналитики (Web Analytics Association — WAA) дает следующее определение файла cookie:

“Файл cookie — это сообщение, переданное веб-сервером веб-браузеру. Последний хранит его в текстовом файле. При каждом очередном запросе браузера страницы это сообщение пересылается обратно на сервер.”

Каждый раз при поступлении запроса от веб-браузера на веб-сервер последний выясняет, существуют ли у него уже файлы cookie данного сервера. Если это так, сервер их читает. Если нет, то посылает новые файлы cookie. Время от времени он может также модифицировать файлы cookie, хранимые на веб-браузере посетителя.

Как правило, но не всегда, веб-сервер устанавливает два типа файлов cookie.

Файлы cookie сеанса

Это временные файлы cookie. Они существуют только в период взаимодействия посетителя с веб-сайтом. Обычно они применяются, чтобы “сшить вместе” данные всего сеанса (например, содержать элементы корзинки покупателя, пока он находится на сайте), которые используются веб-сервером и приложением веб-аналитики, позволяя отследить поведение пользователя в ходе посещения. После завершения сеанса посетителя эти файлы cookie исчезают.

Постоянные файлы cookie

Это файлы cookie, которые устанавливаются в браузере посетителя и остаются там даже после завершения сеанса. Они существуют, пока не истечет указанный в них срок (каждый файл cookie имеет срок годности, как правило, в далеком будущем). Они содержат элементы постоянного типа, обычно анонимный уникальный идентификатор, который позволяет отследить веб-браузер (предполагается, что это тот же человек) по мере его посещения сайта в разные времена.

Когда во время написания этой книги автор посетил веб-сервер www.nytimes.com, он установил 10 файлов cookie, а именно: akaushik@nytimes.txt, akaushik@o. nytimes.txt, akaushik@sports.txt, akaushik@wt.o.nytimes.txt, akuashik@ta-coda.txt, akaushik@mediaplex.txt и akaushik@doublick.txt.

Обратите внимание, что некоторые из этих файлов cookie установлены сервером New York Times, а другие его партнерами (Tacoda, DoubleClick, Mediaplex и т.д.), которые могли бы отслеживать поведение автора на веб-сайте New York Times независимо от самой газеты Нью-Йорк Таймс. Партнеры, использующие эти файлы cookie, могут также отслеживать поведение адреса на нескольких веб-сайтах (например, если автор перейдет с nytimes.com на cnn.com).

Вот, например, что находится в файле cookie akaushik@sports.txt (файл cookie nytimes.txt отслеживает так много материала, что его описание заняло бы две страницы):

IXAIInvited528_local

true

www.nytimes.com/2006/12/22/sports/

1600

56970240

29902060

2334166336

29828634

*

А вот что находится в файле cookie akaushik@doubleclick.txt:

id

800000b24beac0d

doubleclick.net/

1024

4059552640

30048910

2279796336

29828634

*

Все представленные здесь значения интерпретируются соответствующим приложением веб-аналитики каждого веб-сайта и используются для отслеживания поведения посетителя на веб-сайте. Каждый файл cookie содержит уникальный идентификатор, который идентифицирует браузер. Когда пользователь (в данном случае автор) посещает веб-сайт, файл cookie читается, уникальный идентификатор распознается и сохраняется (он используется, например, для расчета показателя частоты повторных посещений). Файл cookie идентифицирует также источник, установивший его (doubleclick.net), а также набор специальных переменных, предназначенных для дополнительных целей. Например, файл cookie sports.txt отслеживает, когда автор посетил спортивный раздел веб-сайта газеты Нью-Йорк Таймс, позволяя настроить наиболее удобный профиль для посетителя.

Большинство файлов cookie не содержит PII, а следовательно анонимны. Это не правило, но настоятельная рекомендация.

На что следует обратить внимание

Файлы cookie значимы для создания индивидуальных сообщений посетителям вебсайта (например, “Welcome back, Avinash” на Amazon.com). Они полезны для отслеживания повторных посещений, для изоляции участников проверки, если используется проверка A/B или многопараметрическая проверка, либо для множества других целей. В веб-аналитике они могут быть применены для сбора большого количества интересной и полезной информации (обычно критически важной).

Надо быть очень умным, чтобы понять, как веб-сайт использует файлы cookie и какие данные в них хранятся. Следует также убедиться, что принятая политика безопасности лояльна к файлам cookie (собственным и сторонним), применяемым для отслеживания посетителей.

На что следует обратить внимание еще

Существует три чрезвычайно важные вещи, о которых следует позаботиться при использовании файлов cookie в контексте внедрения веб-аналитики.

Тщательно документируйте, какие именно файлы cookie устанавливаются

Следует точно знать, какие файлы cookie устанавливаются веб-сервером в течение каждого сеанса клиента и какая информация хранится в каждом из них. Пожалуйста, не забывайте тщательно документировать все файлы cookie партнеров, которые могли бы быть установлены (и что случается с ними при установке на браузере политики безопасности самого высокого уровня, т.е. когда браузер отказывает некоторым файлам cookie).

Наиболее важные файлы cookie должны быть собственными

Чтобы файлы cookie сработали при высокой защите или антишпионском программном обеспечении, это должны быть собственные файлы cookie, от первого лица, а не файлы cookie стороннего исполнителя. Это особенно важно потому, что большинство стандартных файлов cookie стороннего исполнителя веб-анализа ликвидируются антишпионским программным обеспечением. Использование сторонних файлов cookie может существенно повредить способности точно отслеживать повторные посещения или поддерживать персональные данные для веб-сайта.

Замерьте степень отказа от файлов cookie и их удаления у посетителей веб-сайта

Это поможет понять степень качества данных веб-аналитики, если речь идет о критически важных показателях. Коэффициенты удаления файлов cookie представлены на рис. 6.1.


Рис. 6.1. Коэффициенты удаления файлов cookie


Удаление файлов cookie влияет и на другие действия тоже. Например, файлы cookie, характерные для проверок A/B и многопараметрических проверок, гарантированно не должны накладываться на файлы cookie проверки версий, но если посетитель не принимает файлы cookie, он не сможет поддерживать обмен сообщениями или просмотр цен.

Задокументировав и проверив достоверность регистрации URL и параметров, а также правильность установки и чтения файлов cookie, можно гарантировать, что приложение веб-аналитики соберет точные данные, что, в свою очередь, позволит принимать оптимальные решения.

За одну короткую неделю работы были существенно улучшены возможности получить качественные данные. Поздравляю.

Неделя 2: пересмотр основополагающих показателей

Каждое путешествие в глубины веб-аналитики начинается с трех основополагающих вопросов: сколько посетителей пришло на сайт, как долго они там оставались и сколько страниц они посетили?

На эти простые вопросы может ответить любое приложение веб-аналитики. Однако замер данных по каждому из них может быть довольно непростым, причем сопряженным с собственным набором сложностей и ограничений, которые чрезвычайно важно понять и усвоить прежде, чем использовать данные. Например, не существует даже двух инструментов, которые замеряют количество посещений одинаковым способом. Для того же веб-сайта два инструмента веб-анализа дадут разные значения посещений и посетителей. Интересно знать, почему?

Давайте потратим вторую неделю на изучение таких основополагающих показателей. Это позволит лучше их понять и, соответственно, объяснить начальству и партнерам.

Понедельник: посещения и посетители

Первым вопросом по общему мнению должен стать: сколько посетителей пришло на веб-сайт? Не имеет значения, как долго он существует и как долго используются аналитические инструменты, или кто вы такой. Первой инстинктивной мыслью является вопрос о людях, посещающих веб-сайт (возможно, это связано с примитивным желанием, которое следует уважать).

Почти каждый отчет любого инструмента веб-анализа либо содержит данный показатель, либо создается на его основе. Он может быть представлен либо как исходное число, либо в форме процента, либо в числителе или знаменателе некоего показателя, либо в виде общего, усредненного значения. Кроме того что никакой стандартизации для показателя посещений нет, он зачастую маскируется под различными названиями, наиболее распространенными среди которых являются: посетители (visitors), посещения (visits), всего посетителей (total visitors), уникальные посетители (unique visitors), сеансы (sessions) и файлы cookie (cookies)! В зависимости от используемого инструмента термин “уникальный посетитель” может трактоваться совершенно по-разному.

Как упоминалось в главе 1, на заре Интернета IP-адреса использовались для идентификации браузеров (считай, клиентов), приходящих на веб-сайт. Довольно быстро в дополнение к IP стали применять идентификатор браузера, поскольку сложность увеличилась, затем установку файлов cookie и использование в них анонимных уникальных идентификаторов, чтобы идентифицировать посетителей.

Посещения

Данный показатель также упоминается как посетители, или всего посетителей. Основная задача — замерить, сколько людей зашло на веб-сайт на протяжении определенного периода времени (помните, людей нельзя отслеживать фактически, а следовательно, приходится прибегать к различным заменителям, например к значениям файла cookie). Поскольку большинство платформ веб-аналитики использует файлы cookie в начале и конце сеанса (когда посетитель приходит и уходит), напрашивается самое простое определение показателя посещений:

Посещение (visit) — это количество всех сеансов за определенный период времени. Сеансы идентифицируются временными значениями файла cookie. Когда посетитель запрашивает первую страницу, его сеанс начинается и продолжается обычно (хоть и не всегда), пока не произойдет одно из следующих событий:

1. Посетитель уходит с веб-сайта или закрывает браузер.

2. Веб-сервер автоматически завершает сеанс после 29 минут бездеятельности.

Например, пока автор писал эту главу, он посетил веб-сайт New York Times три раза, между часом и тремя часами пополудни. Вначале он оставил браузер открытым на час, а два других раза просто закрыл его.

В аналитический сеанс New York Times автор внес три посещения (visit) (если использовался инструмент ClickTracks, в который будет записано три посетителя (visitor)).

Уникальный посетитель

Показатель уникальных посетителей (Unique Visitors) наилучшим образом позволяет выявлять таковых на веб-сайте в течение определенного периода времени. Это попытка понять побуждающие причины повторных посещений клиентами и (или) количество “людей”, приходящих на веб-сайт. Данный показатель специально отслеживается с использованием постоянного файла cookie, который устанавливается на браузере посетителя и читается веб-сервером (или аналитическими дескрипторами JavaScript). Вот его самое простое определение:

Уникальные посетители (unique visitor) — это количество всех уникальных идентификаторов файлов cookie (cookie_id) за определенный период времени.

Продолжая пример с веб-сайтом New York Times: они подсчитали бы три посещения, но одного уникального посетителя с точки зрения поведения автора.

Часть “период времени” очень важна. Для посещений достаточно просто просуммировать все сеансы. Но в случае уникальных посетителей необходимо выявить и просуммировать индивидуальные значения cookie_id.

Автор, например, читает веб-сайт New York Times каждый день. Если он будет это делать ежедневно в течение недели, то показатели окажутся следующими:

• посещений: 7;

• уникальных посетителей: 1.

Если автор будет посещать веб-сайт в течение месяца, то показатели будут такими:

• посещений: 30;

• уникальных посетителей: 1.

При составлении отчетов об уникальных посетителях чрезвычайно важно удостовериться, что приложение веб-аналитики отслеживает именно реальных уникальных посетителей, поскольку у некоторых приложений параметры по умолчанию установлены так, что отчет о ежедневных посещениях автора выглядел бы следующим образом:

• посещений: 7;

• уникальных посетителей: 7.

В данном случае приложение суммирует уникальных посетителей по каждому дню и предоставляет их общее количество, накопленное в течение недели. Это не самая оптимальная методика подсчета уникальных посетителей. По требованию исполнитель должен быть способен предоставить фактическую информацию об уникальных посетителях. Пожалуйста, попросите их об этом, чтобы получать точные показатели. На рис. 6.2 отображена тенденция изменения количества уникальных посетителей в течение двух месяцев (хотелось бы надеяться, что данные здесь правильные!).

На что следует обратить внимание

О сопоставлении двух рассмотренных показателей — посещение и уникальные посетители — можно не заботиться! Они составляют фундамент всех вычислений, каждый по отдельности. Но что действительно важно, так это их правильное получение.


Рис. 6.2. Отслеживание уникальных посетителей


На что следует обратить внимание еще

Отслеживание уникальных посетителей, вероятно, наиболее общеизвестное действие, когда речь заходит о веб-показателях. Существует три весьма важные грани, о которых следует позаботиться.

Точно определите, как вычисляется каждый из двух показателей

Проконсультируйтесь с исполнителем веб-анализа, чтобы точно понять, какая формула используется для вычислений и как измеряются промежутки времени. Если формула исполнителя отличается от указанной в этом тексте, спросите, почему, и удостоверьтесь, что ответ получен удовлетворительный.

Проведите время с группой информационных технологий и исполнителем веб-анализа, чтобы понять, как в приложении осуществляется обработка сеансов

Обработка сеансов (sessionization) — это процесс получения всех запросов от посетителя веб-сайта за некий период времени (обычно одно посещение) и создание сеанса в приложении веб-аналитики. Установлена ли для сеанса продолжительность, т.е. истекает ли он после 29 минут бездеятельности? Завершается ли сеанс, если пользователь обратился к поисковой системе и вернулся через пару минут (у некоторых исполнителей да, у некоторых нет)? Это особенно важно при необходимости сопоставить данные из двух разных приложений веб-аналитики, поскольку каждый исполнитель имеет собственные уникальные установки.

Уведомьте исполнителя веб-анализа, что заинтересованы в вычислении реальных уникальных посетителей

Попросите исполнителя вычислять уникальных посетителей по дням, неделям и месяцам как минимум. Большинство производителей на это способны. Используйте полученные значения в показателе переходов или повторите вычисления посетителей, чтобы составить точное представление о поведении на сайте.

Учтите следующее:

если использовать показатель реальных уникальных посетителей для выявления привычек по чтению автора книги, то коэффициент повторных посещений за неделю составит 7 (7/1);

если использовать показатель “ложных” уникальных посетителей, то коэффициент повторных посещений за неделю составит 1 (7/7);

каждый способ предоставит совершенно разную интерпретацию поведения клиента на сайте.

Не забывайте, что уникальные посетители, о которых сообщается в отчетах, используют значения файла cookie, а следовательно, зависят от различных проблем, которые с ними связаны

Важно не только помнить об этом, но и сообщать заинтересованным лицам. Если используются файлы cookie стороннего производителя, а Internet Explorer 7 отвергает их по умолчанию, будут собраны весьма недостоверные данные, поскольку каждый запрос или посещение будет представлено новым файлом cookie. В качестве альтернативы: если используются файлы cookie стороннего производителя и антишпионская программа удаляет их каждый день, то и посетитель окажется новым и уникальным каждый день. Если посетители не принимают файлы cookie вообще (ни собственных, ни сторонних), для веб-сервера они будут уникальными посетителями при каждом запросе.

Помните золотое правило: используйте собственные файлы cookie, замеряйте процент отвергающих файлы cookie данного веб-сайта, контролируйте время от времени тенденции, и все будет прекрасно.

Было бы просто отлично, если бы все исполнители решили стандартизировать вычисление этих двух показателей. Это был бы большой шаг по облегчению жизни всех практиков веб-аналитики.

Вторник и среда: время на сайте

После вопроса “Сколько посетителей пришло на сайт?’ вполне логичен следующий вопрос: “Как долго они там оставались?’ Показатель время на сайте (Time on Site) различными производителями также называется продолжительностью посещения (length of visit или visit length). Как правило, он используется в контексте лояльности: “Если вебсайт привлекателен и предоставляет интересное содержимое, посетители должны остаться на нем дольше x минут” (где x зависит от назначения веб-сайта и цели его посещения клиентами). С появлением файлов cookie и лучших методик обработки сеансов замер данного показателя постоянно улучшается.

На что следует обратить внимание

Время на сайте — это общий показатель, неизбежно присутствующий в каждой рассматриваемой панели инструментов. Генеральному руководству он также нравится, поскольку прост и понятен: чем больше времени люди проводят на сайте, тем лучше. Однако этот прекрасный показатель имеет много скрытых проблем, которые чрезвычайно важно понимать.

На что следует обратить внимание еще

Время на сайте — это весьма важный показатель, но есть несколько нюансов, о которых следует знать.

Важно понимать, как измеряется этот показатель

Когда клиент впервые обращается к веб-серверу, для посетителя обычно открывается сеанс. С этого момента, поскольку клиент просматривает веб-сайт, каждый его запрос регистрируется с временной меткой (практически стандартный механизм любой методики сбора данных). Очень важно знать, как данный показатель вычисляется используемым инструментом веб-анализа, хотя для некоторых элементов, например блогов, он не имеет никакого смысла.

Чтобы лучше понять механизм вычисления показателя, давайте рассмотрим пример; предположим, что клиент приходит на веб-сайт, просматривает четыре страницы и покидает веб-сайт. Весьма упрощенно записи в файлах журнала выглядели бы следующим образом:

Click 1: index.html—0900 hrs Click 2: product.html—0901 hrs Click 3: product_detail.html—0904 hrs Click 4: customer_reviews.html—0905 hrs

Вычисляя разницу между временными метками на одной и на другой странице, инструмент веб-анализа определяет, как долго посетитель смотрел страницу. Так, в приведенном примере на домашнюю страницу была потрачена одна минута (0900 — 0901).

Обратите внимание, последняя запись имеет временную метку, но совершенно непонятно, что произошло дальше, клиент просто закрыл браузер, оставил его открытым или перешел на другой веб-сайт (введя другой URL), причем ни веб-журналы, ни дескрипторы JavaScript не позволяют выяснить, как долго клиент находился на этой странице. В данном случае инструмент указал бы, что клиент потратил на последнюю страницу ноль минут (или ноль секунд).

Это важно, поскольку нет никакого способа выяснить, провел ли человек на данной странице пятнадцать минут или ноль. Время на сайте для этого клиента было бы принято как равное четырем минутам.

Давайте рассмотрим практический пример того, как это может создать большую проблему. На рис. 6.3 представлено распределение продолжительности посещения (времени на сайте) для некоего веб-сайта. Как можно заметить, подавляющий процент его трафика остается близким к нулю секунд.


Рис. 6.3. Распределение продолжительности посещения


Проблема в том, что рассматриваемый веб-сайт представляет собой блог, а общей особенностью большинства блогов является расположение большей части содержимого на домашней странице (index.html). Большинство читателей никогда не ходит по веб-сайту глубже, и, как ни печально, инструменты веб-анализа не могут выяснить, тратят ли посетители на все великолепное содержимое полчаса или уходят через пять секунд. Трудно измерить успех.

Существуют хакерские дескрипторы JavaScript, которые способны выяснить, ушел ли клиент с веб-сайта, введя URL или закрыв браузер. Такие дескрипторы выполняются при событии on-load (загрузка) и сообщают на веб-сайт, что пользователь его

покинул. Следует удостовериться, доступна ли столь нестандартная “возможность”. Однако это все равно не решает проблему, если пользователь просто закрыл браузер, открыл и пошел дальше.

Большинство инструментов веб-анализа указывают в отчетах усредненное значение времени на сайте

Отчеты могут представлять среднее время на сайте как общее (для всего сайта) или как результат обработки различных отчетов. Оба примера приведены на рис. 6.4 и 6.5.


Рис. 6.4. Среднее время на сайте: общее


Рис. 6.5. Среднее время на сайте: поисковые системы


Проблема демонстрации простого усредняющего значения по всем сеансам заключается в том, что это скрывает реальное понимание. Данный показатель желательно просматривать в распределенном виде (как показано на рис. 6.3). Но если понадобится среднее значение (что тоже бывает необходимо), то лучше сделать это осмысленно, а не вслепую.

Как ни старайся, но преобладающее количество посещений веб-сайта сводится к просмотру одной страницы. Как упоминалось в предыдущем примере, посещения страницы будут иметь время на сайте, равное нулю секунд. Так, при большом количестве посещений одной страницы (с нулевым временем) значение среднего времени на сайте будет существенно отличаться от реального, поскольку все посетители не будут учтены, ведь никаких данных о них нет (если таких посетителей большинство, то результат будет весьма далек от объективного).

На рис. 6.6 представлена тенденция общего среднего времени на сайте за приблизительно 83 секунды.


Рис. 6.6. Среднее время на сайте для общих посещений и посещений без одиночных страниц


Теперь, если просто удалить из данных одностраничные посещения, вид графика существенно изменится и продемонстрирует “реальное” среднее время на сайте для посещений, где фактически имеются данные приблизительно за 184 секунды! Для владельца веб-сайта эти дополнительные 100 секунд могут стать определяющими между получением премии и неполучением!

Как можно заметить на рис. 6.7, различие в показателе для трафика поисковой системы абсолютно.


Рис. 6.7. Среднее время на сайте для поисковой системы с и без одиночных страниц


На рис. 6.7 представлено изменение с 57 секунд для общего трафика до 164 секунд для тех, кто просмотрел больше одной страницы. Это также демонстрирует, что трафик поисковой системы Ask Jeeves мог бы показать ужасный результат по среднему времени на сайте — 33 секунды для всех посетителей, но результат для Ask Jeeves по трафику без одностраничных посещений демонстрирует среднее время на сайте, 141 секунду, что не так уж и плохо.

Показатели отказов рассматриваются далее в этой главе, и они очень важны. Также следует подчеркнуть, что об одностраничных посещениях следует знать немного больше (а не только то, что их не нужно учитывать). Однако главное — не забывать, что в контексте показателя среднего времени на сайте отсутствуют достоверные данные о посещении последней страницы. Кроме того, если в течение сеанса посетитель видит только одну страницу, то никаких данных о его времени на сайте не будет. Это нужно знать и учитывать, поскольку данный фактор может оказать большое влияние на вычисление критически важного показателя.

Чрезвычайно сложно установить цели для показателя времени на сайте

С точки зрения владельца веб-сайта, какое значение показателя времени на сайте желательно иметь, побольше или поменьше? Если цель сайта — помочь клиентам решить свои задачи как можно быстрей (покупка, ответ на вопрос службы поддержки и т.д.), то это должно быть снижение количества секунд. Если клиентам предоставляется некое содержимое, на знакомство с которым необходимо время, то целью должно быть большее значение времени на сайте. Уменьшить время на сайте можно просто сократив количество страниц. Увеличить, просто затруднив пользователям поиск необходимой информации или затормозив процесс загрузки. Хотя эти примеры могут показаться вопиющими, для достижения жизненно важной цели все способы хороши. При том, что все показатели должны быть соотнесены с целями, необходимо все тщательно взвесить и решить, какого поведения данного показателя желательно достичь, и оповестить об этом сотрудников компании (а затем претворить это поведение в реальность).

Стр. 165

Четверг и пятница: просмотр страниц

Просмотр страниц (page view) — один из наиболее популярных показателей со времен первых анализаторов веб-журналов до нынешних дней. Начиналось все с подсчета обращений к серверу, что на заре Интернета буквально означало запрос файла HTML. Затем пришлось перейти к подсчету запросов страниц, поскольку они стали содержать не только текст. Сегодня запросы вдруг превратились в бесполезный показатель, поскольку при загрузке каждая страница теперь посылает серверу от 5 до 50 запросов содержимого различных видов, составляющих единую страницу.

Чаще всего используется термин просмотр страниц (page view), но показатель подразумевает также глубину посещения (depth of visit) или активность загрузки страниц (pageload activity). Хотя все они измеряют то же самое: количество страниц, просматриваемых или запрашиваемых посетителем в течение сеанса.

Обычно количество страниц, просматриваемых на веб-сайте, используется в заменителе показателя лояльности клиента. Если посетители веб-сайта просматривают большее количество страниц, значит, содержимое веб-сайта привлекательно. Это вполне справедливо для веб-сайтов, ориентированных на содержимое (cnn.com, sports.yahoo.com, keepmedia.com и т.д.). Но на веб-сайтах других типов измерение успеха с использованием количества страниц, просматриваемых посетителем, не столь очевидно.

На что следует обратить внимание

Как уже упоминалось ранее в этой главе, страница может быть идентифицирована по уникальному URL или комбинации параметров и URL. На это и полагаются приложения веб-аналитики при подсчете запрошенных страниц. Независимо от точки зрения на данный вопрос сегодня каждый производитель для работы полагается на концепцию “страниц”.

Но с появлением улучшенного содержимого (например, Ajax, Flash и Flex) представилась возможность отображать различное содержимое, не меняя URL.

Например, используя Gmail, можно работать со всей электронной почтой, а URL останется неизменен. Можно переходить по разным папкам, отвечать на электронные сообщения или удалять их, находясь на одном URL: http://mail.google.com/mail/.

Или познакомьтесь с опытом Nike по следующему URL: http://nikeid.nike.com/nikeid/index.jhtml. На этом веб-сайте можно провести часы, а стандартная реализация типичного приложения веб-аналитики сообщит об этом совсем немного.

Или возьмем, к примеру, блог автора www.kaushik.net/avinash, здесь можно прочитать пять разных статей, оставаясь на той же странице. Сколько просмотров страниц получилось? Каков коэффициент лояльности, если она связана с количеством просмотров страниц?

Ясно, что концепция страниц ныне в прошлом. Она неприменима на многих сайтах, включая приведенные примеры. Это важно, поскольку означает переделку кода программного обеспечения, перестройку логики и применение совершенно иного подхода веб-аналитики.

Это также важно потому, что большинство производителей не торопятся изменять базовые способы сбора данных и модели вычисления ключевых показателей, чтобы приспособиться к реалиям современной жизни. Даже когда предложены новые показатели и методы сбора данных, производители в инструментах решения проблем все еще полагаются на прежние данные и значения, ориентированные на страницы. С каждым последующим днем эта проблема будет усугубляться.

На что следует обратить внимание еще

Не забывайте, что просмотр страниц — это topic de jour[12] в настоящее время. Каждый говорит об этом обычно в контексте развития впечатлений веб-клиента. С точки зрения программы веб-аналитики стоит глубже позаботиться о трех следующих вопросах. Выясните, что определяет индивидуальность страницы на веб-сайте, а затем удостоверьтесь, настроено ли приложение веб-аналитики именно так подсчитывать просмотры страниц Это краткое повторение точки зрения, изложенной ранее в настоящей главе. Выясните это в содружестве с группой информационных технологий и исполнителем. Для динамического веб-сайта это крайне важно, поскольку неправильная настройка может дать числа, которые являются абсолютным мусором.

Если на веб-сайте используется улучшенное содержимое (например, Flash) или реализован Ajax или улучшенные интерактивные приложения, уже известно, что в отчетах отобразится одностраничное представление для этих элементов независимо от их глубины.

Это особенно справедливо, если в качестве источника данных используются веб-журналы. Придется поработать с исполнителем веб-анализа, чтобы выяснить, как он фиксирует данные улучшенных мультимедийных средств, насколько реализовал существующие механизмы их сбора на основании дескрипторов JavaScript и применяет их для фиксации предопределенных событий. Затем эти данные сохраняются и отображаются в отчете.

Если исполнитель не поддерживает отслеживания улучшенных мультимедийных средств, а большинство пока так и делают, то об этом придется позаботиться самому. Найдите в своем отделе информационных технологий хорошего хакера и постарайтесь с ним подружиться. К счастью, там такие всегда имеются.

Так или иначе, следует быть готовым к тому, что придется общаться с разработчиками улучшенных мультимедийных средств и проводить специфическую работу с исполнителями веб-анализа или отделом информационных технологий.

Подобно показателю время на сайте, редко нужны отчеты об усредняющих значениях просмотров страниц

Просмотры страниц по посещениям большинства веб-сайтов будут выглядеть как на рис. 6.8, несмотря на его распределение по определенным веб-сайтам. Динамика поведения посетителя на совершенно разных веб-сайтах абсолютно одинакова. Если получено распределение, подобное приведенному на рис. 6.8, то в большинстве случаев это довольно неоптимальный результат, поскольку даже со временем не удастся понять, улучшилась ли ситуация фактически или ухудшилась.

Рис. 6.8. Распределение просмотров страниц по посещениям

Неделя 3: понятие стандартных отчетов

Занятия первой и второй недели подготовили читателя к пониманию основ сбора данных и четырех основополагающих показателей. На третьей неделе подробнее рассмотрим понятие качества получаемого трафика и его происхождение.

Когда некто заходит в магазин, персонал понятия не имеет, откуда этот человек пришел и каков контекст данного посещения. Но в веб все не так, поскольку посетители, приходя на веб-сайт, приносят с собой атрибуты и контекст, указывающий, откуда они пришли. Каким кампаниям они соответствуют? Какая поисковая система и какие ключевые слова они использовали? Какой веб-сайт направил посетителя сюда? Все это превосходные данные, которые помогают гораздо лучше понять трафик, а также дают контекст, который можно использовать для реакции на посетителя.

В то же время не все источники трафика будут иметь одинаковое качество. Как узнать, какие лучше, а какие следует отбросить?

На этой неделе станет понятно, каков оптимальный ответ на эти вопросы исходя из некоторых стандартных отчетов, предоставляемых всеми инструментами вебанализа, при этом следует быть предельно внимательным. Также будут перечислены действия, которые можно предпринять на основании предоставленных отчетов.

Понедельник и вторник: показатель отказов

Автору очень нравится показатель отказов (Bounce Rate), но немного печалит его недостаточное использование практиками веб-аналитики. А ведь этот показатель имеет удивительную мощь, когда дело доходит до понимания и действий (а ведь все затевается ради действий, не так ли?).

Сегодня все определяют тенденции посетителей. Тратится много времени и денег на усилия по привлечению клиентов (например, маркетинговый поиск, маркетинг по электронной почте или партнерский маркетинг). Но уж если средства потрачены, то нужно получить отдачу, не так ли? Правильно ли собирается трафик, который привлек сайт? Да, можно измерять показатель переходов, но не скрывает ли он реальную правду о значении веб-сайта?

Показатель отказов определен следующим образом:

Показатель отказов (bounce rate) — это процент трафика, который покидает вебсайт на протяжении менее чем 10 секунд.

По поводу периода времени не существует жесткого правила. Имеется много версий на этот счет (например, посетители, просмотревшие только одну страницу, или остававшиеся в течение пяти секунд или меньше пятнадцати секунд), но исходя из практического опыта автор рекомендует десять секунд. Это вопрос воображения, но в современном мире коротких интервалов внимания посетитель должен находиться на вебсайте по крайней мере десять секунд, чтобы понять, что это не то, что он ищет. Если десять секунд — слишком высокая планка, то можно ограничиться пятью секундами.

Для вычисления показателя отказов (по указанным ранее причинам) рекомендуется использовать время, а не количество страниц.

На что следует обратить внимание

Представьте, что проводится четыре кампании (поиск, электронная почта, слияния и корпоративный веб-сайт) и необходимо измерить показатель переходов. Отчет мог бы выглядеть так, как демонстрирует табл. 6.1.

Таблица 6.1. Отчет показателя переходов по кампаниям

Первые три кампании требуют материальных затрат для управления трафиком. Четвертый бесплатен. Просмотр только этого отчета сообщит, что наиболее эффективным средством является электронная почта, затем корпоративный веб-сайт и поиск.

Но были ли это затраты на трафик самого высокого качества? Возможно, нет. См. табл. 6.2.


Таблица 6.2. Отчет показателей переходов и отказов по кампаниям

Вот это да, теперь все куда интересней! Рассмотрим столбец показателя отказов. Обратите внимание, что каждая кампания имела их совершенно разные значения. Электронная почта, на фоне наилучшего показателя переходов имеет самый плохой показатель отказов (возможно, необходимо улучшить список рассылки электронной почты, поскольку она раздражает или непопулярна в настоящее время).

О показателе отказов следует заботиться, поскольку он предоставляет новую и весьма интересную точку зрения на эффективность проводимых кампаний и отдельных веб-страниц (рис. 6.9). Другими словами, это позволяет удостовериться, выполняют ли они свою работу на самом деле. Такое знание можно использовать для оптимизации трафика, страниц и стратегии сайта.


Рис. 6.9. Показатель отказов для страниц веб-сайта


На что следует обратить внимание еще

Это еще один показатель, весьма недооцениваемый большинством практиков веб-аналитики. При его измерении в первую очередь следует обратить внимание на следующее.

Проанализируйте все имеющиеся данные о посещаемости веб-сайта и о результате его деятельности, чтобы выяснить пороговое значение, подходящее для вычисления показателя отказов данного веб-сайта

Пять и десять секунд — это пороговые значения, которые довольно широко распространены ныне в отрасли. Также важно ознакомить с этим показателем ответственные лица компании. Большинство из них недостаточно хорошо понимают это, а следовательно, не спрашивают о нем и не используют его настолько часто, как другие показатели при принятии важных решений, касающихся веб-сайта.

Спросите исполнителя веб-анализа, может ли он помочь вычислить показатель отказов и настраивается ли он по текущим потребностям

Большинство производителей либо не обеспечивают настройку, либо считают это специальной услугой (отдельно оплачиваемой).

Показатели отказов можно применить к любому сегменту трафика, который использует компания

В приведенном примере использовались кампании, а в примере следующего раздела — ключевые фразы поиска. Но показатель отказов можно применять по URL источника, веб-странице (рис. 6.9.), стране (география) и т.д. Можно найти все, что наилучшим образом подходит для данной компании.

Время на сайте и показатель отказов могут быть большими друзьями

Когда создаются собственные уникальные отчеты и индивидуальный анализ, объединение этих двух показателей может зачастую обеспечить открытия, связанные с реальной эффективностью. Попытайтесь сделать это. На сайте выявятся ценные источники трафика, а также области головной боли. Например, можно обнаружить, что некоторые страницы или элементы сайта характеризуются высокими показателями отказов, которые не имеют тенденции к снижению на протяжении необычно длительного времени. Это свидетельствует о проблемах с действиями, содержимым или структурой навигации.

Помните, трафик отказов не стоит отбрасывать

Это ценный трафик, поэтому имеет смысл потратиться на понимание того, откуда он исходит, почему посетители приходят и тут же покидают веб-сайт. Зачастую действительно трудно приобрести трафик. Посетители — это те, кто так или иначе решил прийти на веб-сайт. Если последний способен помочь им решить их задачи, можно считать, что гражданский долг выполнен и клиент получил необходимую помощь.

Показатель отказов — лучший друг аналитика и первый шаг к пониманию, как заполучить трафик для веб-сайта. Зачастую это скорее понятийная мера, нежели просто вычислительный показатель.

Со среды по пятницу: реферреры — источники и ключевые фразы поиска

Одним из величайших преимуществ веб по сравнению с другими каналами является то, что веб позволяет понять намерения клиента. Кроме всего прочего, можно попытаться выявить причины, побуждающие посетителей заходить на тот или иной вебсайт. Если известно, откуда посетители пришли, то о них можно узнать чуть больше, а возможно (только возможно!), попробовать создать содержимое или впечатление, которое бы им подходило больше или помогло лучше решать задачи.

Два превосходных источника информации о посетителях — это URL реферреров и ключевые фразы, использовавшиеся для поисковой системы. Оба показателя дают прекрасный материал для логических выводов. Они могут сообщить, откуда посетители приходят, что ищут, получается ли трафик из правильных источников и т.д. При секционировании и фрагментации данных можно также выявить различные потоки трафика и получить возможность усовершенствовать их.

На что следует обратить внимание

Объединенные значения инструментов веб-анализа редко бывают полезны для выработки действенного понимания. Посетители приходят на веб-сайт по несметному количеству причин (независимо от того, почему существует веб-сайт, кстати, когда вы в последний раз покупали на Amazon.com?).

На рис. 6.10 приведена типичная версия отчета о доменах реферреров и дополнительная информация, которую он может предоставить. Данный отчет можно про

сматривать либо по доменам, либо, как рекомендуется, по наиболее крупным рефер-рерам, по определенным URL (страницам) на веб-сайтах реферрера, который передает трафик на данный сайт.


Рис. 6.10. Отчет о доменах реферреров


На рис. 6.11 приведена типичная версия отчета о ключевых фразах поиска. В результате отработки этих данных можно обрести практическое понимание того, какие ключевые слова приносят наибольший трафик из поисковой системы (рис. 6.12).


Рис. 6.11. Отчет о ключевых фразах поиска


Рис. 6.12. Ключевые фразы поиска по отчету поисковой системы


Позволяя понять факторы формирования трафика на веб-сайте, эти отчеты помогают оптимизировать стратегию сбора и создания индивидуализированных впечатлений (даже если ключевую фразу поиска придется повторить на рекламных страницах). Они также могут действовать как триггеры для проверки A/B или многопараметрической проверки (“Посетитель пришел отсюда, значит, о нем уже что-то известно и его можно направить на проверку версии B в надежде, что показатель переходов улучшится”). И наконец, эти отчеты определяют анализ, который, вероятно, является одним из самых простых, быстрых и, возможно, наиболее действенных.

На что следует обратить внимание еще

Эти отчеты — настоящая золотая жила информации, если анализировать их тщательно и учитывать несколько фундаментальных фактов.

Известны будут не все реферреры

Ответственные лица подразумевают, что аналитики всегда будут знать о каждом вебсайте, который передает трафик на веб-сайт компании. В действительности от 40 до 60 процентов реферреров всегда будут нулевыми (или пустыми, или неизвестными, или прямого доступа, или по закладке, в зависимости от используемого инструмента). На рис. 6.10 число 41,41 — вполне приемлемый процент.

Обычно такое поведение объясняют наличием у посетителя закладки на веб-сайт или вводом URL непосредственно в браузере. Но это еще не все объяснение. Отсутствие URL в журналах может быть связано со следующим.

• Браузер посетителя имеет специальные параметры (некоторые браузеры не будут передавать реферрер вообще).

• Зачастую не срабатывает постоянная переадресация (301), и весь приходящий через нее трафик выглядит как нулевой, поскольку реферрер не передается. (Например, при переадресации трафика с yourcompanyname.com на www.your-companyname.com (если это не постоянная переадресация), весь трафик окажется нулевым.)

• Трафик исходит от различных кампаний непосредственного маркетинга по электронной почте, и реферрер не может правильно передаваться программой электронной почты на веб-сайт.

• Браузер посетителя может иметь очень жесткие параметры защиты.

Следует знать эти причины и учитывать тот факт, что приличная часть трафика не имеет реферрера. Тем не менее реферреры остальной части трафика известны. Примите это как руководство к действию.

Выполните глубокий анализ реферреров трафика поисковой системы

Согласно последнему анализу E-consultancy, 80 процентов трафика Интернета начинает свой путь с поисковой системы (анализ выполнялся в четвертом квартале 2006 года). Следовательно, разобравшись в ее трафике, поступающем на веб-сайт, можно подстроиться под тенденции клиента. Поисковые системы существенно изменили поведение последних и следует удостовериться, что трафик ему соответствует. Отправной точкой всего анализа является понимание поведения посетителей веб-сайта в поисковой системе, а также знание используемых ключевых фраз. Это вполне нормально, когда количество трафика от поисковых систем контролирует набор ключевых фраз.

В конкурентной борьбе необходимо копать глубже. На рис. 6.13 представлен один из примеров анализа, который может быть проведен на основании трафика по ключевым фразам каждой поисковой системы.


Рис. 6.13. Анализ по ключевым фразам поиска


Теперь все готово. Вычислены следующие показатели.

• Посетители (посещения): общее количество посетителей от Google и по каждой ключевой фразе.

• Процент посетителей (посещений): простой процент от общего количества.

Всего просмотров страниц: общее количество веб-страниц, просмотренных посетителями.

• Просмотров страниц на посещение: общее количество просмотров страниц, деленное на общее количество посещений. Это приблизительный показатель “привлекательности” веб-сайта для трафика по каждой ключевой фразе.

• Среднее время на сайте (Average Time On Site — ATOS): средняя продолжительность каждого сеанса.

• Короткие посещения (показатель отказов): количество посещений, продолжительность которых была меньше пяти секунд. Это приблизительный показатель для “вопроса о качестве трафика”.

Вполне очевидно, что обеспечение высокого качества понимания может базироваться на неоценимом, одном из наиболее богатых источников трафика для веб-сайта: поисковых системах. Можно также добавлять или удалять показатели, чтобы гарантировать получение данных, наиболее адекватных для исследуемого веб-сайта (так, например, можно добавить показатель переходов, или доход или любой другой).

Анализ поисковой системы может помочь оптимизировать рекламные страницы для поискового трафика

Вооружившись полным пониманием эффективности, можете начинать рассмотрение оптимизации рекламных страниц. Для самых популярных ключевых слов могло бы оказаться оптимальным создание настраиваемых рекламных страниц, которые будут “говорить” с посетителями и помогать им выполнять свои задачи. Если рекламные страницы уже имеются, приведенный выше анализ может помочь понять, на какие из них следует обратить повышенное внимание, чтобы улучшить их качество.

Не забывайте, что этот показатель использует ключевые фразы, а не ключевые слова

Некоторые инструменты веб-анализа представляют отчет по ключевым словам, которые обобщают данные на основании экземпляров ключевых слов. Предположим, например, что каждая из следующих ключевых фраз привела к одному посещению веб-сайта:

• Web analytics (веб-аналитика);

• Web analytics tools (инструменты веб-анализа);

• Web analytics blows (прорывы веб-аналитики);

• Analytics amazing (занимательная аналитика).

Отчет по ключевым словам дал бы следующий результат:

• Web: 3;

• Analytics: 4;

• Tools: 1;

• Blows: 1;

• Amazing: 1.

Безусловно, правильный отчет дал бы следующие результаты:

• Web analytics: 1;

• Web analytics tools: 1;

• Web analytics blows: 1;

• Analytics amazing: 1.

Совет. В это, вероятно, трудно поверить, однако всегда проверяйте, указывает ли исполнитель веб-анализа в отчетах ключевые слова и ключевые фразы. К счастью, только некоторые из исполнителей все еще указывают ключевые слова.

Это критически важно, поскольку в ноябре 2006 Google сообщила, что наиболее распространенным количеством слов в поисковом запросе является цифра 3. Это удивило многих веб-практиков, поскольку означает, что посетители ищут все более конкретные вещи, а такое поведение имеет существенное значение для маркетинга в поисковых системах и стратегий их оптимизации.

Неделя 4: качество содержимого веб-сайта и отчеты о навигации

В последнюю неделю первого месяца сосредоточимся на содержимом веб-сайта. Здесь будет предоставлена глубина и описаны некоторые не очевидные проблемы обычных отчетов веб-аналитики, предоставляемых используемыми инструментами.

О качестве содержимого веб-сайта можно судить с разных позиций. Каждая, включая отчеты о просмотре страниц, о страницах выхода и наложении данных на сайт (плотность щелчков), позволяют сосредоточиться на различных аспектах и оптимальна для разных целей. В течение четвертой недели рассмотрим все за и против каждого из отчетов, совокупный анализ которых позволит получить наилучший результат.

Здесь также изложено, как избежать ряда проблем, связанных с некоторыми из этих отчетов, чтобы рациональней использовать драгоценное время и ценные ресурсы.

Наложение данных на сайт — возможно, один из наиболее захватывающих отчетов, причем, случается же такое, один из наименее оцененных и понятых. В конце этой недели читатель будет точно знать, как использовать такой отчет, который становится в миллионы раз полезнее, когда применяется сегментация. Это позволяет походить в ботинках клиентов — жесткое испытание, но весьма полезное.

Понедельник и вторник: самые популярные страницы для просмотра и выхода

Посетители приходят на веб-сайт, а веб-сайты состоят из страниц (как правило)! Обычно так и бывает. Уже с первых дней веб аналитики интересуются количеством посетителей, продолжительностью их присутствия на сайте и количеством прочитанных ими страниц. Следующим этапом, вполне логично, стал углубленный анализ того, что все эти посетители просматривают (понятие получило причудливое название: потребление содержимого (content consumption)).

Большинство инструментов веб-аналитики предоставляет три основных типа информации о страницах: наиболее просматриваемые страницы, самые популярные элементы страниц и самые популярные страницы выхода.

Наиболее просматриваемые страницы

Данный показатель известен также как URL с наибольшим спросом (most requested URLs), самое популярное содержимое (top content) и популярные страницы (popular pages). Это просто список страниц веб-сайта, которые характеризуются самым большим количеством посещений (посетителей), как показано на рис. 6.14.

На уровне страницы большинство пакетов веб-аналитики оповещают о страницах не с самыми большим количеством уникальных посетителей и о страницах с самым большим количеством посещений (или посетителей, что практически одно и то же).


Рис. 6.14. Страницы с наибольшим количеством посетителей (распределение по процентам)


Об этом важно знать (и хотя это требуется нечасто, есть небольшое различие, когда дело доходит до фактического анализа потребления содержимого).

На что следует обратить внимание

Наиболее просматриваемые страницы веб-сайта — прекрасный индикатор того, почему люди приходят на него и что они там ищут. Такой отчет всегда полон сюрпризов (которых следует ожидать), поскольку некое несоответствие между тем, что создают владельцы веб-сайта, и тем, что нужно клиентам, наблюдается постоянно. Такие страницы — прекрасный объект для приложения усилий, поскольку они обладают непропорциональным объемом трафика на сайте. Это также первые кандидаты на многопараметрическую проверку.

На что следует обратить внимание еще

Вот два простых соображения, которые следует учитывать, чтобы извлечь оптимальную пользу из этого отчета.

Отслеживайте тенденции во времени, а не сосредоточивайтесь только на текущем моменте

Обычно это относится к сайтам, которые изменяются не очень быстро, и, соответственно, так же редко изменяется значение наиболее просматриваемых страниц (вполне очевидно, что для веб-сайтов новостей это не подходит). Это хорошая почва для размышлений по поводу того, что предпринять (сосредоточиться на этих страницах больше или меньше?).

Рассматривайте числа в сравнении, а не только их абсолютные значения

Необработанные числа для самых популярных страниц не могут существенно изменяться, поэтому их следует сравнивать со значениями за последнюю неделю (или за вчера и сегодня, или за прошлый и текущий месяцы). Наблюдается ли значительное увеличение количества посетителей? Предположим, например, что некая страница занимает на сайте 155-е место (по абсолютному значению просмотров страниц), но за отчетный период времени ее трафик увеличился на 900 процентов. Это может свидетельствовать о ее лидирующем положении на веб-сайте. (Примечание: данный анализ применим также для самых популярных элементов страниц.)

Самые популярные элементы страниц

Этот простой отчет демонстрирует страницы, с которых посетители веб-сайта уходят чаще всего. Он также измеряется в единицах посещений (посетителей), а не уникальных посетителей. На рис. 6.15 автор дополнил стандартную версию отчета о самых популярных элементах страниц процентом посетителей определенной страницы. Дополнения включают показатели отказов и общее количество просмотров страниц на посещение (глубина посещения (depth of visit) — очень ценный показатель). Конечный результат — это отчет, демонстрирующий основные точки выхода с вебсайта, позволяющий выработать меры по улучшению его содержимого и привлечению посетителей.

На что следует обратить внимание

Показатель самых популярных элементов страниц критически важен в мире, полностью находящемся во власти поисковых систем. Оптимизация поисковой системы (search engine optimization) — это отнюдь не пустой звук. Большинство веб-практиков имеют нездоровую навязчивую идею по поводу их домашних страниц (index.html). Но посетители, приходящие из поисковых систем, обычно попадают на страницы в глубине веб-сайта. Как можно заметить на рис. 6.15, для домашней страницы данного веб-сайта зарегистрирован только 31 процент посещений. Остальная часть трафика начинается в глубинах веб-сайта.


Рис. 6.15. Самые популярные элементы страниц (распределение по процентам, объединенное с показателями отказов и просмотров страниц на посещение)


На что следует обратить внимание еще
Считаются ли 10 наиболее популярных элементов такими же важными, как домашняя страница?

Сделайте домашнюю страницу очень быстрой, поскольку от этого зависит первое впечатление о веб-сайте.

Поскольку домашняя страница больше не является таковой, самые популярные элементы страниц должны поддерживать наиболее важные продвижения (продажи или нечто подобное)

Общепринято располагать основные “новости” веб-сайта на домашней странице, но 70 процентов посетителей даже не видят ее.

Дополняйте отчет распределением по посетителям, показателем отказов и количеством просмотров страниц на посещение

Эти два показателя могут стать основными индикаторами того, насколько хорошо каждая страница выполняет задачу по привлечению посетителей или их удержанию (показатель отказов), а также насколько хорошо они способствуют глубине посещения (просмотры страниц на посещение). Комбинация трех перечисленных показателей может обеспечить чрезвычайную проницательность (что очевидно даже на упрощенном примере, рис. 6.15).

Самые популярные страницы выхода

Самые популярные страницы выхода — еще один из наиболее традиционных отчетов. Вполне очевидно, что это последняя страница, просматриваемая в течение сеанса посетителя, а показатель — это список страниц, наиболее часто оказывающихся последними просматриваемыми. На рис. 6.16 представлен стандартный отчет, демонстрирующий страницы с наибольшим процентом выходов на веб-сайте. Самый высокий коэффициент выхода вполне типичен для домашней страницы, даже если это не кажется очевидным.


Рис. 6.16. Самые популярные страницы выхода (распределение по процентам)


Предполагается, что этот показатель отображает “утечку” с веб-сайта, т.е. те страницы, с которых посетители уходят. Помните, это не показатель отказов для страницы (bounce rate for a page), хотя практики зачастую путают его с таковым. Отчет о самых популярных страницах выхода демонстрирует страницы, которые следует “устранить”, чтобы предотвратить утечку.

На что следует обратить внимание

Об этом показателе следует позаботиться в первую очередь. Для большинства вебсайтов это раздутое значение сообщает немного, в то время как на бумаге, кажется, говорит о многом. Это особенно справедливо, если отчет имеет обобщенный характер (как показано на рис. 6.16, где представлены самые популярные страницы выхода для всех посетителей веб-сайта). Зачастую оказывается, что самые востребованные страницы веб-сайта одновременно являются и самыми популярными страницами выхода; сам по себе данный факт ни о чем не говорит.

Кажется вполне очевидным, что если известно, откуда люди уходят с веб-сайта, то можно просто устранить эти “страницы”, и все будут кошерно. В действительности же посетители приходят на веб-сайт с целым пучком задач, и зачастую самой популярной страницей выхода на нем оказывается та, на которой представлен пользующийся спросом продукт, поскольку большинство посетителей хотят прочитать о нем и приобрести в розничной торговле.

Еще один аргумент против этого ценного отчета: показатель переходов для большинства веб-сайтов (электронной торговли и подобных) составляет порядка 2 процентов. Это означает, что примерно 98 процентов трафика выходит из неподходящих мест (примерами хороших мест являются: страница расчета, страница предоставления стимула и страница поддержки (FAQ page)). Когда такой огромный объем трафика выходит (утекает) с веб-сайта, причем, вероятней всего, с наиболее просматриваемых страниц, чрезвычайно трудно проанализировать успех или неудачу на основании абсолютных показателей выхода для страниц.

Если 50 процентов посетителей, просматривавших страницу с подробными сведениями о продукте, ушли с нее, то какой процент выхода с нее будет хорошим (т.е. прочитав обзор они пошли покупать в розничную продажу), а какой плохим (т.е. пришли за покупкой, не смогли прочитать описание, набранное очень мелким шрифтом, плюнули и ушли)? Как узнать все это на основании одного лишь значения коэффициента выхода? Но это не всегда бесполезное упражнение (см. исключения в следующем разделе), чтобы выяснить, почему люди уходят с сайта в тех или иных местах, можно использовать другие механизмы (например, опросы или исследования применимости).

На что следует обратить внимание еще

Сегментация данного отчета по различным потокам трафика, кампаниям или типам клиентов позволяет пролить немного света на тенденции, которые в силах прояснить ситуацию. Единственные исключения из этого правила — структурные элементы, носящие замкнутый характер, например корзинки и элементы расчета. Посетитель добавляет товар в корзинку, щелкает на кнопке Start Checkout (Начать расчет), вводит свой адрес и информацию кредитной карточки, щелкает на кнопке Submit (Передача) и видит страницу Thank You (Спасибо).

Среда: самые популярные назначения (ссылки выхода)

В веб информация о щелчке относится к странице или веб-сайту назначения, а не источника. Так, если www.kaushik.net/avinash имеет ссылку на www.Webana-lyticsdemystified.com и некто щелкает на ней, то информация о щелчке поступает на Webanalyticsdemystified.

Хотя каждый веб-сайт (источник (source)) имеет ссылку на другие веб-сайты (назначение (destination)), проблемой в прошлом было то, что источник не мог зафиксировать эту информацию. Для преодоления данной проблемы веб-сайты обычно используют переадресацию, позволяющую зафиксировать щелчок прежде, чем посетитель уйдет по назначению. Это ценно потому, что теперь можно точно определить, ссылки на какие направления обеспечили трафик, а также выяснить данные, не обращаясь за ними к владельцу веб-сайта назначения.

За последние несколько лет новые исполнители веб-анализа реализовали средства и механизмы сбора данных, которые фиксируют выход по назначению и милосердно избавляют от необходимости поддерживать на веб-сайте болезненный механизм переадресации.

Теперь появилась замечательная возможность количественно определять значения веб-сайта по отношению к другим веб-сайтам, как показано на рис. 6.17. (Следовало бы подчеркнуть, что это можно сделать и без дополнительной нагрузки на ваш отдел информационных технологий). Так, хоть выход посетителя и нежелателен, как упоминалось в предыдущем разделе, он может быть и хорошим, поскольку удалось организовать их по ссылкам самого веб-сайта.


Рис. 6.17. Отчет о самых популярных назначениях (квартальная тенденция)


На что следует обратить внимание

При наличии целой экосистемы веб-сайтов (электронная торговля, поддержка, корпоративный, побуждения спроса и т.д.) отчет о самых популярных назначениях (Top Destinations) — просто находка для аналитика. Большинство веб-аналитиков рассматривают их как индивидуальные веб-сайты, а следовательно, разделяют данные, однако теперь появляется возможность проследить воздействие каждого веб-сайта на всю экосистему.

Разве не любопытно было бы узнать, какое количество продаж стимулировал корпоративный сайт без необходимости обращаться к владельцам электронной торговли и веб-сайта побуждения спроса?

Разве не стоило бы сегментировать базовые показатели, чтобы направить посетителей, покидающих веб-сайт, на один из партнерских веб-сайтов?

Разве не проще понять намерения клиента, наглядно увидев, откуда исходят различные потоки трафика (рис. 6.18)?

Обратите внимание, трафик из поисковых систем выходит по разным ссылкам (по назначениям от веб-сайта) в сравнении со всеми посетителями. Это обеспечивает хорошее понимание намерений посетителей из поисковых систем по сравнению со всеми другими посетителями веб-сайта.


Рис. 6.18. Отчет о самых популярных назначениях (два важнейших сегмента: все посетители и трафик из поисковых систем)


На что следует обратить внимание еще

Для максимальной эффективности использования этого отчета имеет смысл учитывать следующее. Удостоверьтесь, что исполнитель способен отслеживать выход.

У некоторых исполнителей данная услуга оказывается по требованию (за дополнительную плату), у других это может потребовать вставки специального кода в ссылки выхода. Если веб-сайт уже использует JavaScript, следует очень тщательно проверить код JavaScript исполнителя по отслеживанию выхода в собственной среде QA или разработки. Отслеживающий выход код некоторых производителей может вступить в конфликт с кодом веб-сайта. Если сайт передает трафик на партнерские сайты, позаботьтесь о компенсации или по крайней мере о взаимных ссылках. Пересылайте партнерам свои данные и попросите о взаимности!


Сегментация данных для посетителей, уходящих на другие веб-сайты, может быть очень полезна

Один из подобных примеров приведен на рис. 6.19 (третий набор показателей для посетителей, уходящих с веб-сайта на hitwise.com). Это на самом деле весьма ценные данные, особенно при наличии большого количества ссылок на другие веб-сайты.


Рис. 6.19. Отчет о самых популярных назначениях (все посетители, трафик поисковой системы и те, кто уходит на сайт Hitwise по ссылке на него)


Четверг и пятница: наложение данных на сайт (анализ плотности щелчков)

И наконец, но не в последнюю очередь, самое любимое для автора — отчет о наложении данных на сайт. Автору он очень нравится, и он не склонен скрывать своих предпочтений.

Отчет наложение данных на сайт (site overlay) известен также под названием анализ плотности щелчков (click density analysis), буквально он демонстрирует, где клиенты щелкают на веб-странице, налагая информацию о щелчках поверх изображения вебстраницы (рис. 6.20).


Рис. 6.20. Отчет о наложении данных на сайт (называемый также анализом плотности щелчков или отчетом о навигации)


Здесь можно легко увидеть то, что невозможно отобразить в электронной таблице Excel или таблице с данными об интересах клиентов на веб-сайте. Отчет может также указать те элементы сайта, которые не особенно выделяются и кажутся неважными его владельцу, но “замечены” посетителями. В приведенном примере раздел справа внизу получает очень не много щелчков от посетителей веб-сайта. Как можно заметить, всего 0,0 % щелчков на ссылках, которые являются основной мерой успеха для его владельца.

На что следует обратить внимание

Отчет о наложении данных на сайт — возможно, один из наиболее значимых отчетов, создаваемых инструментами веб-анализа, по нескольким причинам.

• Анализ посещаемости сайта страдает одной серьезной проблемой: это просто набор чисел, URL, заголовков страниц и графиков. Это десенсибилизирует впечатление клиента. Аналитики настолько увязли в мире таблиц и отчетов, что почти забыли о смысле анализа поведения клиента (для них это только сеансы и значения файлов cookie). Анализ плотности щелчков — прекрасный способ походить в ботинках клиента, а также выяснить самые популярные среди клиентов элементы страниц веб-сайта.

• На первый взгляд это кажется немного невероятным, но просто удивительно, сколько аналитиков даже не утруждаются посещать свой сайт каждый день. Данный отчет — прекрасный способ не потерять связи с веб-сайтами и не утонуть окончательно в отчетах. Это куда эффективней, чем можно вообразить.

• Перед каждым маркетологом или ответственным бизнесменом открылась возможность понять веб-аналитика. Это не занудный отчет на девять страниц, созданный в Excel шрифтом в шесть пунктов. Достаточно просто просмотреть веб-сайт, чтобы получить полное представление о том, как работают его страницы. Некоторые инструменты позволяют не только рассматривать щелчки, но и получить также лучшее понятие о работе ссылок с точки зрения бизнес-целей (на рисунке ниже Gl/Clicks может означать, например, "переход” к цели 1).


На что следует обратить внимание еще

Как уже упоминалось, отчет о наложении данных на сайт может быть чрезвычайно полезен для понимания и принятия важных решений. Он поможет ускорить возврат капиталовложений, однако необходимо позаботиться о следующем.

Сегментация — ключ к пониманию поведения

Если инструмент веб-анализа отображает плотность щелчков только для одного сегмента трафика, он зачастую оказывается малоэффективен (поскольку на популярные страницы могут заходить разные типы посетителей, пытающихся решить весьма различающиеся задачи).

На рис. 6.20, например, можно заметить различие в распределении щелчков по каждой группе ссылок. Первое число (5,9 процентов на ссылке в заголовке) означает щелчки всех посетителей, а второе (9,2 процентов) — сегмент только тех посетителей, которые пришли с поисковой системы.

Наблюдение за поведением различных сегментов клиентов позволяет составить картину их ожиданий (это называется выводом о намерениях (intent inference)), на основе которой можно создавать индивидуализированные элементы или подумать о творческих способах удовлетворения потребностей посетителей (и, безусловно, удовлетворения, в свою очередь, собственных бизнес-целей).

Отчет о плотности щелчков (наложение данных на сайт) не особо ценен без контекста. Отчет анализа для каждой веб-страницы (рис. 6.21) предоставляет ключевой контекст и сопутствующую информацию к отчету анализа плотности щелчков. Представляя ключевые показатели эффективности для страниц, — например, посетители, просмотревшие страницу, среднее время на странице, процент входа, процент выхода и суперценный для SEO показатель ключевые фразы, управляющие трафиком, — анализ страниц поможет выяснить их эффективность в тысячу раз лучше. Этот несложный отчет позволяет понять значение домашней страницы (ее просмотрело только 11 процентов!), как долго она удерживает посетителей (среднее время на странице), выходы с веб-сайта на этой странице и, наконец, оптимизирована ли данная страница для поисковых систем и лучшего обеспечения поступления трафика. Чтобы получить максимум пользы от анализа плотности щелчков (наложения данных на сайт), необходим весь этот контекст. В противном случае будет совершенно непонятно, почему страница работает столь ужасно (или прекрасно). И снова подчеркну важность сегментации, это обеспечит не только понимание потребностей всех разновидностей посетителей, но и разделы трафика поисковой системы.


Рис. 6.21. Отчет об анализе домашней страницы веб-сайта (основные KPI страницы, обеспечивающие ключевой контекст)


Если инструмент не предоставляет эти KPI, попросите, чтобы исполнитель расширил перечень услуг. Хорошая новость: большинство исполнителей уже сделало это. Некоторые инструменты также предоставляют прекрасный визуальный отчет поведения клиента и щелчков на странице наподобие продемонстрированного на рис. 6.22. Это завершает “цикл анализа” наиболее популярных страниц, наглядно демонстрируя, как посетители попадают на страницу и куда затем уходят. Например, одного взгляда на левый столбец достаточно, чтобы сообразить, насколько работоспособны стратегии сбора (если все средства были потрачены на поиск MSN, то они не сработали, поскольку здесь они не отображены). Данный тип анализа демонстрирует также источники трафика, которые очень ценны, но не засекаются используемым радаром.

В настоящее время все более очевидно, что отчет об анализе плотности щелчков довольно обманчив.

Все не так просто, как кажется. Да, получить и прочитать информацию о щелчках просто, но для обретения действенного понимания понадобится проделать очень много работы.

Оказывается, что ответственным лицам компании анализ плотности щелчков нравится первую пару недель. Затем их начинает огорчать тот факт, что несмотря на изменения страниц “Мой показатель переходов не улучшается!"

Убедите ответственных лиц в том, что сегментация критически важна, что щелчки следует рассматривать в контексте KPI страницы, а анализ пути страницы не менее важен. Это потребует времени, так что будьте терпеливы.


Рис. 6.22. Анализ путей страницы. (Откуда трафик исходит? Куда идет затем?)


Инструмент веб-анализа должен предоставлять не только проценты по щелчкам для каждой ссылки, но и абсолютные числа

Абсолютные числа могут понадобиться значительно чаще, чем кажется. Все описанные в этой главе отчеты, включая наложение данных на сайт, могут стать гораздо полезнее при использовании сегментации (рис. 6.20, 6.21 и 6.22). Автор неоднократно затрагивает тему сегментации на протяжении всей книги и демонстрирует различные передовые способы и приемы ее применения. Но если даже после чтения планируется дальнейшее увеличение возможностей обретения понимания, не забывайте, что даже самые простые отчеты и показатели могут выглядеть иначе после сегментации. Сделайте такую попытку!


Загрузка...