Читаем Веб-аналитика: анализ информации о посетителях веб-сайтов полностью

Веб-аналитика: анализ информации о посетителях веб-сайтов

• Веб-журналы — единственный механизм сбора данных, способный фиксировать и хранить информацию о посещениях и поведении роботов поисковых систем на веб-сайте. Последние не выполняют дескрипторы JavaScript, а следовательно, не оставляют никаких следов для других механизмов сбора данных. Так, при необходимости проанализировать посещения роботами таких поисковых систем, как Google, MSN (Microsoft Network — сеть Microsoft), Yahoo и других, чтобы удостовериться в просмотре и правильности индексирования ими веб-сайта, придется использовать веб-журналы.

• При использовании веб-журналов данными располагает сам владелец веб-сайта. При большинстве других методик информацию будет фиксировать, обрабатывать и хранить исполнитель веб-анализа (web analytics vendor), под которым обычно подразумевают провайдера служб приложений (Application Service Provider — ASP). Веб-журналами владеет хозяин сайта, он же хранит их; это позволяет без проблем сменить исполнителя веб-анализа, перепроверить данные самостоятельно, а также при необходимости вернуться к прежним данным и обработать их новым инструментом.

Недостатки использования веб-журналов в качестве механизма сбора данных

• Веб-журналы прежде всего предназначены для фиксации технической информации (ошибок 404, тенденций использования сервера, типов браузера и т.д.). Они не оптимальны для сбора деловой или маркетинговой информации.

• При необходимости фиксировать дополнительную маркетинговую и коммерческую информацию потребуется плотное взаимодействие с группой информационных технологий и полная зависимость от нее. Это несколько сложнее, чем у других механизмов сбора данных, так что переход на них оправдан.

• Если веб-сервер не устанавливает файлы cookie, идентификация посетителей с любой степенью точности крайне сомнительна.

• Веб-журналы создавались для фиксации всех обращений к серверу. Следовательно, при их использовании для получения точных тенденций трафика и поведения необходимо правильно отфильтровать запросы изображений, ошибки загрузки страниц, трафик роботов, запросы файлов каскадных таблиц стилей (Cascading Style Sheet — CSS) и т.д.

• Кеширование страниц провайдерами (ISP) и прокси-серверами может привести к тому, что некая часть трафика (порядка 10 процентов) окажется неучтенной, поскольку когда некто в сети ISP запрашивает ту же страницу, которую кто-то другой уже запрашивал до него, ISP передаст ее из своего кеша и не будет беспокоить веб-сервер. Следовательно, у владельца веб-сервера не появится в файле журнала запись об этом запросе.

Рекомендация

К лучшему или нет, но в использование веб-журналов как источников данных для веб-анализа внесено не много новшеств. К веб-журналам следует обращаться для анализа поведения роботов поисковой системы, чтобы замерить успешность усилий по ее оптимизации. Для выполнения практически всех остальных типов веб-анализа, которые могут понадобиться, оптимальными будут другие механизмы сбора данных. Веб-журналы, в лучшем случае, можно использовать для дополнения данных, собранных с применением других методик, но будьте готовы к сложностям и большому количеству усилий.

Веб-маяки

Веб-маяки (Web beacon) разрабатывались в те времена, когда в веб царили баннеры в стиле “вырви глаз”, которые “липли” к веб-сайтам, обращения к которым следовало измерить. Компания распространяла баннеры по многим веб-сайтам, и зачастую их оказывалось по несколько на одной странице. Имелась насущная потребность выяснить не только количество людей, видевших баннер и щелкавших на нем, но также и то, сколько раз это был один и тот же человек. Или наоборот, если тому же человеку были предоставлены разные возможности (баннер, текст и т.д.), то что сработало эффективнее?

Веб-маяки — это обычно прозрачные изображения размером 1x1 пиксель, которые помещают на веб-страницу при помощи дескриптора HTML img src. Прозрачные изображения, как правило, находятся на сервере стороннего исполнителя, отличном от сервера, содержащего веб-страницу.

Рис. 2.2 демонстрирует, как веб-маяки фиксируют данные.

Процесс протекает следующим образом:

1. Клиент вводит URL в браузере.

2. Запрос страницы поступает на один из веб-серверов.

Рис. 2.2. Как веб-маяки фиксируют данные

3. Веб-сервер посылает страницу клиенту наряду с запросом прозрачного изображения размером 1 х 1 пиксель, которое находится на сервере стороннего исполнителя.

4. При загрузке страницы она запрашивает изображение размером 1 х 1 пиксель, оповещая таким образом стороннего исполнителя о просмотре страницы.

5. Сервер стороннего исполнителя посылает изображение браузеру пользователя наряду с кодом, способным читать файлы cookie и собирать анонимные данные о посетителе, включая сам факт просмотра страницы, IP-адрес, время просмотра, файлы cookie, которые были установлены ранее, и т.д.

Перейти на страницу: