• Веб-журналы — единственный механизм сбора данных, способный фиксировать и хранить информацию о посещениях и поведении роботов поисковых систем на веб-сайте. Последние не выполняют дескрипторы JavaScript, а следовательно, не оставляют никаких следов для других механизмов сбора данных. Так, при необходимости проанализировать посещения роботами таких поисковых систем, как Google, MSN (Microsoft Network — сеть Microsoft), Yahoo и других, чтобы удостовериться в просмотре и правильности индексирования ими веб-сайта, придется использовать веб-журналы.
• При использовании веб-журналов данными располагает сам владелец веб-сайта. При большинстве других методик информацию будет фиксировать, обрабатывать и хранить
• Веб-журналы прежде всего предназначены для фиксации технической информации (ошибок 404, тенденций использования сервера, типов браузера и т.д.). Они не оптимальны для сбора деловой или маркетинговой информации.
• При необходимости фиксировать дополнительную маркетинговую и коммерческую информацию потребуется плотное взаимодействие с группой информационных технологий и полная зависимость от нее. Это несколько сложнее, чем у других механизмов сбора данных, так что переход на них оправдан.
• Если веб-сервер не устанавливает файлы cookie, идентификация посетителей с любой степенью точности крайне сомнительна.
• Веб-журналы создавались для фиксации всех обращений к серверу. Следовательно, при их использовании для получения точных тенденций трафика и поведения необходимо правильно отфильтровать запросы изображений, ошибки загрузки страниц, трафик роботов, запросы файлов
• Кеширование страниц провайдерами (ISP) и прокси-серверами может привести к тому, что некая часть трафика (порядка 10 процентов) окажется неучтенной, поскольку когда некто в сети ISP запрашивает ту же страницу, которую кто-то другой уже запрашивал до него, ISP передаст ее из своего кеша и не будет беспокоить веб-сервер. Следовательно, у владельца веб-сервера не появится в файле журнала запись об этом запросе.
К лучшему или нет, но в использование веб-журналов как источников данных для веб-анализа внесено не много новшеств. К веб-журналам следует обращаться для анализа поведения роботов поисковой системы, чтобы замерить успешность усилий по ее оптимизации. Для выполнения практически всех остальных типов веб-анализа, которые могут понадобиться, оптимальными будут другие механизмы сбора данных. Веб-журналы, в лучшем случае, можно использовать для дополнения данных, собранных с применением других методик, но будьте готовы к сложностям и большому количеству усилий.
Веб-маяки — это обычно прозрачные изображения размером 1x1 пиксель, которые помещают на веб-страницу при помощи дескриптора HTML img src. Прозрачные изображения, как правило, находятся на сервере стороннего исполнителя, отличном от сервера, содержащего веб-страницу.
Рис. 2.2 демонстрирует, как веб-маяки фиксируют данные.
Процесс протекает следующим образом:
1. Клиент вводит URL в браузере.
2. Запрос страницы поступает на один из веб-серверов.
Рис. 2.2. Как веб-маяки фиксируют данные
3. Веб-сервер посылает страницу клиенту наряду с запросом прозрачного изображения размером 1 х 1 пиксель, которое находится на сервере стороннего исполнителя.
4. При загрузке страницы она запрашивает изображение размером 1 х 1 пиксель, оповещая таким образом стороннего исполнителя о просмотре страницы.
5. Сервер стороннего исполнителя посылает изображение браузеру пользователя наряду с кодом, способным читать файлы cookie и собирать анонимные данные о посетителе, включая сам факт просмотра страницы, IP-адрес, время просмотра, файлы cookie, которые были установлены ранее, и т.д.
Вильям Л Саймон , Вильям Саймон , Наталья Владимировна Макеева , Нора Робертс , Юрий Викторович Щербатых
Зарубежная компьютерная, околокомпьютерная литература / ОС и Сети, интернет / Короткие любовные романы / Психология / Прочая справочная литература / Образование и наука / Книги по IT / Словари и Энциклопедии