Рассмотрим пример автоматизации генерации контента. Необходимо сгруппировать товарные категории на сайте, объединив похожие группы между собой по схожести качеств, характеристик и области применения. Так, например, в одну группу нужно объединить гидроциклы туристические, спортивные и стоячие. Для каждой группы необходимо составить перечень качеств, характеризующих товар, впоследствии на его основании мы будем формировать описания карточек товаров. Получаем из базы данных полную информацию о характеристиках, известных для всех моделей. При генерации можем использовать информацию из базы данных, формулы и словарные базы, составленные копирайтерами. Для каждой переменной отбираем возможные варианты содержания, после чего описываем варианты формул генерации контента для каждой группы. Для примера составим формулу на основании известных нам данных:
[Модель] + [Подкатегория] + [Число мест] + [Двигатель] + [Мощность] + [Корпус] + [Багажник] + [Оборудование] + [Цвет] + [Цена].
□ [Модель] = [Подкатегория] + [Товарная категория] + [Марка] + [Модель] –
□ [Подкатегория] = a1 + x1 – предназначен для агрессивного катания (a1 – словарная база, x1 – словарная база, зависит от значения подкатегории).
□ [Число мест] = а2 + х2 + b2 –
□ [Двигатель] = а3 – оборудован 4-тактным двигателем (а3 – словарная генерация, зависит от типа двигателя).
□ [Мощность] = с мощностью + х4 + b4 – с мощностью 260 л. с, что делает эту модель одной из самых резвых в линейке гидроциклов BRP.
□ [Корпус] = а5 + х5 + b5 + с5 – при производстве корпуса использовался композитный материал, прочный и надежный
□ [Багажник] = а6 + х6 + b6 – объем багажника 52 л, туда может поместиться что угодно.
□ [Оборудование] = [Модель] + а7 + x7n + a7n + x7m + a7m + x7l + a7l – оборудован электрическим стартером, на нем есть информационный центр, датчик топлива, незаменимый при длинных рейдах, спидометр, помогающий не разгоняться слишком быстро (в этом случае значение n, т, 1 выбирается рандомно из списка, к нему автоматически подставляются соответствующие словарные описания).
□ [Цвет] = а8 + х8 + b8 – гидроцикл выполнен в корпусе желтого цвета.
□ [Цена] = а9 + b9 + х9 – относится к премиум-классу, стоимость 769 000 руб.
Все словарные генерации описывает копирайтер. Он подбирает несколько вариантов определений или целых предложений так, чтобы они гарантированно сочетались друг с другом и вписывались в общее описание. Оптимизатор составляет несколько формул на каждый раздел, формулы могут предусматривать рандом как при заполнении элементов, так и при употреблении блоков. Например, можно менять их местами или использовать иногда. Количество формул и словарных генераций рассчитывается таким образом, чтобы каждый текст оказался уникальным более чем на 70 %, если мерить по пассажам, разбиваемым на предложения. Формулы тестируются на тестовом сайте, редактируются и выкладываются на основное зеркало. Рекомендуемый объем контента – более 500 знаков.
Наполнение больших каталогов
Каталоги позволяют быстро охватить большой пул низкочастотных запросов и собрать огромный низкочастотный трафик.
Идеальный вариант наполнения каталога – создание авторского текста и ручной подбор изображений для каждой страницы. На практике такой подход труднореализуем. Даже небольшой каталог из нескольких тысяч позиций потребует немалых вложений, а в случае с описанным ранее семантическим ядром для туристического портала стоимость каталога может превысить бюджет на продвижение портала за год. Таким образом, необходимость автоматического создания и наполнения каталога очевидна. Можно ли сделать это так, чтобы не попасть под санкции поисковых систем, и как этого добиться?
Как и многое другое, наполнение каталога должно быть поэтапным. Ранее мы рассматривали создание семантического ядра для туристического портала. Теперь расскажем о том, как его наполнить.
1. Создаются базы данных, которые и составят основу каталога. Пусть в нашем случае это будут базы стран, курортов, туров, гостиниц и, разумеется, связи между ними.
2. Разработка структуры каталога и соответствующей ему структуры URL. Необходимо, чтобы структура позволила охватить все запросы семантического ядра, была проста для навигации и удобна для обхода индексирующими роботами поисковых систем.