Главная проблема SEO — не знаешь, что реально работает. Вы переписали title 50 страниц, через 2 недели позиции выросли — это потому что переписали title, или Google выкатил core update, или конкуренты лажают, или сезонность? В отличие от рекламы, где можно сделать классический A/B-тест с splittraffic, в SEO trafficsplit невозможен (Google нельзя отдавать разные версии страницы — это cloaking). Поэтому методика SEO A/B-тестирования другая: вы делите страницы на похожие группы, на одной группе делаете правку, на другой — нет, и сравниваете динамику. В этой статье разберём, как корректно проводить такие эксперименты.
Что можно SEO-тестировать
- Title и meta description — переписать на части страниц, оставить старые на остальных.
- Структура заголовков (H1, H2) — переработать на половине статей.
- Длина и формат контента — расширить статьи в одной группе, оставить как было в контрольной.
- Добавление FAQ-блока + FAQPage JSON-LD на половину страниц.
- Внутренние ссылки — добавить контекстуальные ссылки в группу А, не трогать группу B.
- Скорость загрузки — оптимизировать LCP на части шаблонов.
Как разделить страницы на группы
Ключевая ошибка — взять «10 случайных страниц» в тестовую группу. Если страницы разные по теме, аудитории, конкуренции — статистики не получите. Правильный подход: подобрать пары страниц с похожими характеристиками. Например, две категории «смартфоны» и «планшеты» с похожим количеством товаров, похожим текущим трафиком и позициями. В первой делаете изменение, во второй — нет. Через 4–6 недель сравниваете дельту. Минимальный размер групп для статистики — 20–30 пар. Меньше — слишком шумно, результат может быть случайностью.
Длительность эксперимента
Минимум 4 недели, оптимально 6–8 недель. Меньше — поисковик не успевает переоценить страницу: индексация + пересчёт сигналов занимают 2–3 недели. Больше — сложно изолировать эффект, потому что наслаиваются другие факторы (core update, сезонность, действия конкурентов). Идеально: 6 недель эксперимента + ещё 2 недели «отстоя», чтобы убедиться, что эффект стабилен, а не разовый всплеск.
Какие метрики смотреть
Главная метрика — клики из GSC (для Google) и Вебмастера (для Яндекса). Не просто позиции, а именно клики — это реальный сигнал того, что страница работает лучше. Дополнительно: показы (impressions), средняя позиция, CTR. Считаете дельту по тестовой группе и по контрольной. Если в тестовой клики выросли на 25%, а в контрольной — на 5% (что может быть просто общий сезонный рост), значит правка дала +20% эффекта. Если в обеих группах выросло одинаково — правка ничего не дала, эффект был от внешних факторов.
Типовые ошибки в SEO A/B-тестах
- Слишком маленькая выборка — 5–10 страниц не дают статистики, результат случаен.
- Нет контрольной группы — без сравнения непонятно, эффект от правки или от внешних факторов.
- Тестовая и контрольная группа разные по характеристикам — сравниваете несравнимое.
- Слишком короткое окно эксперимента — поисковик не успел переоценить.
- Параллельное внесение нескольких изменений — нельзя определить, какое сработало.
Практический пример эксперимента
Гипотеза: добавление FAQ-блока внизу статьи блога повышает позиции по long-tail запросам. Эксперимент: выбираем 40 статей с похожим трафиком (200–500 кликов в месяц). Делим случайно на 2 группы по 20. В первой группе добавляем FAQ с 5–7 вопросами + JSON-LD FAQPage. Контрольная остаётся без изменений. Длительность — 6 недель. Метрика — клики на long-tail (>5 слов) запросы. Через 6 недель видим: в тестовой группе клики на long-tail выросли в среднем на 34%, в контрольной — на 8%. Чистый эффект +26%. Гипотеза подтверждена, FAQ-блок раскатываем на все остальные 200 статей.
Частые вопросы
Нужны ли специальные инструменты для SEO A/B-тестов?
Желательны. Site Metrics Tool позволяет тегировать страницы (test/control), и тогда дашборд автоматически считает дельты для каждой группы. Без специализированного инструмента можно через GSC + Excel, но это занимает 3–4 часа на анализ каждого эксперимента.
Сколько A/B-тестов в год имеет смысл проводить?
Для одной команды 4–8 экспериментов в год — реалистично. Каждый занимает 6–8 недель чистого времени и месяц подготовки. Больше не имеет смысла — пересекаются эффекты, теряется контроль.
Что делать, если результат на грани статистической значимости?
Продлите эксперимент на 2–4 недели или увеличьте выборку. Если после расширения всё ещё «на грани» — эффект, скорее всего, слабый и не стоит масштабирования. Лучше проверить другую гипотезу.