🚨 КРИТИЧНО: Soft 404 на 144 страницах + дубли title/description

📅 14.04.2026 🌐 ayurtour.ru 🔴 Приоритет: ВЫСШИЙ ⏱️ Оценка: 3-5 дней

⚡ Главное в одной фразе

144 важнейших страницы сайта (регионы, курорты) отдают HTTP 200 OK, но показывают контент шаблона «404 Not Found». Поисковики видят их как живые и индексируют с пустым содержимым. Это делает бесполезными целые разделы: /india/kerala/, /india/goa/, /maldivi/male/, /shri-lanka/bentota/ и ещё 140+.

1. Доказательство проблемы

Что мы видим в live-проверке

URLHTTP кодTitle в HTMLПоследствие
/india/kerala/🟢 200 OK🔴 «404 Not Found»Нет в топе по «аюрведа керала» (459 WS)
/india/goa/🟢 200 OK🔴 «404 Not Found»Потерян трафик «туры в Гоа»
/maldivi/male/🟢 200 OK🔴 «404 Not Found»Потерян трафик «Мале Мальдивы»
... и ещё 141 URL с точно такой же проблемой

Как проверить самому

# curl возвращает HTTP 200, но в HTML title — "404 Not Found"
curl -I https://www.ayurtour.ru/india/kerala/      # HTTP/2 200
curl -s https://www.ayurtour.ru/india/kerala/ | grep title    # <title>404 Not Found</title>

2. Откуда данные

Полная выгрузка Screaming Frog (11.04.2026), файлы лежат в /seo-audit/Screaming Frog audit 11042026/:

ФайлURL-овЧто внутри
title_дубликаты.csv144Все страницы с одинаковым title (преимущественно «404 Not Found»)
description_дубликаты.csv16Дубли описаний
h1_дубликаты.csv26Дубли H1
контент_близкие_дубликаты.csv5442Близкие дубли контента — похоже параметрические URL
ссылки_soft_404.csv?Мягкие 404 — проверить отдельно

Данные Яндекс.Вебмастера (скриншот) показывают: 98 title + 67 description дублей. SF показывает больше (144) — это полнее. Работаем по SF.

3. ТОП-паттерны дублей из Яндекс.Вебмастера (за 05.03–05.04.2026)

Данные выгружены из Яндекс.Вебмастера. Показывают реальные title/description и на скольких страницах они дублируются:

СтраницTitle (дубль)ПричинаДействие
16"404 Not Found"Soft 404 на регионах🔥 Починить HTTP-код (см. шаги 1-3)
10"АЮРВЕДА ТУР"Главные страницы разделов без titleДать каждому разделу свой title
8"Туроператор Аюрведа-Тур предлагает туры и отели в Индии, Шри-Ланке, Бали, Мальдивах."Дефолтный шаблон BitrixНастроить автогенерацию
5"Аюрведические процедуры в комплексных программах аюрведы"Дубль на странице /процедуры/Уникализировать в шаблоне
3"Индия"Слишком общийРасширить: «Индия — туры, визы, аюрведа»
Всего 164 уникальных title с дублями на 1-16 страниц каждый

🔥 Главный инсайт из поисковых запросов

«Виза в Индию» — 17,357 показов в месяц, но только 3 клика (CTR 0.02%). Средняя позиция 7.98 (1-я страница Яндекса).

4. Задачи по шагам

Высший

Диагностика — найти корень soft 404

Почему Bitrix отдаёт HTML «404 Not Found» с кодом 200? Варианты:

Что сделать:

  1. Открыть любой URL из списка (например /india/kerala/) через админку Bitrix
  2. Понять, какой компонент рендерит страницу
  3. Найти, где он решает «показать 404 content» и отдаёт код 200
  4. Задокументировать найденную причину (понадобится для всех 144 страниц)
Высший

Решение по каждой категории URL

Делим 144 URL на группы по назначению:

ГруппаПримерЧто делать
Регионы Индии/india/kerala/, /india/goa/Заполнить контентом — это ТОП-страницы для SEO
Регионы Шри-Ланки/shri-lanka/bentota/Заполнить или удалить
Мальдивы атоллы/maldivi/atoll-ari/Заполнить базовым описанием
Городки Индии/india/pondicherri/Решить: оставить (заполнить) или удалить (301)

Два варианта решения:

Владелец сайта решает по каждой группе. По умолчанию: Керала/Гоа/Мале — заполнить, остальное — на усмотрение.

Высший

Починить HTTP-код для настоящих 404

Если страница ДОЛЖНА быть 404 — она должна отдавать HTTP 404, а не 200 с 404-контентом.

Что сделать:

  1. В компоненте / шаблоне: если данных нет → header("HTTP/1.1 404 Not Found"); \\CHTTP::SetStatus("404 Not Found");
  2. Проверить каждую страницу: curl -I URL → должно быть 404, а не 200
  3. Добавить в robots.txt шаблоны мусорных URL (если есть)
Средний

Разобраться с 5442 близкими дублями контента

Screaming Frog нашёл 5442 URL с близким контентом. Это большое число. Вероятные причины:

Что сделать:

  1. Открыть файл контент_близкие_дубликаты.csv
  2. Сгруппировать по паттернам URL
  3. Решение по каждому паттерну: canonical, 301, noindex или исключить из sitemap
Средний

Настроить автогенерацию уникальных title/description

В Bitrix для каждого раздела / страницы должны быть:

Как реализовать в Bitrix:

// В шаблоне раздела — автогенерация если вручную не задано
$APPLICATION->SetPageProperty("title", $arResult["NAME"] . " — туры и отдых | Аюрведа-Тур");
$APPLICATION->SetPageProperty("description", "Полный гид по " . $arResult["NAME"] . ": отели, программы аюрведы, цены от 1500$. Подбор тура бесплатно.");
Низкий

Мониторинг после фикса

  1. Через 1 неделю — перепрогнать Screaming Frog, сравнить число дублей
  2. В Яндекс.Вебмастер — посмотреть уменьшение дублей
  3. В GSC — раздел «Индекс» → «Индексировано, но не отправлено»
  4. Мониторить позиции по топ-ключам (аюрведа керала, туры в Гоа) — ожидаем рост

4. Приоритизация страниц для заполнения контентом

Если выбирать, что заполнять первым — смотрим по Keys.so данным (трафиковый потенциал):

URLWS/месПриоритет
/india/kerala/459 «аюрведа керала»🔥 #1
/india/goa/~200 «туры в Гоа»🔥 #2
/maldivi/male/~100 «Мале туры»🟡 #3
/shri-lanka/bentota/50-80 «Бентота туры»🟡 #4
Остальные регионы/курорты0-50🟢 #5

Контент для заполнения — задача копирайтера + SEO (отдельное ТЗ, не этот ТЗ). Программисту — только починить soft 404.

5. Чеклист готовности

6. Вопросы к клиенту

  1. Регионы, которые мы НЕ продаём (например, какие-то городки) — какие удалить, какие заполнить?
  2. Источник контента — кто будет писать описания для регионов? Копирайтер есть?
  3. Шаблон страницы региона — один универсальный или разный под Индию / Шри-Ланку / Мальдивы?