ТЗ для программиста: sitemap.xml ayurtour.ru

📅 14 апреля 2026 🌐 ayurtour.ru (Bitrix) ⏱️ Оценка: 2-4 часа

📋 Содержание

  1. Контекст задачи
  2. 🔥 Критичная проблема — 404 в sitemap
  3. Задачи по шагам
  4. Вопросы для уточнения
  5. Как должно работать (наши пожелания)
  6. Чеклист готовности

1. Контекст задачи

✅ Отличная работа! После зависания агента Bitrix 24488 с 02.02.2026 — sitemap.xml снова генерируется. Последнее обновление: 14.04.2026 21:20:45. Это главное.

Текущее состояние

ФайлURL-овСвежая lastmodФормат
/sitemap.xml (index)15 карт2026-04-14 21:20sitemapindex
/sitemap-iblock-6.xml5762026-03-12✅ ЧПУ /news/...
/sitemap-iblock-52.xml~1000+2024-12-17⚠️ iblock «Текст для сео-страниц» (SEO_DESCRIPTIONS) — мета-контент, не страницы
/all/sitemap.xml21042026-04-14Наш (отдельный)

2. 🔥 Критичная проблема — 404 в sitemap

В sitemap-iblock-52.xml ~1000 URL старого формата /info/detail.php?ID=XXX. Выборочная проверка показала: они отдают 404.

Проверено вручную:

URLОтвет
info/detail.php?ID=52143404
info/detail.php?ID=59788404

Последствия

⚠️ ВАЖНО — не путать iblock-52 с iblock-32

iblock-32 — это НЕ мусор, его трогать нельзя!

ИнфоблокURL-овЧто тамДействие
iblock-327Программы аюрведы (ЧПУ, 200 OK): очищение, похудение, анти-эйджОСТАВИТЬ
iblock-5128⚠️ Сезонные landing pages (/all/winter/, /all/jan/ и т.д.) — часть 200, часть пустые (0 туров → 404)ПОЧИСТИТЬ
iblock-521000+Текст для сео-страниц (SEO_DESCRIPTIONS) — мета-контент, все URL 404УБРАТЬ

Примеры URL из iblock-32 (НЕ удалять!):

/ayurveda/programmy/programmy-ochishcheniya-omolozheniya/
/ayurveda/programmy/programmy-snizheniya-vesa/
/ayurveda/programmy/antivozrastnye-programmy/

📌 Если клиент вчера что-то отключал в админке — проверь, что iblock-32 (программы) остался активным в sitemap. Сейчас он в карте (7 URL, свежая lastmod) — значит всё норм. Но на всякий случай убедись, что именно он не выключен в настройках.

📋 Полная карта всех 15 инфоблоков (результаты аудита 14.04.2026)

iblockURLsРазделСтатусДействие
files121Главные разделы (/india/, /ayurveda/)✅ 200Оставить
6576/news/ — новости✅ 200 ЧПУОставить
8174Страны/регионы (/india/goa/, /shri-lanka/)✅ 200 ЧПУОставить
9573/places/ — достопримечательности✅ 200 ЧПУОставить
18414/hotels/ — отели✅ 200 ЧПУОставить
2069/tours/ — туры✅ 200 ЧПУОставить
2121/visa/ — визы✅ 200 ЧПУОставить
2477/ayurtours/ — аюрведа-туры✅ 200 ЧПУОставить
2851/ayurveda/procedury/✅ 200 ЧПУОставить
301100+/articles/ — статьи✅ 200 ЧПУОставить
3160/spravochnik/✅ 200 ЧПУОставить
327/ayurveda/programmy/✅ 200 ЧПУОСТАВИТЬ
33404/states/ — штаты✅ 200 ЧПУОставить
5128Сезонные landing (/all/winter/, /all/jan/)⚠️ СмешанноПОЧИСТИТЬ — только те, где COUNT(туров) > 0
521000+SEO_DESCRIPTIONS (мета-контент)❌ 404УБРАТЬ

📍 Итого: 13 инфоблоков работают корректно, нужно почистить 2 (iblock-51 и iblock-52).

3. Задачи по шагам

Приоритет: Высокий

Почистить iblock-52 от 404

Что сделать:

  1. Зайти в Админка Bitrix → Настройки → Поисковая оптимизация → Настройки sitemap.xml
  2. Найти настройку для инфоблока с ID=52 (или узнать, какой это модуль — возможно старый /info/)
  3. Проверить: агент берёт элементы с ACTIVE=Y или все подряд?
  4. Если берёт все — добавить фильтр ACTIVE=Y
  5. Если iblock 52 — это legacy (старый модуль новостей до перехода на ЧПУ) — полностью исключить его из sitemap
  6. После фикса — вручную запустить генерацию и проверить, что 404-URL пропали

Как проверить результат:

# открыть в браузере
https://www.ayurtour.ru/sitemap-iblock-52.xml

# либо через curl (проверка 5 случайных URL)
curl -I "http://www.ayurtour.ru/info/detail.php?ID=52143"
# должно быть: 404 Not Found → таких URL в sitemap БЫТЬ НЕ ДОЛЖНО
Приоритет: Высокий

Настроить автообновление sitemap

Что сделать:

  1. Убедиться, что агент Bitrix 24488 (Bitrix\Seo\Sitemap\Job::doJobAgent) работает и не "зависнет" снова
  2. Либо настроить внешний cron (через Beget), который раз в сутки дёргает переcборку
  3. Желательно: добавить алерт — если lastmod старше 48 часов, слать уведомление (email/Telegram)

Варианты реализации cron (на выбор):

# Вариант А — через URL (как мы уже делали с sitemap_rebuild.php)
# В панели Beget → Cron:
0 3 * * * /usr/bin/curl -s "https://www.ayurtour.ru/local/tools/sitemap_rebuild.php?token=XXX" > /dev/null

# Вариант Б — через CLI агента Bitrix (если удастся настроить путь)
# Пробовали раньше — не работает из-за виртуальных путей Bitrix VM

Какой вариант выбрать — реши сам, расскажи нам что настроил.

Приоритет: Средний

Объединить наш /all/sitemap.xml с главным sitemap-index

Контекст: у нас есть отдельный sitemap /all/sitemap.xml (2104 URL) — он делался для новых разделов, которые Bitrix агент не умеет включать автоматом.

Что сделать:

  1. Открыть главный /sitemap.xml (sitemapindex)
  2. Добавить запись:
    <sitemap>
      <loc>https://www.ayurtour.ru/all/sitemap.xml</loc>
      <lastmod>2026-04-14</lastmod>
    </sitemap>
  3. Если Bitrix агент перезаписывает sitemap.xml при каждой генерации — сделать так, чтобы эта запись сохранялась (либо настройка в админке, либо кастомный обработчик)

Зачем: чтобы Google/Яндекс находили все карты через один URL, а не два отдельных.

Приоритет: Средний

Настроить 301 редиректы со старых URL

Контекст: в старом формате /info/detail.php?ID=XXX хранился контент, который уже перенесён на ЧПУ вроде /news/india/.... Надо, чтобы старые URL (если ещё в индексе Google) вели на новые.

Что сделать:

  1. Выгрузить из БД mapping: старый ID → новый ЧПУ URL
  2. Добавить 301 редиректы через .htaccess или модуль редиректов Bitrix
  3. Тестово проверить 5-10 случайных: curl -I -L "http://www.ayurtour.ru/info/detail.php?ID=..." → должен быть 301 → 200

Если mapping не сохранился — задача опциональна (Google сам отвалит 404 через 3-6 месяцев).

Приоритет: Низкий

Документация — зафиксировать что сделано

Что сделать:

  1. Описать, почему завис агент 24488 и как ты его разблокировал (чтобы в следующий раз мы знали, куда смотреть)
  2. Описать, какие инфоблоки включены в sitemap и какие исключены (и почему)
  3. Описать cron / агент автообновления — где настроен, с какой частотой, куда логируется
  4. Прислать текст — мы сохраним в базу знаний проекта

4. Вопросы для уточнения

Пожалуйста, ответь на эти вопросы — они важны для понимания текущего состояния:

#Вопрос
1Автообновление: будет ли sitemap обновляться сам? Какой cron/агент настроен, с какой частотой?
Если вручную — каждый раз придётся дёргать.
2Фикс зависания: какой именно фикс сделал, чтобы агент 24488 ожил? На случай, если ситуация повторится.
3Наш /all/sitemap.xml: включён в главный sitemap-index или живёт отдельно? Если отдельно — добавить (см. задача 3).
4Фильтр активности: агент берёт элементы ACTIVE=Y или все подряд? Связано с 404 в iblock-52.
5301 редиректы: есть ли уже со старых /info/detail.php?ID на новые ЧПУ? Если нет — задача 4.
6Мониторинг: есть ли алерт/лог на случай, если агент снова зависнет?

5. Как должно работать (наши пожелания)

🎯 Итоговая картина, к которой идём

📊 Что будем мониторить со своей стороны

6. Чеклист готовности

Когда всё сделаешь — пройдись по этому списку и отметь: