Sitemap.xml — это карта сайта, которую вы явно отдаёте поисковикам, говоря: «вот мои важные URL, индексируйте их в первую очередь». В отличие от robots.txt, который указывает что не нужно, Sitemap указывает что нужно. Поисковики не обязаны следовать ему буквально — это рекомендация, а не команда. Но хорошо настроенный sitemap ускоряет индексацию новых страниц на 30–60% и помогает поисковику правильно расставить приоритеты по большому сайту. В этой статье разберём, как проверить sitemap бесплатно через наш SEO-инструмент онлайн, и какие грабли подстерегают тех, кто настраивает его «на отвали».
Базовая проверка через валидатор
Откройте /tools/sitemap-validator и введите URL вашего sitemap (обычно domain.com/sitemap.xml). Инструмент сделает три проверки: первая — соответствие XML-схеме (нет ли битых тегов, правильно ли вложены элементы); вторая — доступность каждого URL внутри (отдают ли 200, или там есть 404 и редиректы); третья — корректность необязательных полей (lastmod должен быть в формате W3C datetime, priority в диапазоне 0.0–1.0). На выходе получите отчёт с подсветкой проблемных URL.
lastmod: главная боль большинства sitemap
Тег <lastmod> должен показывать реальную дату последнего изменения контента страницы. Большинство сайтов ставят сюда дату генерации sitemap — это категорически неправильно. Если все 10 000 URL у вас имеют lastmod = 2026-06-07, Google это видит и игнорирует: «они не знают, что меняется на самом деле». Правильно: для каждого URL ставить дату его последнего изменения. Для статей блога — дата последней правки. Для товаров — дата последнего изменения карточки. Для статичных страниц — дата создания. Если CMS не отдаёт эту инфу, лучше не ставить lastmod совсем, чем ставить фейковую.
Когда дробить sitemap на индекс и дочерние
Спецификация ограничивает один sitemap-файл 50 000 URL и 50 МБ размера (несжатый). Если у вас сайт меньше — один файл нормально. Если больше — нужен sitemap-index, а внутри несколько дочерних. Логика дробления должна соответствовать структуре сайта: sitemap-blog.xml для статей блога, sitemap-tools.xml для инструментов, sitemap-vs.xml для страниц сравнения. Это даёт два преимущества: первое — в Search Console вы видите статистику индексации отдельно по разделу («блог проиндексирован на 95%, товары на 60% — там проблема»); второе — поисковик быстрее обнаруживает обновления в одном разделе, не перечитывая весь sitemap.
hreflang в sitemap для двуязычных сайтов
Если у вас сайт на двух языках (например, /ru и /en версии), hreflang — обязательная разметка для Google. Один из способов — указывать её прямо в sitemap через xhtml:link rel="alternate". Это удобнее, чем прописывать в head каждой страницы, особенно для больших сайтов. Пример: для страницы /ru/blog/post-1 в sitemap указываете <xhtml:link rel="alternate" hreflang="en" href="https://domain.com/en/blog/post-1" />. Наш валидатор проверяет: указаны ли hreflang для всех языковых вариантов, корректные ли коды (ru, en, en-US, x-default), не битые ли URL альтернатив.
Что не должно попадать в sitemap
- URL с параметрами (?utm_source=...) — это дубли с точки зрения поиска.
- URL с noindex — если страница не должна индексироваться, она не должна попадать в карту.
- URL с 404 и 410 — мёртвые страницы в sitemap раздражают поисковик.
- URL с редиректом — указывайте сразу конечный URL, а не промежуточный.
- Дубликаты — один и тот же URL в нескольких дочерних sitemap.
- URL с canonical на другую страницу — нет смысла индексировать дубль.
submitted-to-indexed ratio
Один из самых полезных показателей для оценки качества sitemap — это отношение «отправлено к проиндексировано» в Google Search Console. Если в sitemap 10 000 URL, а Google в индексе только 4 000 — это плохо. Норма — 80%+. Низкий ratio означает одну из трёх вещей: вы пихаете в sitemap URL, которые Google не хочет индексировать (тонкий контент, дубли); у вас технические проблемы (медленный сервер, 5xx ошибки на обходе); страницы плохо связаны внутри сайта (orphan pages). Site Metrics Tool отслеживает этот ratio автоматически и алертит, если он упал больше чем на 10 процентных пунктов за неделю.
Связь sitemap с rank-трекингом
Когда вы используете Site Metrics Tool для мониторинга позиций, мы автоматически тянем ваш sitemap раз в сутки и сравниваем с фактическими URL, которые показываются в SERP для ваших ключевых слов. Это даёт критически важный сигнал «вы пытаетесь ранжировать /products/special, а Google показывает /blog/special» — то есть у вас каннибализация между двумя страницами под один интент. Без интеграции с sitemap эту проблему ловить нужно вручную, тратя часы на анализ Search Console.
Частые вопросы
Нужно ли отправлять sitemap в Search Console руками каждый раз?
Достаточно одного раза. После первой отправки Google будет проверять sitemap по своему расписанию (обычно ежедневно). Указание Sitemap: в robots.txt тоже автоматизирует обнаружение.
Можно ли использовать .xml.gz?
Да, поисковики поддерживают gzip-сжатые sitemap. Это уменьшает размер файла, что полезно для больших сайтов. Ограничение в 50 МБ относится к несжатому размеру, не к gzip.
Картинки и видео нужны в sitemap?
Опционально. Image sitemap помогает поисковику обнаружить картинки, особенно если они в lazy-load и не видны при первом рендере HTML. Video sitemap — для сайтов с большим количеством видеоконтента. Для среднего блога обычно не нужны.
Что делать, если sitemap больше 50 МБ?
Разделить на несколько дочерних и сделать sitemap-index. Один индекс может ссылаться на 50 000 дочерних sitemap — практически безлимит для любого реалистичного размера сайта.