Sitemap без ошибок для сайта: составляем правильно

1570
5 мин.

Вначале разберемся, что такое файл Sitemap и для чего он нужен.

Карта сайта информирует поисковые системы о готовых к сканированию страницах сайта. Sitemap — XML-файл с URL-адресами ресурса и соответствующими метаданными о каждом.

Поисковый бот и сам способен просканировать страницы вашего ресурса, но благодаря настройке sitemap.xml становится возможным:

  • сортировать страницы с учетом приоритетов;
  • выявить периодичность обновления страниц, узнать, какие из них новые и точно нуждаются в индексации;
  • вычислить время осуществления изменений в проиндексированных страницах;
  • выполнить индексацию всех новых страниц, ничего не упустив.

Без sitemap робот может пропустить важные страницы.

Несмотря на то, что карта даст роботу возможность отыскать все страницы, есть вероятность столкнуться с другими сложностями:

  • индексации могут помешать другие факторы, к примеру, технические неполадки;
  • поисковик может признать страницу недостаточно качественной, чтобы попасть в поиск.

Общие советы по файлам Sitemap из справки Гугл:

Для крупного сайта формируется более одного файла Sitemap с их объединением файлом индекса Sitemap:

Руками вводить огромное число ссылок вряд ли покажется интересной затеей, поэтому предусмотрена возможность массовой отправки URL через API.

Атрибут hreflang и альтернативные названия в XML взаимоисключающие — допустимо использование одного из них, чего чаще всего для поисковика достаточно.

Пример. У ресурса http://example.com/ru/ есть украиноязычная, русскоязычная и англоязычная версии:

Виды Sitemap

Sitemap XML

В текстовом файле формата XML перечислены все обязательные к индексированию страницы ресурса с учетом их подчиненности. В xml sitemap допустимо обозначение до 50 тысяч ссылок. Файлы тяжелее 50 МБ нужно архивировать, соблюдая расширение xml.zip или xml.tar, также есть вариант формирования нескольких карт путем сбора их в группу. Ссылки из карты сайта должны указывать на полный путь файла, как здесь: http://www.example.com/.

Первая строка документа должна содержать версию xml, а также кодировку — UTF-8.

В Sitemap.xml применяются особые теги:

К слову, теги < changefreq>, < priority> игнорируются Google. Но Yandex рекомендует их к использованию.

HTML Sitemap

Формирование карты в HTML-формате первоначально осуществляется для юзеров, это страница, где показаны гиперссылки на все страницы веб-сайта. Но при этом HTML Sitemap способствует ускорению индексации и сокращению глубины некоторых страниц уменьшением числа кликов от главной до целевой страницы. Для карты в виде html-страницы есть строгие ограничения по числу ссылок на одной странице. При наличии слишком большого количества ссылок поисковый бот может проиндексировать только часть из них либо совсем исключить страницу Sitemap из поиска за переизбыток ссылок, в том числе внутренних. Не рекомендуется размещать больше ста штук на странице.

Image Sitemap

Чтобы картинки сайта оказались в индексе, требуется создать для них Image Sitemap. Эту карту можно разместить в Sitemap.xml, заполнив в robots.txt соответствующую строку. Для маленьких сайтов с неизменным числом изображений допустимо прописывание карты вручную. При работе с крупным ресурсом рекомендуется воспользоваться приложением. Заметьте, что в Image Sitemap применяются теги вместо ссылок на картинки:

При написании карты изображений сайта можно указывать до тысячи графических объектов для каждой его страницы.

Video Sitemap

Для улучшения сканирования и ранжирования поисковыми ботами видео-контента следует создавать карту сайта Video Sitemap. Индексация видео-контента Яндексом пока не связана с файлами sitemap.

News Sitemap для Google

Если основное назначение вашего сайта — публикация новостей, можно настроить динамическую генерацию карты с обновлением по графику, чаще всего раз в день. Эти функции работают только для ресурсов, подключенных к Google Новости и при их подключении в sitemap можно добавлять урлы только статей, опубликованных в течение 48 часов. Более ранние публикации можно удалять — они будут храниться в индексе Гугл еще месяц.

В одной карте сайта может быть не более 1000 ссылок, но если вы планируете публиковать больше новостей за двое суток, можно создать несколько файлов индекса sitemap. Правда сгенерировать их автоматически не получится — инструмент Гугл проиндексирует все урлы, а не только новости.

Теги:

Заключение

Карта сайта относится к ключевым моментам SEO оптимизации. Существуют разные виды Sitemap, которые следует использовать, исходя из параметров своего сайта. Нет необходимости собирать карту вручную, ведь есть множество плагинов и модулей. Однако наличие карты не обязывает ботов сканировать все указанные в ней URL, а лишь облегчает для них этот процесс. Будьте внимательны при выборе ссылок для Sitemap, не забывайте ее обновлять, и карта сайта будет вам служить с пользой.

12 мая 2021
3.5 / 5 (8 голосов)