Sitemap без помилок для сайту: складаємо правильно
Спочатку розберемося, що таке файл Sitemap і для чого він потрібен.
Карта сайту інформує пошукові системи про готові до сканування сторінки сайту. Sitemap — XML-файл з URL-адресами ресурсу і відповідними метаданими про кожну.
Пошуковий бот і сам здатний просканувати сторінки вашого ресурсу, але завдяки настройці sitemap.xml стає можливим:
- сторінки з урахуванням пріоритетів;
- виявити періодичність оновлення сторінок, дізнатися, які з них нові і точно потребують індексації;
- обчислити час здійснення змін в проіндексованих сторінках;
- виконати індексацію всіх нових сторінок, нічого не загубивши.
Без sitemap робот може пропустити важливі сторінки.
Незважаючи на те, що карта дасть роботу можливість відшукати всі сторінки, є ймовірність зіткнутися з іншими складнощами:
- індексації можуть перешкодити інші фактори, наприклад, технічні неполадки;
- пошукова система може визнати сторінку недостатньо якісною, щоб потрапити в пошук.
Для великого сайту формується більш одного файлу Sitemap з їх об'єднанням файлом індексу Sitemap:
Руками вводити величезну кількість посилань навряд чи здасться цікавою ідеєю, тому передбачена можливість пакетного запису URL через API.
Атрибут hreflang і альтернативні назви в XML взаємовиключні — допустимо використання одного з них, чого найчастіше для пошукача досить.
Приклад. У ресурсу http://example.com/ru/ є україномовна, російськомовна та англомовна версії:
Види Sitemap
SitemapXML
У текстовому файлі формату XML перераховані всі обов'язкові до індексування сторінки ресурсу з урахуванням їх підпорядкованості. В xml sitemap допустимо позначення до 50 тисяч посилань. Файли важче 50 МБ потрібно архівувати, дотримуючись розширення xml.zip або xml.tar, також є варіант формування декількох карт шляхом збору їх в групу. Посилання з карти сайту повинні вказувати на повний шлях до файлу, як тут http://www.example.com/.
Перший рядок документа повинна містити версію xml, а також кодування — UTF-8.
У Sitemap.xml застосовуються особливі теги:
До речі, теги
HTML Sitemap
Формування карти в HTML-форматі в основному здійснюється для користувачів, це сторінка, де показані гіперпосилання на всі сторінки веб-сайту. Але при цьому HTML Sitemap сприяє прискоренню індексації та скороченню глибини деяких сторінок зменшенням числа кліків від головної до цільової сторінки. Для карти в вигляді html-сторінки є строгі обмеження по числу посилань на одній сторінці. При наявності занадто великої кількості посилань пошуковий бот може проіндексувати тільки частину з них або зовсім виключити сторінку Sitemap з пошуку за надлишок посилань, в тому числі внутрішніх. Не рекомендується розміщувати більше ста штук на сторінці.
Image Sitemap
Щоб картинки сайту опинилися в індексі, потрібно створити для них Image Sitemap. Цю карту можна розмістити в Sitemap.xml, заповнивши в robots.txt відповідний рядок. Для маленьких сайтів з незмінним числом зображень допустимо прописування карти вручну. При роботі з великим ресурсом рекомендується скористатися додатком. Зауважте, що в Image Sitemap застосовуються теги замість посилань на картинки:
При написанні карти зображень сайту можна вказувати до тисячі графічних об'єктів для кожної його сторінки.
Video Sitemap
Для поліпшення сканування і ранжування пошуковими ботами відео-контенту слід створювати карту сайту Video Sitemap. Індексація відео-контенту Яндексом поки не пов'язана з файлами sitemap.
News Sitemap для Google
Якщо основне призначення вашого сайту — публікація новин, можна налаштувати динамічну генерацію карти з оновленням за графіком, найчастіше раз в день. Ці функції працюють тільки для ресурсів, підключених до Google Новин і при їх підключенні в sitemap можна додавати урли тільки статей, опублікованих протягом 48 годин. Більш ранні публікації можна видаляти — вони будуть зберігатися в індексі Гугл ще місяць.
В одній карті сайту може бути не більше 1000 посилань, але якщо ви плануєте публікувати більше новин за дві доби, можна створити кілька файлів індексу sitemap. Правда згенерувати їх автоматично не вийде — інструмент Гугл проіндексує всі урли, а не тільки новини.
Теги:
Висновок
Карта сайту відноситься до ключових моментів SEO оптимізації. Існують різні види Sitemap, які слід використовувати, виходячи з параметрів свого сайту. Немає необхідності збирати карту вручну, адже є безліч плагінів і модулів. Однак наявність карти не зобов'язує ботів сканувати всі зазначені в ній URL, а лише полегшує для них цей процес. Будьте уважні при виборі посилань для Sitemap, не забувайте її оновлювати, і карта сайту буде вам служити з користю.