При знайомстві з проектом SEO-фахівець обов'язково вводить в адресний рядок пошуковика фразу "sitemap.xml". Аналіз карти сайту дозволяє з'ясувати, чому не індексується той чи інший контент.
Що таке XML-картка
XML-карта сайту - файл з інформацією для пошукових систем про сторінки, які необхідно проіндексувати. Іншими словами, карта сайту – список усіх сторінок у форматі XML, доступних для сканування пошуковим роботом. При цьому варто відрізняти XML-карту від звичайної картки сайту, яка знаходиться за адресою https://site.com/sitemap/.
За допомогою XML-карток визначається:
- місцезнаходження сторінок сайту;
- час останнього оновлення кожної зі сторінок;
- частота (періодичність) оновлення та важливість щодо інших сторінок сайту;
- важливість (пріоритетність) сторінок у структурі.
З яких елементів складається карта XML
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2017-02-05</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.example.com/sitemap1.xml</loc>
</sitemap>
<sitemap>
<loc>https://www.example.com/sitemap2.xml.</loc>
</sitemap>
</sitemapindex>
XML-карта для зображень
<image:image> | Містить всю інформацію про одне зображення. Кожен URL (тег <loc>) може містити до 1000 тегів <image:image>. |
<image:loc> | URL-зображення. |
<image:caption> | Підпис до зображення. |
<image:geo_location> | Місце зйомки (країна, місто, тощо) |
<image:title> | Назва зображення. |
<image:license> | URL ліцензії зображення. |
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="https://www.google.com/schemas/sitemap-image/1.1">
<url>
<loc>https://example.com/page.html</loc>
<image:image> <image:loc>https://example.com/pic1.jpg</image:loc> </image:image>
<image:image> <image:loc>https://example.com/pic1.jpg</image:loc> </image:image>
</url>
</urlset>
XML-карта для відео
- назву;
- опис,
- тривалість;
- мініатюру і таке інше.
- <loc> - сторінка, де знаходиться відео;
- <video:title> - назва відео, до 100 символів;
- <video:player_loc> – місце розташування плеєра для відео;
- <video:content_loc> - місце розташування конкретного відео;
- <video:thumbnail_loc> - прев'ю (мініатюра) відео, не менше ніж 120х90 px;
- <video:video> - контейнер для опису відео;
- <video:description> - опис відео, до 2000 символів.
- <video:duration> - тривалість відео, до 8 годин, пишеться в секундах;
- <video:category> - категорія відео, наприклад, техніка;
- <video:uploader> - ім'я людини (компанії), яка додала відео. Дозволяється вказати одне ім'я для файлу;
- <video:requires_subscription> — Вказує, чи потрібна для перегляду відео підписка. Як платна, і безкоштовна, з доступними значеннями: yes, no;
- <video:publication_date> — дата публікації у форматі YYYY-MM-DD або YYYY-MM-DDThh:mm:ss+TZD;
- <video:family_friendly> — тут вказується, чи відео може бути доступним для безпечного пошуку чи ні;
- <video:restriction> — список країн, де відео може відтворюватися або не відтворюватися. Допустимі значення – коди країн у форматі ISO 3166. Для кожного відео може відображатися лише один тег <video: restriction>. Якщо тег <video: restriction> відсутній, передбачається, що можна відтворювати відео на всіх територіях;
- <video:gallery_loc> - посилання на галерею;
- <video:expiration_date> — дата та час, коли відео стає неактуальним;
- <video:price> — вартість із зазначенням валюти у форматі ISO 4217;
- <video:tag> - теги відео;
- <video:view_count> - кількість переглядів відео;
- <video:rating> - рейтинг відео (від 0 до 5);
- <video:platform> - список майданчиків, де відео може відтворюватися та не відтворюватися. Доступні значення: web, mobile, tv. За відсутності тега передбачається, що відео можна відтворювати на всіх платформах;
- <video:live> — вказує на те, чи є відео прямою трансляцією (live). Доступні значення: yes, no.
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:video="https://www.google.com/schemas/sitemap-video/1.1">
<url>
<loc>https://www.example.com/videos/video_1.html</loc>
<video:video>
<video:thumbnail_loc>https://www.example.com/thumbs/video_1.jpg</video:thumbnail_loc>
<video:title>Обзор смартфона Xiaomi Redmi 3 Note Pro</video:title>
<video:description>Подробный обзор внешнего вида и функций смартфона
Xiaomi Redmi 3 Note Pro от интернет-магазина Example.
</video:description>
<video:content_loc>https://www.example.com/video123.flv</video:content_loc>
<video:player_loc allow_embed="yes" autoplay="ap=1">
https://www.example.com/videoplayer.swf?video=123</video:player_loc>
<video:duration>600</video:duration>
<video:rating>4.3</video:rating>
<video:view_count>1223</video:view_count>
<video:publication_date>2017-01-05T19:20:30+03:00</video:publication_date>
<video:family_friendly>yes</video:family_friendly>
<video:live>no</video:live>
</video:video>
</url></urlset>
- .mpg, .mpeg, .mp4, .m4v;
- .wmv;
- .asf, .avi;
- .ra, .ram, .rm;
- .mov;
- .flv.
XML-карта для Google Новин
- <news:publication> - загальний тег, у якому вказується видання. У нього є два обов'язкові дочірні теги:
- <news:name> - назва видання;
- <news:language> - мова у форматі ISO 639;
- <publication_date> — дата публікації у форматі W3C із зазначенням повної дати. Пошуковий робот Google розуміє дати аж до часток секунд, наприклад:
ГГГГ-ММ-ДДTчч:мм:cc.с±чч:мм (2017-05-10T19:20:30.45+01:00)
- <news:title> - назва статті, аналогічна назві на сайті.
- <news:genres> - властивості статті. Допустимі значення:
- PressRelease - офіційний прес-реліз;
- Satire – стаття, яка виставляє предмет обговорення у комічній формі.
- Blog — будь-яка стаття, яка опублікована у блозі або форматі блогу.
- OpEd — будь-яка стаття, що виражає особисту думку та розміщена в колонці редактора.
- Opinion - будь-яка стаття, що виражає особисту думку і не включена до колонки редактора. Сюди відносяться як рецензії колумністів, і інтерв'ю.
- UserGenerated - матеріал, створений користувачем і пройшов офіційну редакторську правку.
- <keywords> — ключові слова на тему статті;
- <stock_tickers> - список біржових/фінансових символів (не більше п'яти, через кому). Підходить для статей про бізнес. Перед кожним символом має бути вказана назва відповідної біржі, яка співпадає із записом у Google Фінансах, наприклад NASDAQ:AMAT або BOM:500325.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:news="https://www.google.com/schemas/sitemap-news/0.9">
<url>
<loc>https://example.ua/news/wow55.html</loc>
<news:news>
<news:publication>
<news:name>Новости</news:name>
<news:language>ru</news:language>
</news:publication>
<news:genres>Blog</news:genres>
<news:publication_date>2017-05-10</news:publication_date>
<news:title>Рацион питания среднестатистического студента</news:title>
<news:keywords>студенты, еда, мивина, пельмени, revo</news:keywords>
</news:news>
</url>
</urlset>
Як побудувати XML-карту для мультимовних сайтів
xmlns:xhtml="https://www.w3.org/1999/xhtml"
- example.com/ua/
- example.com/ru/
- example.com/en/
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xhtml="https://www.w3.org/1999/xhtml">
<url>
<loc>https://example.com/ru/</loc>
<xhtml:link rel="alternate" hreflang="ua" href="https://www.example.com/ua/"/>
<xhtml:link rel="alternate" hreflang="en" href="https://www.example.com/en/"/>
<xhtml:link rel="alternate" hreflang="ru" href="https://www.example.com/ru/" />
</url>
<url>
<loc>https://www.example.com/deutsch/</loc>
<xhtml:link rel="alternate" hreflang="ru" href="https://www.example.com/ru/"/>
<xhtml:link rel="alternate" hreflang="en" href="https://www.example.com/en/"/>
<xhtml:link rel="alternate" hreflang="ua" href="https://www.example.com/ua/"/>
</url>
<url>
<loc>https://www.example.com/en/</loc>
<xhtml:link rel="alternate" hreflang="ru" href="https://www.example.com/ru/"/>
<xhtml:link rel="alternate" hreflang="ua" href="https://www.example.com/ua/"/>
<xhtml:link rel="alternate" hreflang="en" href="https://www.example.com/en/"/>
</url>
</urlset>
Рекомендації Яндекса
- XML (рекомендується);
- Текстовий файл.
- розмір у стиснутому вигляді не повинен перевищувати 10 Мб;
- Яндекс розпізнає Punycode (пунікод) як у закодованому вигляді, так і в оригіналі.
Рекомендації Google
- до 50 000 посилань на файли sitemap;
- загальний розмір до 50 Мб (у стиснутому вигляді).
- XML – стандартний файл;
- RSS, media RSS та Atom 1.0 - підходить для блогів з фідом RSS або Atom;
- Сайти Google. Якщо сайт створено та підтверджено за допомогою сервісу Google Сайти, файл sitemap створюється автоматично. Його не можна змінити, але можна надіслати до Google, щоб отримати відомості для звітів. Якщо один підкаталог містить більше 1000 сторінок, файл sitemap може відображатися некоректно.
- Текстовий файл .txt.
- кодування UTF-8;
- файл не повинен містити нічого крім списку URL;
- текстовому файлу можна дати будь-яке ім'я, але з розширенням .txt (наприклад, sitemap.txt).
Як впровадити XML-карту
- Файл із XML sitemap слід помістити в кореневу директиву сайту: https://<адреса сайту>/sitemap.xml
- Якщо карт сайту кілька, необхідно створити індекс карт, де мають бути перераховані посилання на всі файли XML.
- Додати директиву sitemap у файл robots.txt.
- Вказати URL файлу в панелях вебмайстрів цікавих пошукових систем, наприклад:
- Google Search Console;
- Вебмастер Bing;
- Яндекс.Вебмайстер;
- Кабінет веб-майстра MailRu.
- https://www.mysitemapgenerator.com/
- https://www.xml-sitemaps.com/
- https://htmlweb.ru/analiz/sitemap.php
Как анализировать карту сайта в Google Search Console
- додати чи перевірити файли sitemap;
- відстежити кількість відправлених та проіндексованих сторінок різних типів;
- побачити помилки та проблеми в картах сайту;
- надіслати картки XML заново або видалити їх.