Plik mapy strony (sitemap) jest plikiem zawierającym informacje dotyczące wszystkich adresów URL na stronie[1]. Plik sitemap może zawierać dodatkowe dane dotyczące daty ostatniej modyfikacji, priorytecie danego adresu, częstotliwości zmian na stronie, innych wersji językowych.
Dane dotyczące ostatniej modyfikacji często są pomijane przez Google[2], podobnie jak priorytet w sitemap[3].
W przypadku małych stron zawierających kilkaset adresów posiadanie pliku sitemap.xml nie jest wymagane[4]. Jeśli struktura strony jest przejrzysta i do wszystkich podstron prowadzą linki, to wyszukiwarki będą w stanie odnaleźć podstrony. Sitemap jest zalecany w przypadku dużych serwisów internetowych z rozbudowaną strukturą i nawigacją. Wtedy jest w stanie ułatwić znalezienie podstron. Zalecane jest umieszczenie sitemap w przypadku nowych, dużych stron, które nie mają jeszcze wielu odnośników ze stron zewnętrznych.
<?xml version="1.0" encoding="UTF-8" ?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.przyklad.pl/</loc>
<lastmod>2018-09-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Przykładów plików sitemap i sitemapindex jest mnóstwo. Wystarczy podejrzeć duże serwisy internetowe, np.
https://www.bizdb.co.uk/sitemap.xml - tu sitemapindex zawiera linki do wielu plików sitemap.
Jeden plik sitemap może zawierać nie więcej jak 50.000 adresów. Plik sitemap nie może być większy niż 50 megabajtów.
W przypadku większych stron internetowych najlepszym wyjściem jest stworzenie pliku sitemapindex, który zawiera mapy stron. Przykład pliku sitemap index poniżej:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.przyklad.pl/sitemap1.xml</loc>
<lastmod>2018-10-01</lastmod>
</sitemap>
<sitemap>
<loc>http://www.przyklad.pl/sitemap2.xml</loc>
<lastmod>2018-09-01</lastmod>
</sitemap>
</sitemapindex>
Idealną sytuacją jest generowanie pliku sitemap przez silnik strony internetowej. W tym wypadku struktura adresów powinna być aktualizowana na bieżąco tak, aby plik sitemap odzwierciedlał serwis.
Do generowania pliku sitemap można posłużyć się jednym z narzędzi dostępnych na stronach Google[5]. W przypadku stron opartych o CMS Wordpress warto zainstalować wtyczkę "yoast seo" - wówczas budowanie sitemap.xml odbędzie się automatycznie.
W momencie gdy plik mapy strony jest gotowy i są w nim wszystkie adresy ze strony, należy powiadomić o nim wyszukiwarki. Domyślna nazwa pliku mapy strony to “sitemap.xml” lub “sitemap.xml.gz”. Wyszukiwarki prawdopodobnie same zlokalizują plik, jeśli znajdzie się w katalogu głównym domeny i będzie dostępny przez link
https://www.przyklad.pl/sitemap.xml
Jest kilka sposobów na ułatwienie znalezienia pliku sitemap wyszukiwarkom. Najłatwiej dopisać dodatkowy wiersz w pliku robots.txt, który powinien być dostępny pod adresem:
https://www.przyklad.pl/robots.txt
Wystarczy umieścić wpis w pliku robots.txt:
Sitemap: adres sitemap
na przykład:
Sitemap: https://www.przyklad.pl/sitemap.xml
Kolejnym sposobem na poinformowanie wyszukiwarek jest dodanie mapy strony w panelu Google Search Console lub Bing narzędzia dla webmasterów. Po zalogowaniu w GSC należy dodać mapę strony i kliknąć przycisk prześlij.
Informacja do Google została przesłana i w najbliższym czasie zgłoszone strony powinny być odwiedzone przez Google.
Zalecamy, aby plik sitemap odwzorowywał strukturę linków. Brak wszystkich adresów zawartych w sitemap.xml może powodować opóźnienia w indeksacji. Podobnie jak posiadanie nieaktualnych lub nieistniejących adresów w pliku mapy strony. Warto sprawdzić czy adresy w sitemap zawierają linki z https:// w przypadku stron szyfrowanych. Pozostawienie adresów w wersji http to częsty przypadek po migracji na wersję szyfrowaną. Więcej informacji o tym, jak sprawdzić sitemap w tym artykule.
Generowanie sitemap nie jest wymagane, ale w szczególnych sytuacjach może pomóc stronie, a zalecane jest przede wszystkim rozbudowanym serwisom internetowym. Na koniec cytat ze stron Google: "w większości przypadków mapa witryny jest przydatna i na pewno nie zaszkodzi ją opracować".
źródła:
Jacek Wieczorek jest współautorem Pulno. Od 2006 aktywnie zajmuje się pozyskiwaniem ruchu liczonego w setkach tysięcy użytkowników dziennie. |
23-12-2018
Zarejestruj się i wyeliminuj błędy z mapą strony.