Co to sitemap?

Blog tutorial Co to sitemap?
Plik mapy strony sitemap

Plik mapy strony (sitemap) jest plikiem zawierającym informacje dotyczące wszystkich adresów URL na stronie[1]. Plik sitemap może zawierać dodatkowe dane dotyczące daty ostatniej modyfikacji, priorytecie danego adresu, częstotliwości zmian na stronie, innych wersji językowych.

Dane dotyczące ostatniej modyfikacji często są pomijane przez Google[2], podobnie jak priorytet w sitemap[3].


Czy potrzebuję pliku sitemap.xml?

W przypadku małych stron zawierających kilkaset adresów posiadanie pliku sitemap.xml nie jest wymagane[4]. Jeśli struktura strony jest przejrzysta i do wszystkich podstron prowadzą linki, to wyszukiwarki będą w stanie odnaleźć podstrony. Sitemap jest zalecany w przypadku dużych serwisów internetowych z rozbudowaną strukturą i nawigacją. Wtedy jest w stanie ułatwić znalezienie podstron. Zalecane jest umieszczenie sitemap w przypadku nowych, dużych stron, które nie mają jeszcze wielu odnośników ze stron zewnętrznych.


Przykład pliku mapy strony

<?xml version="1.0" encoding="UTF-8" ?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

    <url>

        <loc>http://www.przyklad.pl/</loc>

        <lastmod>2018-09-01</lastmod>

        <changefreq>monthly</changefreq>

        <priority>0.8</priority>

    </url>

</urlset>


Przykładów plików sitemap i sitemapindex jest mnóstwo. Wystarczy podejrzeć duże serwisy internetowe, np.

https://www.bizdb.co.uk/sitemap.xml - tu sitemapindex zawiera linki do wielu plików sitemap.


Limity w pliku mapy strony

Jeden plik sitemap może zawierać nie więcej jak 50.000 adresów. Plik sitemap nie może być większy niż 50 megabajtów.


Co zrobić jak mam więcej niż 50.000 adresów?

W przypadku większych stron internetowych najlepszym wyjściem jest stworzenie pliku sitemapindex, który zawiera mapy stron. Przykład pliku sitemap index poniżej:

<?xml version="1.0" encoding="UTF-8"?>

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

    <sitemap>

        <loc>http://www.przyklad.pl/sitemap1.xml</loc>

        <lastmod>2018-10-01</lastmod>

    </sitemap>

    <sitemap>

        <loc>http://www.przyklad.pl/sitemap2.xml</loc>

        <lastmod>2018-09-01</lastmod>

    </sitemap>

</sitemapindex>


Generator sitemap

Idealną sytuacją jest generowanie pliku sitemap przez silnik strony internetowej. W tym wypadku struktura adresów powinna być aktualizowana na bieżąco tak, aby plik sitemap odzwierciedlał serwis.

Do generowania pliku sitemap można posłużyć się jednym z narzędzi dostępnych na stronach Google[5]. W przypadku stron opartych o CMS Wordpress warto zainstalować wtyczkę "yoast seo" - wówczas budowanie sitemap.xml odbędzie się automatycznie.




Co zrobić po utworzeniu pliku sitemap.xml

W momencie gdy plik mapy strony jest gotowy i są w nim wszystkie adresy ze strony, należy powiadomić o nim wyszukiwarki. Domyślna nazwa pliku mapy strony to “sitemap.xml” lub “sitemap.xml.gz”. Wyszukiwarki prawdopodobnie same zlokalizują plik, jeśli znajdzie się w katalogu głównym domeny i będzie dostępny przez link

https://www.przyklad.pl/sitemap.xml

Jest kilka sposobów na ułatwienie znalezienia pliku sitemap wyszukiwarkom. Najłatwiej dopisać dodatkowy wiersz w pliku robots.txt, który powinien być dostępny pod adresem:

https://www.przyklad.pl/robots.txt

Wystarczy umieścić wpis w pliku robots.txt: 

Sitemap: adres sitemap 

na przykład: 

Sitemap: https://www.przyklad.pl/sitemap.xml


Kolejnym sposobem na poinformowanie wyszukiwarek jest dodanie mapy strony w panelu Google Search Console lub Bing narzędzia dla webmasterów.  Po zalogowaniu w GSC należy dodać mapę strony i kliknąć przycisk prześlij.


Informacja do Google została przesłana i w najbliższym czasie zgłoszone strony powinny być odwiedzone przez Google.


Różnice w strukturze strony i sitemap

Zalecamy, aby plik sitemap odwzorowywał strukturę linków. Brak wszystkich adresów zawartych w sitemap.xml może powodować opóźnienia w indeksacji. Podobnie jak posiadanie nieaktualnych lub nieistniejących adresów w pliku mapy strony. Warto sprawdzić czy adresy w sitemap zawierają linki z https:// w przypadku stron szyfrowanych. Pozostawienie adresów w wersji http to częsty przypadek po migracji na wersję szyfrowaną.


Podsumowanie

Generowanie sitemap nie jest wymagane, ale w szczególnych sytuacjach może pomóc stronie, a zalecane jest przede wszystkim rozbudowanym serwisom internetowym. Na koniec cytat ze stron Google: "w większości przypadków mapa witryny jest przydatna i na pewno nie zaszkodzi ją opracować".

źródła:

  1. https://pl.wikipedia.org/wiki/Sitemap
  2. https://www.seroundtable.com/google-lastmod-xml-sitemap-20579.html
  3. https://www.seroundtable.com/google-priority-change-frequency-xml-sitemap-20273.html
  4. https://support.google.com/webmasters/answer/156184?hl=pl
  5. https://code.google.com/archive/p/sitemap-generators/wikis/SitemapGenerators.wiki


Jacek Wieczorek jest współautorem Pulno. Od 2006 aktywnie zajmuje się pozyskiwaniem ruchu liczonego w setkach tysięcy użytkowników dziennie. 


Skontaktuj się:   



×

Analiza sitemap w Pulno

Zarejestruj się i wyeliminuj błędy z mapą strony.

Poprawny adres strony jest wymagany
Poprawny e-mail jest wymagany
Akceptacja regulaminu jest wymagana.