Definícia

Sitemapa je súbor, ktorý obsahuje dáta o špecifických typoch obsahu na webe. Informuje vyhľadávače o stránkach a súboroch vášho webu, ktoré chceme indexovať, čím im uľahčuje prácu s porozumením vášho webu. Ide o tzv. mapu, vďaka ktorej googlebot dané súbory ľahšie a rýchlejšie objaví a zaindexuje.

Sitemapa môže byť v rôznych formách:

  • XML sitemap, určená primárne pre vyhľadávače.
  • HTML sitemap, ktorá slúži skôr používateľom na lepšiu navigáciu.

V sitemape by sa nemali nachádzať stránky, ktoré nechceme indexovať, ako napr. niektoré druhy vyfiltrovaných URL. Všetky stránky by mali mať status 200, nemali by sa tam nachádzať napr. stránky so stavovým kódom 404 či presmerované stránky.

Popis

Medzi atribúty sitemapy patria:

  • <urlset> – povinný tag, ktorý obaľuje celý kód.
  • <loc> – v tagoch <loc> sa nachádza URL, ktorú chcete indexovať. Tento meta tag je povinný.
  • <url> – povinný tag, ktorý je na začiatku a na konci kódu pre každú URL.
  • <lastmod> – dátum poslednej zmeny stránky vo formáte YYYY-MM-DD.
  • <changefreq> – definuje, ako často sa obsah na danej url mení (denne, týždenne, mesačne, nikdy).
  • <priority> – udáva informáciu, ktoré url sú dôležité v rámci webu. Hodnota sa pohybuje v rozmedzí 0.0 – 1.0, pričom 0.0 je najmenej podstatná. 

Dôležité je vedieť, že vyhľadávače ako Google dnes atribútom priority a changefreq neprikladajú veľkú váhu – využívajú ich iba orientačne a výsledné správanie si určujú sami.

Pri rozsiahlych weboch nezabúdajte na to, že jeden súbor XML mapy stránok môže mať najviac 50 000 podstránok a veľkosť maximálne 50 MB. V prípade, že web má podstránok viac, je potrebné mať aj viac XML sitemap súborov (maximálne 50 000). 

Sitemap index

Aby vyhľadávače našli všetky mapy stránok, používa sa sitemap index súbor, čo je v podstate sitemapa pre ostatné sitemapy, čiže zoznam všetkých máp stránok, ktoré na webe existujú. Forma a štruktúra sitemap index súboru je veľmi podobná obyčajnej XML mape stránok.

V rámci indexového súboru môžeme vytvárať špecifické druhy sitemáp, napríklad:

  • Obrázkovú sitemap – pre lepšie prehľadávanie obrázkov.
  • Video sitemap – ak web obsahuje veľa videí.
  • News sitemap – pre články v Google News (s dodržaním ich pravidiel).

Pridanie sitemapy na webovú stránku môže urýchliť jej indexáciu.

Kam všade sitemapu umiestniť

Tak isto môžeme pre uľahčenie prehliadania a urýchlenie indexácie vložiť adresu pre sitemap súbor do súboru robots.txt a rovnako ju môžeme nahrať do Google Search Console. Nezabúdajte aktualizovať sitemapu vždy, keď na webe dôjde k väčším zmenám obsahu alebo štruktúry. Pre veľké weby odporúčame komprimovať sitemap súbory (.gz formát). Viac o sitemap súboroch sa dočítate v článku od Jána Andrejka Sitemap: Všetko, čo potrebujete vedieť.

Sitemapu zvyčajne nájdete na webe v takejto alebo podobnej forme: https://visibility.sk/sitemap_index.xml.

Príklad

Čo je sitemapa

Zoznam stránok v sitemape