Definícia

Sitemap  je súbor, ktorý obsahuje dáta o špecifických typoch obsahu na webe. Informuje vyhľadávače o stránkach a súboroch vášho webu, ktoré chceme indexovať, čím im uľahčuje prácu s porozumením vášho webu. Ide o tzv. mapu, vďaka ktorej googlebot dané súbory ľahšie a rýchlejšie objaví a zaindexuje.

Sitemap môže byť v rôznych formách:

  • Vo formáte XML,
  • vo formáte klasickej HTML stránky.

V sitemape by sa nemali nachádzať stránky, ktoré nechceme indexovať, ako napr. niektoré druhy vyfiltrovaných URL. Všetky stránky by mali mať status 200, nemali by sa tam nachádzať napr. stránky so stavovým kódom 404 či presmerované stránky.

Popis

Medzi atribúty sitemapy patria:

  • <urlset> – povinný tag, ktorý obaľuje celý kód.
  • <loc> – v tagoch <loc> sa nachádza URL, ktorú chcete indexovať. Tento meta tag je povinný.
  • <url> – povinný tag, ktorý je na začiatku a na konci kódu pre každú URL.
  • <lastmod> – dátum poslednej zmeny stránky vo formáte YYYY-MM-DD.
  • <changefreq> – definuje, ako často sa obsah na danej url mení (denne, týždenne, mesačne, nikdy).
  • <priority> – udáva informáciu, ktoré url sú dôležité v rámci webu. Jeho hodnota sa pohybuje v rozmedzí 0.0 – 1.0, pričom 0.0 je najmenej podstatná. 

Pri rozsiahlych weboch nezabúdajte na to, že jeden súbor XML mapy stránok môže mať najviac 50 000 podstránok a veľkosť maximálne 50 MB. V prípade, že web má podstránok viac, je potrebné mať aj viac XML sitemap súborov (maximálne 50 000). 

Aby vyhľadávače našli všetky mapy stránok, používa sa sitemap index súbor, čo je v podstate sitemapa pre ostatné sitemapy, čiže zoznam všetkých máp stránok, ktoré na webe existujú. Forma a štruktúra sitemap index súboru je veľmi podobná obyčajnej XML mape stránok.

V rámci indexového súboru sitemap môžeme použiť viacero špecifických druhov sitemap súborov (pre obrázky, videá, mobilnú verziu stránky alebo pre novinky). Pridanie sitemapy na webovú stránku môže urýchliť jej indexáciu.

Tak isto môžeme pre uľahčenie prehliadania a urýchlenie indexácie vložiť adresu pre sitemap súbor do súboru robots.txt a rovnako ju môžeme nahrať do Google Search Console. Viac o sitemap súboroch sa dočítate v článku od Jána Andrejka Sitemap: Všetko, čo potrebujete vedieť.

Sitemapu zvyčajne nájdete na webe v takejto alebo podobnej forme: https://visibility.sk/sitemap_index.xml.

Príklad

Zoznam stránok v sitemape