Sitemap: Všetko, čo potrebujete vedieť o mape stránok
Mapa stránok, resp. sitemap, je súbor, ktorým pomáhate vyhľadávaniu Google a ostatným vyhľadávačom nájsť všetky stránky a podstránky vášho webu a dobre porozumieť štruktúre vašej domény. V podstate ide o zoznam všetkých stránok na vašom webe, ktoré by podľa vás mali byť indexované, t.j. vyhľadateľné cez Google alebo iný vyhľadávací nástroj, či už ide o Bing, Yahoo, DuckDuckGo a iné.
Tento článok som pôvodne napísal už pred viac ako šiestimi rokmi. Okrem nevyhnutnej aktualizácie som pridal niekoľko zaujímavých informácií a odkazov pre začínajúcich aj pokročilých webmastrov, digitálnych marketérov a SEO špecialistov.
Predtým, ako spomeniem viac o tom, či a kedy je sitemap nevyhnutná a ako ju správne vytvoriť, v krátkosti spomeniem dôležitú tému robots.txt. Súbor robots.txt je opakom sitemap a je štandardizovaným súborom používaným na informovanie vyhľadávačov o tom, ktoré stránky nemajú byť vyhľadateľné pomocou ich služieb. Práca s robots.txt je omnoho rizikovejšia ako so sitemap súborom, pretože jedna chyba môže spôsobiť, že váš web sa nebude zobrazovať vo výsledkoch vyhľadávania napríklad v Googli (zakážete Googlebotovi, aby váš web prechádzal), a tak vás vie pripraviť o jeden z najväčších zdrojov návštevnosti. Zakázať alebo obmedziť prehľadávanie však môžete rôznym botom, a to nielen tým z vyhľadávačov (napríklad zo SEO nástrojov, ako SEMrush, Ahrefs, a pod.), čo má často svoje opodstatnenie.
V tomto bode ale musím čitateľov upozorniť na ďalšiu vec, s ktorou sa občas u nových klientov stretávam, a ktorá spôsobuje, že vyhľadávače ignorujú daný web, a tým pádom sa nezobrazuje vo výsledkoch vyhľadávania (napr. na Google.sk). Tým je „noindex“ inštrukcia pre vyhľadávače priamo v HTML kóde konkrétnej stránky:
<meta name=“robots“ content=“noindex“>.
Ak sa váš web nezobrazuje v Googli, skontrolujte, či sa tento „noindex“ príkaz nachádza v kóde webu (hľadajte v zdrojovom kóde, v prehliadači Chrome cez klávesovú skratku CTRL-U, následne hľadajte text pomocou CTRL-F) a ak ho tam nájdete, našli ste vinníka. Zvyčajne sa tento príkaz napíše do kódu webu pokiaľ je „vo výstavbe“ a zabudne sa dať preč, akonáhle je web dokončený.
Máte web. Musíte mať mapu stránok?
Nie, nemusíte. Vaša stránka bude fungovať dokonale aj bez nej, ba čo viac, budete mať o čosi menej starostí s jej údržbou (zvyčajne s ňou však nie je veľa starostí, predsalen, ide o štandardnú súčasť webov). Návštevník nezistí žiaden rozdiel, či sitemap máte, alebo nie. Teda pokiaľ už na vašej stránke je. Bez mapy stránok totiž riskujete, že sa vôbec na vašu stránku nedostane.
Sitemap môže v niektorých prípadoch výrazným spôsobom zvýšiť počet stránok vášho webu, ktoré je možné nájsť vo vyhľadávači.
Vyhľadávače ako Google fungujú na princípe robota web crawler (v prípade Google sa volá Googlebot), ktorý prechádza celý internet takým spôsobom, že sleduje a navštevuje jednotlivé odkazy na každej stránke, ktorú nájde. Tieto automatické prehľadávacie roboty sú v dnešnej dobe veľmi pokročilé a väčšinou zabezpečia, že všetko podstatné z vašej stránky bude vo vyhľadávačoch indexované, a teda bude sa dať nájsť. Takýmto spôsobom však môžu byť niektoré stránky vášho webu prirodzene vynechané. Preto sa vyvinul štandard mapy stránok, ktorým môžeme uľahčiť a spresniť tento proces.
Sitemap vám však nezaručí, že každá stránka, ktorú v nej máte, bude zaindexovaná. Podobne ako pri súbore robots.txt, o tom, čo bude v indexe a čo nie, rozhoduje nakoniec algoritmus vyhľadávača. Tieto súbory fungujú teda len ako veľmi silné odporúčanie.
Ak ste ale ako ja a chcete mať istotu, že ste urobili všetko preto, aby vašu stránku navštívilo čo najviac ľudí, vytvorte jej sitemap, je to ľahké. Čítajte ďalej, ak chcete vedieť, ako na to.
Kedy je sitemap nevyhnutná?
Sú prípady, keď je priam nevyhnutné mať mapu stránok, aby sa zaručilo, že Google zaindexuje všetok obsah, ktorý ste krvopotne na svojom webe vybudovali. Vytvorte sitemap v týchto prípadoch:
1. Váš web je postavený na non-HTML technológii
Ak na vašom webe nemáte štandardné HTML odkazy, bude pre Googlebot ťažké nájsť podstránky vášho webu. Je možné, že nájde len úvodnú stránku. Pred rokmi mali takýto problém weby postavené napr. na Flash technológii, ktorá umožňovala použiť rôzne animácie, tú však vo všeobecnosti nahradil štandard HTML5.
2. Váš web je obrovský
Ak máte veľmi veľa podstránok a zložitú štruktúru s mnohými úrovňami, prehľadávacie roboty môžu ľahko niektoré stránky vynechať. Mám na mysli weby s tisíckami až miliónmi podstránok, ako sú napr. veľké e-shopy.
3. Váš web má veľký archív obsahu, ktorý nie je dobre prepojený so zvyškom webu
Prirodzene budú vaše stránky indexované, ak sú dobre prepojené hypertextovými odkazmi. Ak na seba jednotlivé stránky vášho webu dostatočne neodkazujú, je potrebné vytvoriť mapu stránok.
4. Váš web je nový a má veľmi málo vonkajších spätných odkazov
Googlebot potrebuje odkazy z iných zdrojov, ktoré už predtým objavil, aby sa dostal na vašu stránku. Ak ich nemá, musíte vyhľadávaču o vašom webe povedať cez Google Search Console, následne odporúčam pridať sitemap, aby mal k dispozícii celý zoznam URL adries vášho webu.
Ako vytvoriť dobrú mapu stránok – sitemap
Existuje niekoľko typov sitemap súborov, ktoré môžete použiť:
HTML mapa stránok – HTML sitemap
Má formu klasickej HTML podstránky vášho webu so zoznamom stránok v hierarchickej štruktúre. Medzi jej výhody patrí to, že sa dá upraviť CSS štýlmi tak, aby vyzerala ako súčasť webu a návštevník ju tak môže pohodlne použiť na navigáciu. Je to starší typ a v dnešnej dobe ho už neodporúčame používať. Ak však chcete, vyskúšajte napríklad SlickMap.
XML mapa stránok – XML Sitemap
XML mapy stránok sú najodporúčanejší formát používaný vyhľadávačmi Google, Yahoo a Bing. Ich veľkou výhodou je, že môžu obsahovať ďalšie informácie o obsahu na každej stránke na vašom webe v tzv. metadátach. Spravidla to je súbor s koncovkou .xml nahraný do root priečinka vášho webu, čiže umiestnený napr. na https://vasadomena.sk/sitemap.xml.
Mnohé CMS majú implementovanú funkcionalitu tvorby mapy stránok alebo ju pokrývajú rôznymi pluginmi. Ak máte custom CMS, odporúčame, aby vám váš developer pridal funkcionalitu generovania dynamickej XML mapy stránok, čiže takej, ktorá bude automaticky pridávať nové stránky po ich vytvorení a meniť staršie URL po zmene, presmerovaní a pod. V sitemap by však mali byť len URL adresy, ktoré sú aktívne (majú status 200 po načítaní), a teda nie sú presmerované ani nedostupné.
XML sitemapu si môžete dať aj vygenerovať množstvom online nástrojov, čo vám môže uľahčiť prácu, ak si ju chcete napísať sami.
Ak je vaša stránka postavená na CMS WordPress, existuje nepreberné množstvo pluginov, z ktorých môžete vyberať. Odporúčam napr. generátor, ktorý je obsiahnutý vo WordPress SEO by Yoast plugine alebo Google XML Sitemaps plugin.
V metadátach môžete poskytnúť vyhľadávaču tieto informácie o obsahu jednotlivých stránok:
- loc určuje URL umiestnenie stránky a ako jediný metatag je povinný,
- lastmod určuje dátum poslednej úpravy stránky,
- changefreq vraví o tom, ako často sa obsah v priemere mení (denne, týždenne, mesačne, nikdy),
- priority dáva informáciu o relatívnej dôležitosti stránky v rámci vášho webu. Pohybuje sa od 0.0 (najmenej podstatné) do 1.0 (najpodstatnejšie), ale pozor, Googlebot nebude častejšie prechádzať web len kvôli tomu, že dáme všade najvyššiu prioritu, ide len o prerozdelenie priorít v rámci stránok.
Chengefreq a priority Google nezohľadňuje vo výsledkoch vyhľadávania.
Typická štruktúra XML mapy stránok vyzerá nasledovne:
<?xml version=“1.0″ encoding=“UTF-8″?>
<urlset >
<url>
<loc>http://vasadomena.sk/</loc>
<lastmod>2015-1-05</lastmod>
<changefreq>daily</changefreq>
<priority>1</priority>
</url>
</urlset>
XML mapy stránok pre rozsiahle weby (nad 50 000 stránok)
Ak máte rozsiahly web, je dôležité mať na pamäti, že jeden súbor XML mapy stránok môže mať najviac 50 000 podstránok a môže byť veľký maximálne 50 MB. Toto však neprekáža, pretože váš web môže mať viac XML sitemap súborov, dokonca až 50 000. Čiže do XML máp stránok je možné zahrnúť teoreticky až 2,5 miliardy stránok.
Aby sme zaručili, že vyhľadávače nájdu všetky mapy stránok, používame Sitemap index súbor. Toto je vlastne sitemap pre ostatné sitemapy, čiže zoznam všetkých máp stránok, ktoré sú pre web vytvorené.
Forma a štruktúra sitemap index súboru je veľmi podobná obyčajnej XML mape stránok:
<?xml version=“1.0″ encoding=“UTF-8″?>
<sitemapindex >
<sitemap>
<loc>http://www.website.com/sitemap1.xml</loc>
</sitemap>
<sitemap>
<loc>http://www.website.com/sitemap2.xml</loc>
</sitemap>
</sitemapindex>
Ďalšie tipy pre vytvorenie dobrej XML mapy stránok
- Viacero XML máp stránok je vhodné použiť, aj keď nemáte príliš veľa stránok. Môžete urobiť sitemap pre každý typ alebo kategóriu stránok (pre články, kategórie, produkty, informačné stránky a i.).
- Sitemap súbory musia byť kódované v UTF-8 a neštandardné znaky (non-ASCII) je potrebné zmeniť za entity (escape URLs).
- Nepridávajte URL adresy so session ID znakmi, aby ste sa vyhli duplicitnému prechádzaniu Googlebotom.
- Zahrňte iné jazykové verzie, resp. jazykové mutácie stránok s ich unikátnymi URL adresami a použite pri nich hreflang anotáciu.
- Dajte si pozor, aby ste používali konzistentné URL adresy naprieč celým webom buď stále https://www.vasadomena.sk, alebo stále https://vasadomena.sk. Takisto si dajte pozor na verzie stránok s lomítkom na konci a bez neho. Vždy by mala byť funkčná a unikátna len jedna verzia tej istej stránky.
- Pri stránkach s multimediálnym obsahom je vhodné používať aj špeciálne mapy stránok. Najpoužívanejšie sú video mapy stránok a obrázkové mapy stránok.
Video mapy stránok – Video Sitemaps
Do XML sitemap je možné pridať aj zoznam videí, ktoré sa nachádzajú na vašom webe. Pridaním týchto informácií zvyšujete šancu, že sa video z vašej stránky zobrazí priamo vo výsledkoch vyhľadávania v Googli. Pridať informáciu o videu môžete rovno do existujúceho XML sitemap súboru alebo môžete vytvoriť osobitný súbor len pre videá.
Ak si chcete vytvoriť video sitemap, viac informácií nájdete na Google Search Console Help a vygenerovať správny kód vám pomôže táto šikovná tabuľka od anglickej online marketingovej agentúry Distilled. Len doplňte svoje informácie a skopírujte výsledný kód do svojej XML mapy stránok.
Obrázkové mapy stránok – Image Sitemaps
Obrázková mapa stránok uľahčuje vyhľadávačom indexáciu obrázkov na vašom webe a pomôže dostať obrázky z vášho webu do Google vyhľadávania obrázkov (Google Image Search). Ak máte na webe veľa obrázkov, pridanie image sitemap vám pomôže priniesť o niečo viac organickej návštevnosti.
Odporúčame pridať samostatný XML súbor s image sitemap a zahrnúť čo možno najväčší počet obrázkov. Je možné zadať až 1000 obrázkov na jednu URL. Ak chcete pridať obrázkovú mapu stránok na váš web, viac informácií nájdete na Google Search Console Help a v prípade, že váš web funguje na WordPresse, opäť vám pomôže WordPress SEO by Yoast alebo iný plugin.
Máte vygenerovanú mapu stránok, ako o nej poviete Googlu?
Predtým, ako poviete Googlu o vašej sitemape, pre istotu skontrolujte, či spĺňa všetky technické náležitosti pomocou niektorého online validátora.
Potom, ako ste si istí, že je všetko v poriadku, prihláste sa do svojho Google Search Console účtu (bývalý Webmaster Tools) a pridajte URL, kde sa nachádza váš sitemap súbor, prípadne váš sitemap index súbor v sekcii Indexing -> Sitemap. Podobne sa dá sitemap pridať aj v Bing Webmaster Tools (čo odporúčame využiť pre medzinárodné alebo veľmi navštevované weby).
Ďalší spôsob, ako dať vedieť vyhľadávačom o vašich mapách stránok, je pridať ich do robots.txt súboru ako sitemap, nie je to však povinné. Treba si dať pozor, aby sme v robots.txt tieto súbory naopak nezakázali. Sitemap správne pridáte do tohto súboru pomocou nasledujúceho príkazu:
Sitemap: https://vasadomena.sk/sitemap.xml
Ak máte chuť dozvedieť sa ešte viac o tom, ako fungujú mapy stránok a aké zásady je treba pri nich dodržiavať, odporúčam tento výborný článok od Michaela Cottama.