Ako sledovať organickú návštevnosť v časoch GA4 a cookie líšt?
Posledné dva roky zasiahli webovú analytiku na SEO projektoch dve veľké udalosti. Tou prvou je povinnosť pýtať si súhlas návštevníka na ukladanie cookie súborov aj pri sledovaní anonymizovanej návštevnosti. Tou druhou je odstavenie Universal Analytics (Google Analytics 3, ďalej aj GA3) a prakticky vynútený prechod na Google Analytics 4 (ďalej aj GA4).
Obe veci majú vo väčšine prípadov zásadný vplyv na možnosti sledovať organickú návštevnosť z vyhľadávania, pričom tieto zmeny najviac sťažujú medziročné porovnanie vývoja návštevnosti.
Pri hodnotení vývoja návštevnosti je medziročné porovnanie často kľúčové kvôli tomu, že lepšie zohľadňuje sezónne výkyvy.
Google Analytics 4 meria presnejšie
GA4 je nielen svojím rozhraním, ale najmä technickým pozadím, veľmi odlišným nástrojom od svojho predchodcu. V zásade by mal poskytovať o niečo presnejšie dáta.
Napr. v prípadoch, ak návšteva (session) prebiehala na hrane dní, GA3 to zaznamenal ako jednu návštevu pre deň, v ktorej začala a jednu návštevu pre nasledujúci deň, v ktorom pokračovala. GA4 takýto jav vykazuje správne iba ako jednu návštevu.
Ďalším príkladom je situácia, ak napr. návštevník prišiel na web z vyhľadávania a následne klikol napr. na interný link na danom webe s UTM parametrami. Došlo tak k priradeniu k zdroju a médiu návštevnosti podľa UTM parametrov a zároveň vznikali dve návštevy. V GA4 ide o jednu návštevu, ktorá bude priradená organike.
V GA4 sú vo výsledku čísla organickej návštevnosti odlišné, spravidla nižšie.
Aj GA3, aj GA4 však v organickej návštevnosti z vyhľadávania zavádzajú
Čo je zaujímavé a mnohým málo známe, je skutočnosť, že vykazovanie organickej návštevnosti v Google Analytics – starom aj novom – má istú metodiku, ktorá sa nám môže zdať zavádzajúca, pričom organickú návštevnosť nadhodnocuje na úkor priamej návštevnosti (direct session).
Ide o to, že Google Analytics priraďuje ako zdroj návštevy posledný zdroj z nepriameho zdroja (non-direct session) daného návštevníka. V praxi to znamená, že ak návštevník príde na web z Googlu a potom 10-krát priamo, GA to bude vykazovať ako 11 návštev z Googlu a ani jednu priamu návštevu (direct session). Hoci v skutočnosti ide o 1 návštevu z Googlu a 10 priamych návštev (direct session).
Tento jav môže výrazne skresľovať návštevnosť najmä pri weboch médií, resp. takých, kde sa návštevník často vracia. Príklad možno vidieť nižšie. Zhruba tri štvrtiny organickej návštevnosti v skutočnosti prišlo z priamej návštevnosti, hoci pri štandardnom reporte je to priradené k organike na úkor priamej návštevnosti:
Naopak, weby, ktoré sú návštevníkmi takýmto spôsobom navštevované zriedka, výraznú dátovú diskrepanciu v tomto nevykazujú, napríklad ako tento nižšie:
Ako sa pozrieť na dáta očistené od tohto javu v starom GA, popisuje Barbora Bošková na blogu Spotibo. Obdobný návod pre GA4 som zatiaľ popísaný nenašiel.
Udeľovanie súhlasu v rámci cookie lišty výrazne znižuje čísla
O ešte výraznejší pokles dát sa však stará korektne nastavená cookie lišta. Miera súhlasu s meraním analytických dát je od prípadu k prípadu veľmi variabilná. Na mieru súhlasu majú vplyv najmä nasledovné veci:
- Dizajn cookie lišty. Samo o sebe ide o veľkú tému. Ale v skratke: záleží napr. od toho, či možno jedným kliknutím odmietnuť ukladanie netechnických cookies – to zvyšuje mieru nesúhlasu. Záleží tiež od toho, ako sú dizajnované jednotlivé možnosti (ich veľkosť, farba, umiestnenie, textácia ap.). Ako veľmi cookie lišta zavadzia a núti návštevníka s ňou interagovať.
- Typ webu z hľadiska správania. Ak ide o web, na ktorý návštevník príde iba na krátko, aby si prečítal stručnú informáciu a vzápätí odišiel, nemá veľkú potrebu s cookie lištou interagovať, čím aj zriedkavejšie udelí súhlas na meranie. Opakom sú weby, na ktorých potrebuje návštevník stráviť viac času, vyplniť nejaké formuláre ap. – vtedy je veľká šanca, že návštevník bude s cookie lištou interagovať, a teda aj častejšie udelí súhlas.
- Obsah webu. Ak ide o web s obsahom, ktorý je pre návštevníka citlivejší z hľadiska jeho súkromia, dá si viac záležať, aby súhlas s ukladaním netechnických cookies odmietol.
- Obľúbenosť značky. V prípade značiek, ktorým návštevník dôveruje, prípadne patria medzi jeho obľúbené, bude aj ochotnejšie poskytovať súhlas s ukladaním analytických či marketingových cookies.
Vo výsledku tak analytickým nástrojom, ako Google Analytics, môžu chýbať dáta v lepšom prípade v 30 %, ale bežne aj viac ako v 70 % prípadov. Príklad za všetky, ako klesla návštevnosť po nasadení cookie lišty, možno vidieť nižšie:
Snáď neprezradím tajomstvo, že mnoho webov aj napriek istému riziku pokuty má cookie lištu iba na oko, pričom bez ohľadu na interakciu návštevníka s ňou meria hneď všetko a ani prípadný explicitný nesúhlas zo strany návštevníka na to nemá žiadny vplyv.
Domodelovanie dát sa týka iba malej časti webov
GA4 na situáciu s povinnou cookie lištou reaguje tak, že dokáže domodelovávať dáta od návštevníkov, ktorí súhlas neudelili. Pričom je super, že to robí s takou mierou (ne)presnosti, ktorá celkové dáta neskresľuje výraznejšie ako mnoho ďalších faktorov.
Neteší však, že na toto domodelovanie potrebuje web pomerne vysoké čísla návštevnosti. Zjednodušene možno povedať, že web potrebuje desiatky tisíc návštev mesačne. Žiaľ, to dosahuje u nás iba menšie množstvo webov.
V prípade potreby si môžete trochu primitívne „domodelovať“ tieto dáta svojpomocne tak, že k zaznamenanej návštevnosti pripočítate percento návštevníkov, ktorí nedávajú súhlas s ukladaním analytických cookies.
Horšie je, že mieru nesúhlasu spomedzi návštevníkov Google Analytics 4 neukazuje. Možno ju vidieť v niektorých nástrojoch, ktoré sa starajú o implementáciu cookie lišty na weboch, prípadne v databáze BigQuery.
Na pomoc prichádza Google Search Console a Bing Webmaster Tools
Pre weby, ktoré kvôli nižšej návštevnosti nespĺňajú podmienky na domodelovávanie dát zo strany GA4, je tu jednoduché dostupné riešenie v podobe nástrojov, ktoré slúžia na komunikáciu vyhľadávačov s webmi.
Tu si treba uvedomiť, že organická návštevnosť z vyhľadávania sa na Slovensku týka síce dominantne Googlu, ale môžeme tiež pozorovať určitý podiel z vyhľadávačov Bing, DuckDuckGo, Yahoo, Seznam, Ecosia, Baidu, Yandex atď.
Väčšina zo spomenutých poskytuje nejakú podobu webmaster tools. Vo väčšine prípadov nám stačí Google Search Console (GSC) a ak chceme byť dôkladnejší, tak môžeme zahrnúť aj Bing. (V prípade, že pozorujeme nezanedbateľné podiely aj z iných vyhľadávačov, tak aj webmaster tools od nich.)
Oba nástroje – od Googlu aj Bingu – poskytujú údaj o počte kliknutí (Total Clicks) z týchto vyhľadávačov, ktoré smerovali na našu stránku. Kliknutie v tomto prípade možno považovať za ekvivalent návštevy (session).
Sčítaním kliknutí z oboch nástrojov dostaneme zjednodušene organickú návštevnosť z vyhľadávania, ktorá nie je skreslená tým, že zahŕňa priame návštevy od návštevníkov, ktorí prišli predtým z organického vyhľadávania.
Ukážka z Google Search Console
Ukážka z Bing Webmaster Tools
Pri weboch, napr. weby médií, ktoré trpia spomínaným skreslením organickej návštevnosti kvôli atribúcii posledného nepriameho zdroja, môžeme vidieť výrazne nižšie čísla kliknutí.
Naopak, pri weboch, ktoré týmto javom trpia málo a zároveň majú korektne implementovanú cookie lištu a zároveň nemajú domodelovávané dáta, uvidíme čísla vyššie.
Ďalšou príčinou vytvárajúcou odlišnosti v číslach medzi GA a GSC sú napríklad súbory PDF. Do PDF súborov nemožno vložiť merací kód GA, a tak sú pre GA neviditeľné. Naopak, GSC kliknutia na ne z Googlu meria.
Zásadnou výhodou používania Google Search Console na sledovanie organickej návštevnosti je, že je nezávislé na ukladaní cookies, čiže si na jeho použitie netreba pýtať súhlas s ukladaním cookies.
Nevýhodou je, že dáta v Google Search Console sú dostupné iba za posledných 16 mesiacov. To stačí síce na medziročné porovnanie, ale nie do vzdialenejšej minulosti.
Riešením je napr. si raz za rok tieto čísla za jednotlivé mesiace zálohovať alebo na komplexnejšie zálohovanie dát GSC využiť nejaký nástroj tretej strany, napr. Search Analytics for Sheets.
Najdôležitejšia je konzistencia
Bez ohľadu na to, akým spôsobom kto vykazuje organickú návštevnosť z vyhľadávania ako istú demonštráciu SEO aktivít, najdôležitejšia pri tom je konzistencia dát. Ako som spomínal v úvode, nasadzovaním cookie lišty a prechodom na GA4 bola v mnohých prípadoch táto konzistencia narušená.
Nedáva zmysel porovnávať organické návštevy z vyhľadávania (organic sessions) medzi GA3 a GA4. Ani medzi jednou z GA a GSC. Taktiež nie medzi dátami pred a po nasadení cookie lišty. Takto sa možno dopracovať iba k veľmi zavádzajúcim výsledkom.
Tí, ktorí reagovali na tieto javy včas – nasadili GA4 vyše roka pred tým, ako bola GA3 vypnutá a lištu pýtajúcu súhlas na analytické cookies mali implementovanú už k 1. 2. 2022, odkedy táto povinnosť nadobudla účinnosť – tí sa s nekonzistenciou dát už nejako vysporiadali.
Veľa webov však nasadenie GA4 začalo riešiť, až keď zistili, že im GA3 prestalo merať. Mnoho webov dodnes nemá funkčné cookie lišty a v súlade s aktuálnou legislatívou či nebodaj podľa stanoviska Úradu pre reguláciu elektronických komunikácií a poštových služieb k získavaniu súhlasu podľa ustanovenia § 109 ods. 8 zákona č. 452/2021 Z. z. o elektronických komunikáciách.
Tých vysporiadanie sa s touto nekonzistenciou možno iba čaká. A práve im v prípade potreby sledovania organickej návštevnosti z vyhľadávania a jej medziročného porovnania môžu slúžiť počty kliknutí v Google Search Console za jednotlivé mesiace ako vhodný a jednoduchý spôsob. Samozrejme, za predpokladu, že tento nástroj vyše roka využívajú.
Ako hlavný zdroj dát však napriek všetkým problémom možno odporučiť stále GA4, keďže poskytuje oveľa detailnejší prehľad o správaní návštevníkov (interaktívne návštevy, počet konverzií, nákupy ap.) a tiež dáta z ďalších kanálov návštevnosti. GSC či Bing webmaster tools možno odporučiť ako doplnkové dáta pre širšiu predstavu o vývoji.