Pre dodanie relevantných výsledkov vo vyhľadávaní musí Google zabezpečiť, aby jeho algoritmy rozumeli ľudskej reči. Na dosiahnutie tohto cieľa minulý rok v Googli zaviedli takzvaný model BERT (Bidirectional Encoder Representations from Transformers).

Google prostredníctvom Twitteru oznámil, že technológiu BERT spúšťa pre viac ako 70 jazykov. Medzi nimi sa nachádza aj slovenčina. Vysvetlíme si, čo je to BERT a ako tento model funguje.

Spracovanie prirodzeného jazyka

… alebo v angličtine lepšie znejúce slovné spojenie natural language processing (NLP) sa zaoberá komunikáciou medzi človekom a počítačom. Metódy tejto vedeckej disciplíny majú na zreteli aj v Googli, pretože len tak môžu poskytovať najrelevantnejšie výsledky pri vyhľadávacích dopytoch.

Problémom pri spracovaní jazyka, rozpoznávaní významu slov a súvislostí medzi nimi je nedostatok dát. Umelá inteligencia a algoritmy sa nemali „na čom učiť”, a teda zlepšovať chápanie textu.

Ambíciou Googlu je, aby vyhľadávače nevyhodnocovali kľúčové slová jednotlivo, ale ako celok. Na takýto princíp sme si zvykli, a preto je pre nás úplne prirodzené vyhľadávať nasledovným systémom:

 

„bolesť hlavy liek”

 

Google však chce, aby prehliadače rozumeli aj celej otázke:

 

„Aký je najlepší liek na bolesť hlavy?”

 

A na to tu je BERT.

Ako funguje BERT?

Veľký posun vpred v chápaní textu zaznamenal Google minulý rok, keď uviedol do života model BERT. Ide o špeciálny model, ktorý funguje na báze technológie TensorFlow a bol zostrojený na to, aby dokázal dešifrovať význam long-tailových vyhľadávacích fráz, čiže takých, ktoré obsahujú 2 a viac slov.

Podstata modelu BERT spočíva v tom, že na základe analýzy veľkého množstva textov sa učí predikovať, aké slová by vo vete mali nasledovať a aký je ich význam v spojení s predošlými. Analýzy textov boli zabezpečené vďaka tomu, že BERT je open source platforma. Toto softvérové riešenie je podporené výkonným hardvérom Cloud Tensor Processing Units (TPUs). Ak vás zaujímajú podrobnosti fungovania, tak ich nájdete v blogu od Googlu.

BERT v praxi

Pre „seočkárov” a ľudí v digitálnom marketingu to znamená, že Google zas a raz vylepšil chápanie long-tailových výrazov. Tie sú často zdrojom ľahko dosiahnuteľnej návštevnosti, keďže sú menej konkurenčné.

A vzhľadom na to, že BERT sa do vyhľadávacích algoritmov implementoval aj u nás na Slovensku, by sa mala zvýšiť pozornosť na optimalizáciu dlhších kľúčových výrazov alebo dokonca celých otázok a viet.