A.I. e SEO, Google BERT

By Eleonora Boretti

A.I. e SEO – Come BERT può aiutare la SEO

Sono ormai diversi anni che Google ha iniziato ad usare l’intelligenza artificiale.

Con questo articoli andiamo un po' più sul teorico che sul pratico, o meglio come consulente SEO, mi rendo conto ogni giorno che per quanto riguarda il linguaggio Google non è allo stesso livello su tutte le lingue. Con la lingua italiana per esempio non è ancora in grado di riconoscere tutto le keyword a stessa valenza semantica come invece riesce a fare con la lingua inglese, anche per questo una consulenza SEO su misura valuta sempre il mercato di riferimento. Non tutte le regole sono applicabili nell'immediato a tutti i paesi e a tutto le lingue, e proprio per questo la SEO internazionale diventa di primaria importanza per vendere all'estero.

Quello su cui Google ha maggiormente focalizzato le sue risorse è l’analisi del testo, con lo scopo di andare a comprendere meglio le ricerche degli utenti e il testo all’interno dei Siti Web.

Il più grande problema dell’ A.I. per quanto riguarda l’analisi testuale è di stampo linguistico. In altre parole il problema è che non conosciamo esattamente il funzionamento del linguaggio.

Esistono molte teorie a riguardo ma resta il fatto che è impossibile programmare un sistema per comprendere ed interpretare esattamente un testo.

Non è stato possibile quindi programmare un algoritmo che comprenda il sistema del linguaggio umano, per questo è stato creato un algoritmo in deep learning associato ai sistemi di natural language processing, in grado di determinare alcune cose rispetto alla lingua.

Ma andiamo per gradi.

Alcune cose della lingua le sappiamo, cose per cui i sistemi di A.I. sono già abbastanza avanzati. Per esempio conosciamo bene la struttura sintattica, però sono mere regole di creazione di contenuto, che non danno nessuna indicazione di contesto o di senso. Partendo dalle regole grammaticali e sintattiche è possibile creare qualsiasi tipo di frase, ma non è detto che tale frase abbia senso.

Quello che non sappiamo invece è tutto ciò che riguarda l’assegnazione di senso, il problema è che la relazione tra parola e il suo significato è una relazione convenzionale. Se tutti iniziassimo a usare la parola gatto per significare albero la parola stessa cambierebbe significato.

Cosa fa Google per risolvere il problema di riuscire a capire il significato delle parole?

Google ha investito molto sull'A.I. in particolare sul mondo del natural language processing e la sua prima grande innovazione è stata la creazione di Word2VEC. Word2Vec è un algoritmo creato nel 2013 che converte testi, o meglio parole, in numeri.

In questo modo riesce a trasformarle in vettori per cui queste parole vengono messe vicine in base alla loro similitudine e alla loro posizione all’interno della frase. Lo scopo di Word2Vec è capire come alcune parole sono semanticamente correlate e quali sono le relazioni tra di esse.

Word2Vec però risolve il problema del natural langue processino solo in parte. Per questo motivo è stato creato un nuovo algoritmo, che è in pratica la sua evoluzione: BERT.

Cos’è Google BERT BERT, acronimo di “Bidirectional Encoder Representations from Transformers”, è un aggiornamento dell’algoritmo di Google, pubblicato nel 2019 e consiste in un sistema per l’elaborazione del linguaggio naturale.

Al momento è il miglior algoritmo di analisi testuale. La novità è che aggiunge un livello di contestualizzazione delle parole ed è in Deep Learning quindi è senza supervisione umana, mentre Word2Vec aveva una parte di machine learning supervisionato. …. intoltre è bidirezionale.

BertT è stato addestrato su tutto il database di Wikipedia in inglese inizialmente e poi nelle altre lingue.

Word2Vec non riesce a identificare il contesto, invece Bert riesce a farlo prendendo in analisi intere frasi.

Nel 2015 Google ha dichiarato l’utilizzo dell’A.I. all’interno del suo motore di ricerca, tramite l’aggiornamento di algoritmo Rank Brain.

Rank Brain è un sistema tramite il quale Google interpreta meglio le query degli utenti, soprattutto quando si tratta di una nuova query.

Google reinterpreta la query attraverso meccanismi prima come Word2Vec, poi come BERT, in modo da capire quali sono gli argomenti più vicini alla richiesta dell’utente, così da trovare i contenuti più pertinenti possibile.

Inizialmente Rank brain veniva usato solo per le query sconosciute. Al momento Rankbrain è usato su tutte le ricerche.

BERT lavora sulle query in tempo reale, così come sui contenuti dei testi.

Per cosa si può utilizzare BERT o simili?

Per riconoscere delle entità, tipo persone, luoghi, aziende, dati. Cose presenti sul Knowledge Graph che è una raccolta di informazioni da una o più pagine, mostrate con un layout visivo simile a quello dei rich result più recenti. I risultati del Knowledge Graph possono includere entity (entità) individuate con logo, nome del sito preferito, link al profilo social e, potenzialmente, possono importare dati utilizzando qualsiasi elemento di schema.org.

Quando Google analizza un sito riconosce le entità e verifica se all’interno del sito gli argomenti sono trattati in modo logico e esaustivo. Per migliora la parte di riconoscimento da parte di Google sicuramente è importante lavorare con dati strutturati, schema.org. Esistono anche dei Tool di nuova generazione che permettono la realizzazione di dati strutturati.

Cosa possiamo fare in quanto SEO per navigare in questo sistema?

Utilizzare gli stessi metodi! utilizzare l’A.I., Word2Vec e BERT sono open-source. E’ quindi possibile per creare dei contenuti sempre più ottimizzati per quello che google pensa sia giusto che siano ottimizzati. Chiaramente ciò non significa scrivere per il motore di ricerca, ma scrivere per l’essere umano, tenendo conto del fatto che Google da sempre più valore ai contenuti scritti con un linguaggio naturale, e qualora si volesse capire come Google interpreta i nostri contenuti è possibile consultare direttamente BERT.

Se vuoi puoi consultare direttamente Google Bert.