Come può un giornale online impedire a Google di utilizzare i propri contenuti nelle AI overview?

Come può un giornale online impedire a Google di utilizzare i propri contenuti nelle AI overview?

Questo è il metodo tecnico principale per controllare come i motori di ricerca indicizzano e visualizzano i contenuti:

  • Meta tag noindex: Se un editore desidera che una pagina specifica non venga indicizzata da Google e quindi non compaia nei risultati di ricerca né nelle AI Overview, può aggiungere il meta tag <meta name="robots" content="noindex"> nella sezione <head> della pagina. Questo è un metodo radicale che impedisce completamente l’indicizzazione della pagina.
  • Meta tag nosnippet: Questo tag impedisce a Google di creare uno snippet (l’estratto di testo) o un video/immagine di anteprima della pagina nei risultati di ricerca. Può essere usato anche per impedire che il contenuto venga utilizzato nelle AI Overview. Il tag è <meta name="robots" content="nosnippet">.
  • Attributo data-nosnippet: Questo è un approccio più granulare. L’editore può usare l’attributo data-nosnippet per contrassegnare sezioni specifiche di una pagina (ad esempio, un paragrafo o una tabella) che non devono essere usate per la creazione di snippet o riepiloghi. Ad esempio: <p><span data-nosnippet>Questo testo non deve essere utilizzato per gli snippet.</span> La parte restante del paragrafo è libera.</p>.
  • File robots.txt: Questo file, posizionato nella directory principale del sito, fornisce istruzioni ai crawler su quali parti del sito possono o non possono scansionare. Tuttavia, è importante notare che il robots.txt impedisce la scansione, ma non necessariamente l’indicizzazione. Se una pagina bloccata nel robots.txt viene comunque linkata da altri siti, Google potrebbe comunque indicizzarla (senza poterne leggere il contenuto).

2. Differenziare i crawler

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *