L'indicizzazione della pagina è bloccata

I motori di ricerca possono mostrare le pagine nei loro risultati di ricerca solo se queste pagine non vengono mostrate bloccare esplicitamente l'indicizzazione da parte dei crawler dei motori di ricerca. Alcune intestazioni HTTP e comunicano ai crawler che una pagina non deve essere indicizzata.

Blocca l'indicizzazione solo per i contenuti che non vuoi che vengano visualizzati nei risultati di ricerca.

In che modo il controllo dell'indicizzazione di Lighthouse non va a buon fine

Lighthouse segnala le pagine che i motori di ricerca non sono in grado di indicizzare:

Controllo Lighthouse che mostra che i motori di ricerca non possono indicizzare la pagina

Lighthouse verifica solo la presenza di intestazioni o elementi che bloccano tutto il motore di ricerca crawler. Ad esempio, il seguente elemento <meta> impedisce a tutti i motori di ricerca ai crawler (noti anche come robot) di accedere alla pagina:

<meta name="robots" content="noindex"/>

Questa intestazione della risposta HTTP blocca anche tutti i crawler:

X-Robots-Tag: noindex

Potresti anche avere <meta> elementi che bloccano crawler specifici, ad esempio:

<meta name="Googlebot" content="noindex"/>

Lighthouse non supera il controllo per direttive specifiche del crawler come questa, ma può rendono la tua pagina più difficile da trovare, quindi usali con cautela. Lighthouse emetterà un un avviso se un'istruzione specifica del crawler blocca un bot di indicizzazione comune.

Come assicurarti che i motori di ricerca possano eseguire la scansione della pagina

Innanzitutto assicurati che i motori di ricerca eseguano l'indicizzazione della pagina. Alcune pagine, ad esempio Sitemap legali o legali, in genere non dovrebbero essere indicizzati. Ricorda che il blocco l'indicizzazione non impedisce agli utenti di accedere alla pagina se ne conoscono l'URL).

Per le pagine che vuoi vengano indicizzate, rimuovi eventuali intestazioni HTTP o elementi <meta> che bloccano i crawler dei motori di ricerca. A seconda di come configuri il sito, potrebbe essere necessario eseguire alcuni o tutti i seguenti passaggi:

  • Rimuovi l'intestazione della risposta HTTP X-Robots-Tag se hai configurato una richiesta HTTP intestazione risposta:
X-Robots-Tag: noindex
  • Rimuovi il seguente meta tag se è presente nell'intestazione della pagina:
<meta name="robots" content="noindex">
  • Evita i meta tag che bloccano crawler specifici se questi tag sono presenti nella all'inizio della pagina. Ad esempio:
<meta name="Googlebot" content="noindex">

Aggiungi un altro controllo (facoltativo)

Potresti volere un maggiore controllo sul modo in cui i motori di ricerca indicizzano la tua pagina. Ad esempio: Magari non vuoi che Google indicizzi le immagini, ma vuoi che il resto della pagina indicizzati.

Per informazioni su come configurare gli elementi <meta> e HTTP intestazioni per motori di ricerca specifici, consulta queste guide:

Risorse