Os mecanismos de pesquisa só podem mostrar páginas nos resultados se elas não bloquear explicitamente a indexação por rastreadores de mecanismos de pesquisa. Alguns cabeçalhos HTTP e metadados as tags informam aos rastreadores que uma página não deve ser indexada.
Bloqueie somente a indexação de conteúdo que você não quer que apareça nos resultados da pesquisa.
Como a auditoria de indexação do Lighthouse falha
Páginas de sinalizações do Lighthouse que os mecanismos de pesquisa não conseguem indexar:
O Lighthouse só verifica cabeçalhos ou elementos que bloqueiam todos os mecanismos de pesquisa
rastreadores. Por exemplo, o elemento <meta>
abaixo impede que todos os mecanismos de pesquisa
rastreadores (também conhecidos como robôs) de acessar sua página:
<meta name="robots" content="noindex"/>
Esse cabeçalho de resposta HTTP também bloqueia todos os rastreadores:
X-Robots-Tag: noindex
Você também pode ter elementos <meta>
que bloqueiam rastreadores específicos, como:
<meta name="Googlebot" content="noindex"/>
O Lighthouse não falha na auditoria de diretivas específicas do rastreador como essa, mas pode tornar sua página mais difícil de ser descoberta, portanto, use-as com cautela. O Lighthouse emitirá um avisar se uma diretiva específica do rastreador estiver bloqueando um bot de indexação comum.
Como garantir que os mecanismos de pesquisa possam rastrear sua página
Primeiro, verifique se você quer que os mecanismos de pesquisa indexem a página. Algumas páginas, como sitemaps ou conteúdo legal geralmente não deve ser indexado. Lembre-se de que bloquear a indexação não impede que os usuários acessem uma página se souberem seu URL.
Remova todos os cabeçalhos HTTP ou elementos <meta>
das páginas que você quer indexar.
que estão bloqueando
os rastreadores de mecanismos de pesquisa. Dependendo de como você configurar seu site,
Talvez seja necessário seguir algumas ou todas as etapas abaixo:
- Remova o cabeçalho de resposta HTTP
X-Robots-Tag
se você tiver configurado um cabeçalho de resposta:
X-Robots-Tag: noindex
- Remova a seguinte metatag se ela estiver presente no cabeçalho da página:
<meta name="robots" content="noindex">
- Evite metatags que bloqueiem rastreadores específicos se essas tags estiverem presentes no cabeçalho da página. Exemplo:
<meta name="Googlebot" content="noindex">
Adicionar outro controle (opcional)
Talvez você queira ter mais controle sobre como os mecanismos de pesquisa indexam sua página. Por exemplo: talvez você não queira que o Google indexe imagens, mas quer que o resto da página indexado.
Para informações sobre como configurar os elementos <meta>
e HTTP
de mecanismos de pesquisa específicos, consulte estes guias:
- Pesquisa Google
- Bing (em inglês)
- Yandex (em inglês)