Posts Recentes:

X está lançando um aplicativo de TV para vídeos ‘em breve’

X, empresa anteriormente conhecida como Twitter, está lançando...

Google E-E-A-T: o que é isso?

No mundo digital, a confiança é fundamental. É...

O Google responde a uma pergunta sobre problema de orçamento de rastreamento


Alguém no Reddit postou uma pergunta sobre o problema de “orçamento de rastreamento” e perguntou se um grande número de redirecionamentos 301 para respostas de erro 410 estava fazendo com que o Googlebot esgotasse seu orçamento de rastreamento. John Mueller, do Google, ofereceu um motivo para explicar por que o Redditor pode estar enfrentando um padrão de rastreamento medíocre e esclareceu um ponto sobre os orçamentos de rastreamento em geral.

Orçamento de rastreamento

É uma ideia comumente aceita que o Google tenha um orçamento de rastreamento, uma ideia que os SEOs inventaram para explicar por que alguns sites não são rastreados o suficiente. A ideia é que cada site receba um determinado número de rastreamentos, um limite para a quantidade de rastreamento para a qual um site se qualifica.

É importante compreender o contexto da ideia do orçamento de rastreamento porque ajuda a entender o que ele realmente é. O Google há muito insiste que não há nada no Google que possa ser chamado de orçamento de rastreamento, embora a forma como o Google rastreia um site possa dar a impressão de que há um limite para o rastreamento.

Um importante engenheiro do Google (na época) chamado Matt Cutts aludiu a esse fato sobre o orçamento de rastreamento em uma entrevista de 2010.

Matt respondeu a uma pergunta sobre o orçamento de rastreamento do Google explicando primeiro que não havia orçamento de rastreamento na forma como os SEOs o concebem:

“A primeira coisa é que não existe realmente um limite de indexação. Muitas pessoas pensavam que um domínio só conseguiria indexar um determinado número de páginas, e não é assim que funciona.

Também não há um limite rígido para nosso rastreamento.”

Em 2017, o Google publicou um explicador de orçamento de rastreamento que reuniu vários fatos relacionados ao rastreamento que, juntos, se assemelham ao que a comunidade SEO chamava de orçamento de rastreamento. Esta nova explicação é mais precisa do que a frase vaga e abrangente “orçamento de rastreamento” já foi (documento de orçamento de rastreamento do Google resumido aqui pelo Search Engine Journal).

A pequena lista dos principais pontos sobre um orçamento de rastreamento é:

  • Uma taxa de rastreamento é o número de URLs que o Google pode rastrear com base na capacidade do servidor de fornecer os URLs solicitados.
  • Um servidor compartilhado, por exemplo, pode hospedar dezenas de milhares de sites, resultando em centenas de milhares, senão milhões de URLs. Portanto, o Google precisa rastrear servidores com base na capacidade de atender às solicitações de páginas.
  • Páginas que são essencialmente duplicatas de outras (como navegação facetada) e outras páginas de baixo valor podem desperdiçar recursos do servidor, limitando a quantidade de páginas que um servidor pode fornecer ao Googlebot para rastreamento.
  • Páginas leves são mais fáceis de rastrear.
  • As páginas Soft 404 podem fazer com que o Google se concentre nas páginas de baixo valor, em vez das páginas que importam.
  • Os padrões de links internos e de entrada podem ajudar a influenciar quais páginas serão rastreadas.

Pergunta do Reddit sobre taxa de rastreamento

A pessoa no Reddit queria saber se as páginas de baixo valor que estavam criando estavam influenciando o orçamento de rastreamento do Google. Resumindo, uma solicitação de um URL não seguro de uma página que não existe mais redireciona para a versão segura da página ausente, que fornece uma resposta de erro 410 (significa que a página desapareceu permanentemente).

É uma pergunta legítima.

Isto é o que eles perguntaram:

“Estou tentando fazer o Googlebot esquecer de rastrear alguns URLs não HTTPS muito antigos, que ainda estão sendo rastreados após 6 anos. E coloquei uma resposta 410, no lado HTTPS, em URLs muito antigas.

Portanto, o Googlebot está encontrando um redirecionamento 301 (de HTTP para HTTPS) e depois um 410.

http://example.com/old-url.php?id=xxxx -301-> https://example.com/old-url.php?id=xxxx (resposta 410)

Duas questões. G**** está feliz com este 301+410?

Estou sofrendo de problemas de 'orçamento de rastreamento' e não sei se essas duas respostas estão esgotando o Googlebot

O 410 é eficaz? Quer dizer, devo devolver o 410 diretamente, sem o primeiro 301?”

John Mueller do Google respondeu:

D*?

301 está bem, uma mistura 301/410 está bem.

O orçamento de rastreamento é realmente apenas um problema para sites enormes ( https://developers.google.com/search/docs/crawling-indexing/large-site-managing-crawl-budget ). Se você está vendo problemas e seu site não é realmente enorme, provavelmente o Google não vê muito valor em rastrear mais. Isso não é um problema técnico.”

Razões para não ser rastreado o suficiente

Mueller respondeu que “provavelmente” o Google não está vendo valor em rastrear mais páginas da web. Isso significa que as páginas da web provavelmente poderiam usar uma revisão para identificar por que o Google pode determinar que não vale a pena rastrear essas páginas.

Certas táticas populares de SEO tendem a criar páginas da web de baixo valor e sem originalidade. Por exemplo, uma prática popular de SEO é revisar as páginas da web com melhor classificação para entender quais fatores nessas páginas explicam por que essas páginas estão classificadas e, em seguida, usar essas informações para melhorar suas próprias páginas, replicando o que está funcionando nos resultados da pesquisa.

Isso parece lógico, mas não cria algo de valor. Se você pensar nisso como uma escolha binária Um e Zero, onde zero é o que já está nos resultados da pesquisa e Um representa algo original e diferente, a popular tática de SEO de emular o que já está nos resultados da pesquisa está fadada a criar outro Zero, um site que não oferece nada além do que já está nas SERPs.

É evidente que existem problemas técnicos que podem afetar a taxa de rastreamento, como a integridade do servidor e outros fatores.

Mas em termos do que é entendido como orçamento de rastreamento, isso é algo que o Google mantém há muito tempo como uma consideração para sites grandes e não para sites de pequeno e médio porte.

Leia a discussão do Reddit:

G**** está satisfeito com 301+410 respostas para o mesmo URL?

Imagem em destaque da Shutterstock/ViDI Studio

Últimas

X está lançando um aplicativo de TV para vídeos ‘em breve’

X, empresa anteriormente conhecida como Twitter, está lançando...

Google E-E-A-T: o que é isso?

No mundo digital, a confiança é fundamental. É...

Como adaptar seu marketing para a nova era da análise de dados

Não é exagero dizer que o cenário dos...

Assine

spot_img

Veja Também

X está lançando um aplicativo de TV para vídeos ‘em breve’

X, empresa anteriormente conhecida como Twitter, está lançando...

Google E-E-A-T: o que é isso?

No mundo digital, a confiança é fundamental. É...

Como adaptar seu marketing para a nova era da análise de dados

Não é exagero dizer que o cenário dos...
spot_img

X está lançando um aplicativo de TV para vídeos ‘em breve’

X, empresa anteriormente conhecida como Twitter, está lançando em breve um aplicativo de TV dedicado para vídeos enviados à rede social. CEO...

A Perplexity está levantando mais de US$ 250 milhões com uma avaliação de US$ 2,5 a US$ 3 bilhões para sua plataforma de pesquisa...

Perplexity, a inicialização do mecanismo de busca de IA, é uma propriedade em alta no momento. O TechCrunch descobriu que a empresa...

Google E-E-A-T: o que é isso?

No mundo digital, a confiança é fundamental. É por isso que o Google vem aprimorando seus critérios de pesquisa, priorizando conteúdos que demonstram...