Posts Recentes:

6 maneiras de otimizar GPTs para aumentar a visibilidade e o envolvimento online

GPTs, a forma sem código de criar experiências...

TikTok perde ainda mais músicas por causa de sua disputa com o Universal Music Group

O TikTok está perdendo ainda mais músicas por...

Splitscreen traz uma configuração de vários monitores para o Vision Pro da Apple

Pronto para uso, Vision Pro da Apple funciona...

Pesquisa Google sobrecarregada por ataque massivo de spam


Os resultados de pesquisa do Google foram atingidos por um ataque de spam nos últimos dias, o que só pode ser descrito como completamente fora de controle. Muitos domínios são classificados para centenas de milhares de palavras-chave cada, uma indicação de que a escala desse ataque pode facilmente atingir milhões de frases-chave.

Surpreendentemente, muitos dos domínios só foram registrados nas últimas 24 a 48 horas.

Isso recentemente chamou minha atenção por meio de uma série de postagens de Bill Hartzer (perfil do LinkedIn), onde ele publicou um gráfico de links gerado pela ferramenta de backlinks Majestic que expôs as redes de links de vários sites de spam.

O gráfico de links que ele postou mostrou vários sites interligados entre si, o que é um padrão bastante típico para redes de links com spam.

Captura de tela da rede firmemente interligada

Pesquisa Google sobrecarregada por ataque massivo de spamImagem de Bill Hartzer via MajesticPesquisa Google sobrecarregada por ataque massivo de spam

Bill e eu conversamos sobre os sites de spam no Facebook Messenger e ambos concordamos que, embora os spammers se esforçassem muito para criar uma rede de backlinks, os links não eram realmente responsáveis ​​pelas altas classificações.

Bill disse:

“Isso, na minha opinião, é parcialmente culpa do Google, que parece estar dando mais ênfase ao conteúdo do que aos links.”

Concordo 100% que o Google está colocando mais ênfase no conteúdo do que nos links. Mas penso que os links de spam existem para que o Googlebot possa descobrir as páginas de spam e indexá-las, mesmo que apenas por um ou dois dias.

Uma vez indexadas, as páginas de spam provavelmente explorarão o que considero duas lacunas nos algoritmos do Google, das quais falarei a seguir.

Spam fora de controle nas SERPs do Google

Vários sites estão classificando frases longtail que são fáceis de classificar, bem como frases com um componente de pesquisa local, que também são fáceis de classificar.

Frases longtail são frases-chave usadas por pessoas, mas muito raramente. Longtail é um conceito que existe há quase vinte anos e posteriormente popularizado por um livro de 2006 chamado The Long Tail: Why the Future of Business is Selling Less of More.

Os spammers conseguem classificar essas frases raramente pesquisadas porque há pouca concorrência para essas frases, o que facilita a classificação.

Portanto, se um spammer criar milhões de páginas de frases longtail, essas páginas poderão ser classificadas para centenas de milhares de palavras-chave todos os dias em um curto período de tempo.

Empresas como a Amazon usam o princípio do longtail para vender centenas de milhares de produtos individuais por dia, o que é diferente de vender um produto centenas de milhares de vezes por dia.

É isso que os spammers estão explorando: a facilidade de classificação de frases longtail.

A segunda coisa que os spammers estão explorando é a brecha inerente à Pesquisa Local.

O algoritmo de pesquisa local não é o mesmo que o algoritmo de classificação de palavras-chave não locais.

Os exemplos que surgiram são variações do Craigslist e palavras-chave relacionadas.

Exemplos são frases como Peças automotivas Craigslist, Quartos Craigslist para alugar, Craigslist à venda pelo proprietário e milhares de outras palavras-chave, a maioria das quais não usa a palavra Craigslist.

A escala do spam é enorme e vai muito além das palavras-chave com a palavra “Craigslist”.

Qual é a aparência da página de spam

É impossível ver a aparência da página de spam visitando as páginas com um navegador.

Tentei ver o código-fonte dos sites classificados no Google, mas todos os sites de spam redirecionam automaticamente para outro domínio.

Em seguida, inseri o URL de spam no verificador de links do W3C para visitar o site, mas o bot do W3C também não conseguiu ver o site.

Então mudei o agente do usuário do meu navegador para se identificar como Googlebot, mas o site de spam ainda me redirecionou.

Isso indicava que o site não estava verificando se o agente do usuário era o Googlebot.

O site de spam estava verificando os endereços IP do Googlebot. Se o endereço IP do visitante correspondesse ao Google, a página de spam exibia conteúdo para o Googlebot.

Todos os outros visitantes foram redirecionados para outros domínios que exibiam conteúdo incompleto.

Para ver o HTML do site tive que visitar um endereço IP do Google. Então usei o testador Rich Results do Google para visitar o site de spam e registrar o HTML da página.

Mostrei a Bill Hartzer como extrair o HTML usando o testador de Rich Results e ele imediatamente tweetou sobre isso, haha. Droga!

O Rich Results Tester tem a opção de mostrar o HTML de uma página da web. Então copiei o HTML, colei-o em um arquivo de texto e salvei-o como um arquivo HTML.

Captura de tela do HTML fornecido pela ferramenta Rich Results

Pesquisa Google sobrecarregada por ataque massivo de spamPesquisa Google sobrecarregada por ataque massivo de spam

Em seguida, editei o arquivo HTML para remover qualquer JavaScript e salvei o arquivo novamente.

Agora consegui ver a aparência da página da web para o Google:

Captura de tela da página de spam

Captura de tela de uma página de spam classificada no GoogleCaptura de tela de uma página de spam classificada no Google

Um domínio é classificado para mais de 300.000 palavras-chave

Bill me enviou uma planilha contendo uma lista de frases-chave classificadas apenas por um dos sites de spam. Um site de spam, apenas um deles, classificado em mais de 300.000 frases-chave.

Captura de tela mostrando palavras-chave para um domínio

Imagem mostrando um close de uma planilha com frases de palavras-chaveImagem mostrando um close de uma planilha com frases de palavras-chave

Havia muitas frases-chave no Craigslist, mas também havia outras frases longtail, muitas das quais continham um elemento de pesquisa local. Como mencionei, é fácil classificar frases longtail, fácil classificar frases de pesquisa local e combinar os dois tipos de frases e é realmente fácil classificar essas frases de palavras-chave.

Por que essa técnica de spam funciona?

A pesquisa local usa um algoritmo diferente do algoritmo não local. Por exemplo, um site local, em geral, não precisa de muitos links para ser classificado em uma consulta. As páginas só precisam dos tipos certos de palavras-chave para acionar um algoritmo de pesquisa local e classificá-lo em uma área geográfica.

Portanto, se você pesquisar “peças automotivas no Craigslist”, isso acionará o algoritmo de pesquisa local e, por ser longtail, não será preciso muito para classificá-lo.

Este é um problema constante há muitos anos. Vários anos atrás, um site conseguiu ser classificado como “Rinoplastia Plano, Texas” com um site que continha conteúdo antigo em latim romano e títulos em inglês. A rinoplastia é uma pesquisa local longtail e Plano, Texas, é uma cidade relativamente pequena. A classificação da frase-chave Rinoplastia foi tão fácil que o site em idioma latino conseguiu classificá-la facilmente.

O Google sabe desse problema de spam pelo menos desde 19 de dezembro, conforme reconhecido em um tweet de Danny Sullivan.

Será interessante ver se o Google finalmente, depois de todo esse tempo, descobrirá uma maneira de combater esse tipo de spam.

Imagem em destaque por Shutterstock/Kateryna Onyshchuk



Últimas

6 maneiras de otimizar GPTs para aumentar a visibilidade e o envolvimento online

GPTs, a forma sem código de criar experiências...

TikTok perde ainda mais músicas por causa de sua disputa com o Universal Music Group

O TikTok está perdendo ainda mais músicas por...

Splitscreen traz uma configuração de vários monitores para o Vision Pro da Apple

Pronto para uso, Vision Pro da Apple funciona...

O Copilot Enterprise do GitHub agora está disponível por US$ 39 por mês

GitHub anunciou hoje a disponibilidade geral do Copilot...

Assine

spot_img

Veja Também

6 maneiras de otimizar GPTs para aumentar a visibilidade e o envolvimento online

GPTs, a forma sem código de criar experiências...

TikTok perde ainda mais músicas por causa de sua disputa com o Universal Music Group

O TikTok está perdendo ainda mais músicas por...

Splitscreen traz uma configuração de vários monitores para o Vision Pro da Apple

Pronto para uso, Vision Pro da Apple funciona...

O Copilot Enterprise do GitHub agora está disponível por US$ 39 por mês

GitHub anunciou hoje a disponibilidade geral do Copilot...

Google celebra Casimir Funk, o químico pioneiro das vitaminas

O Google fez uma homenagem ao bioquímico polonês-americano...
spot_img

6 maneiras de otimizar GPTs para aumentar a visibilidade e o envolvimento online

GPTs, a forma sem código de criar experiências ChatGPT personalizadas a partir do OpenAI, permitem que as marcas alcancem usuários ChatGPT na Loja...

TikTok perde ainda mais músicas por causa de sua disputa com o Universal Music Group

O TikTok está perdendo ainda mais músicas por causa de sua briga com o Universal Music Group (UMG), já que a rede social...

Splitscreen traz uma configuração de vários monitores para o Vision Pro da Apple

Pronto para uso, Vision Pro da Apple funciona como um monitor virtual 4K Mac, permitindo estender um desktop Mac existente ao ambiente de...