Posts Recentes:

SoftBank adquire fabricante de chips de IA do Reino Unido Graphcore

Empresa de chips do Reino Unido Gráficooré foi...

Pesquisadores do Google alertam que a IA está destruindo a internet

Um estudo feito por pesquisadores do Google aponta...

Esclarecimento sobre vazamento de dados do Google


Durante os feriados dos Estados Unidos, foram compartilhadas algumas postagens sobre um suposto vazamento de dados relacionados ao ranking do Google. As primeiras postagens sobre os vazamentos focaram na “confirmação” de crenças que eram de longa data por Rand Fishkin, mas pouca atenção foi dada ao contexto da informação e ao que ela realmente significa.

O contexto é importante: Document AI Warehouse

O documento vazado compartilha relação com uma plataforma pública do Google Cloud chamada Document AI Warehouse, que é usada para analisar, organizar, pesquisar e armazenar dados. Esta documentação pública é intitulada Visão geral do Document AI Warehouse. Uma postagem no Facebook compartilha que os dados “vazados” são a “versão interna” da documentação publicamente visível do Document AI Warehouse. Esse é o contexto desses dados.

Captura de tela: Document AI Warehouse

Captura de tela

@DavidGQuaid tuitou:

“Acho que está claro que é uma API externa para construir um armazém de documentos, como o nome sugere”

Isso parece jogar água fria na ideia de que os dados “vazados” representam informações internas da Pesquisa Google.

Até onde sabemos neste momento, os “dados vazados” compartilham uma semelhança com o que está na página pública do Document AI Warehouse.

Vazamento de dados de pesquisa interna?

A postagem original no SparkToro não diz que os dados são provenientes da Pesquisa Google. Diz que a pessoa que enviou os dados para Rand Fishkin foi quem fez a afirmação.

Uma das coisas que admiro em Rand Fishkin é que ele é meticulosamente preciso em sua escrita, especialmente quando se trata de advertências. Rand observa precisamente que é a pessoa que forneceu os dados quem afirma que os dados se originam da Pesquisa Google. Não há provas, apenas uma afirmação.

Ele escreve:

“Recebi um e-mail de uma pessoa alegando ter acesso a um vazamento massivo de documentação de API de dentro da divisão de Pesquisa do Google.”

O próprio Fishkin não afirma que os dados foram confirmados por ex-Googlers como tendo origem na Pesquisa Google. Ele escreve que a pessoa que enviou os dados por e-mail fez essa afirmação.

“O e-mail afirmava ainda que esses documentos vazados foram confirmados como autênticos por ex-funcionários do Google e que esses ex-funcionários e outros compartilharam informações adicionais e privadas sobre as operações de busca do Google.”

Fishkin escreve sobre uma videoconferência subsequente em que o vazador revelou que seu contato com ex-Googlers ocorreu no contexto de um encontro com eles em um evento do setor de buscas. Mais uma vez, teremos que acreditar na palavra dos vazadores sobre os ex-Googlers e que o que eles disseram foi após uma análise cuidadosa dos dados e não um comentário informal.

Fishkin escreve que contatou três ex-Googlers sobre isso. O que é notável é que esses ex-Googlers não confirmaram explicitamente que os dados são internos à Pesquisa Google. Eles apenas confirmaram que os dados parecem se assemelhar a informações internas do Google, e não que tenham origem na Pesquisa Google.

Fishkin escreve o que os ex-Googlers lhe disseram:

  • “Eu não tive acesso a esse código quando trabalhei lá. Mas isso certamente parece legítimo.”
  • “Tem todas as características de uma API interna do Google.”
  • “É uma API baseada em Java. E alguém passou muito tempo aderindo aos padrões internos do Google para documentação e nomenclatura.”
  • “Eu precisaria de mais tempo para ter certeza, mas isso corresponde à documentação interna com a qual estou familiarizado.”
  • “Nada do que vi em uma breve análise sugere que isso seja tudo menos legítimo.”

Dizer que algo tem origem na Pesquisa Google e dizer que tem origem no Google são duas coisas diferentes.

Mantenha a mente aberta

É importante manter a mente aberta sobre os dados porque há muita coisa que não está confirmada. Por exemplo, não se sabe se este é um documento interno da Equipe de Pesquisa. Por causa disso, provavelmente não é uma boa ideia considerar esses dados como conselhos de SEO acionáveis.

Além disso, não é aconselhável analisar os dados para confirmar especificamente crenças arraigadas. É assim que alguém fica preso no preconceito de confirmação.

Uma definição de viés de confirmação:

“O viés de confirmação é a tendência de procurar, interpretar, favorecer e recordar informações de uma forma que confirme ou apoie as crenças ou valores anteriores de alguém.”

O preconceito de confirmação levará a pessoa a negar coisas que são empiricamente verdadeiras. Por exemplo, existe a ideia de décadas de que o Google impede automaticamente a classificação de um novo site, uma teoria chamada Sandbox. Todos os dias, as pessoas relatam que seus novos sites e novas páginas são classificados quase imediatamente entre os dez primeiros da pesquisa do Google.

Mas se você acredita firmemente na Sandbox, então uma experiência observável real como essa será descartada, não importa quantas pessoas observem a experiência oposta.

Brenda Malone, estrategista técnica sênior freelance de SEO e desenvolvedora da Web (perfil do LinkedIn), me enviou uma mensagem sobre reivindicações sobre o Sandbox:

“Eu pessoalmente sei, por experiência própria, que a teoria Sandbox está errada. Acabei de indexar em dois dias um blog pessoal com dois posts. Não há como um pequeno site de duas postagens ter sido indexado de acordo com a teoria do Sandbox.”

A conclusão aqui é que, se a documentação vier da Pesquisa Google, a maneira incorreta de analisar os dados é procurar a confirmação de crenças arraigadas.

Sobre o que é o vazamento de dados do Google?

Há cinco coisas a serem consideradas sobre os dados vazados:

  1. O contexto das informações vazadas é desconhecido. Está relacionado à Pesquisa Google? É para outros fins?
  2. A finalidade dos dados. As informações foram usadas para resultados de pesquisa reais? Ou foi usado para gerenciamento ou manipulação de dados internamente?
  3. Ex-Googlers não confirmaram se os dados são específicos da Pesquisa Google. Eles apenas confirmaram que parece vir do Google.
  4. Mantenha a mente aberta. Se você sair em busca de vindicação de crenças arraigadas, adivinhe? Você os encontrará em todos os lugares. Isso é chamado de viés de confirmação.
  5. As evidências sugerem que os dados estão relacionados a uma API externa para construir um armazém de documentos.

O que os outros dizem sobre documentos “vazados”

Ryan Jones, alguém que não apenas tem profunda experiência em SEO, mas também um conhecimento formidável de ciência da computação, compartilhou algumas observações razoáveis ​​​​sobre o chamado vazamento de dados.

Ryan twittou:

“Não sabemos se isso é para produção ou para testes. Meu palpite é que é principalmente para testar possíveis mudanças.

Não sabemos o que é usado na web ou em outros setores. Algumas coisas podem ser usadas apenas para uma página inicial do Google ou notícias, etc.

Não sabemos o que é uma entrada para um algoritmo de ML e o que é usado para treinar. Meu palpite é que os cliques não são uma entrada direta, mas são usados ​​para treinar um modelo como prever a clicabilidade. (Fora dos aumentos de tendências)

Também estou supondo que alguns desses campos se aplicam apenas a conjuntos de dados de treinamento e não a todos os sites.

Estou dizendo que o Google não mentiu? De jeito nenhum. Mas vamos examinar esse vazamento de maneira questionável e não com qualquer preconceito preconcebido.”

@DavidGQuaid tuitou:

“Também não sabemos se isso é para pesquisa do Google ou recuperação de documentos na nuvem do Google

APIs parecem escolher – não é assim que espero que o algoritmo seja executado – e se um engenheiro quiser pular todas essas verificações de qualidade – parece que quero construir um aplicativo de armazenamento de conteúdo para minha base de conhecimento empresarial”

Os dados “vazados” estão relacionados à Pesquisa Google?

Neste momento, não há evidências concretas de que esses dados “vazados” sejam realmente da Pesquisa Google. Há uma enorme ambiguidade sobre qual é a finalidade dos dados. Notável é que há indícios de que esses dados são apenas “uma API externa para construir um armazém de documentos, como o nome sugere” e não estão relacionados de forma alguma à forma como os sites são classificados na Pesquisa Google.

A conclusão de que esses dados não se originaram da Pesquisa Google não é definitiva neste momento, mas é na direção que o vento das evidências parece estar soprando.

Imagem em destaque por Shutterstock/Jaaak

Últimas

Câmeras Waymo capturam imagens de pessoa acusada de supostos cortes de pneus de robotaxi

Um morador de Castro Valley foi acusado na...

SoftBank adquire fabricante de chips de IA do Reino Unido Graphcore

Empresa de chips do Reino Unido Gráficooré foi...

Pesquisadores do Google alertam que a IA está destruindo a internet

Um estudo feito por pesquisadores do Google aponta...

César Lattes, físico e professor brasileiro, é homenageado no Google

Hoje, o Google celebra com um Doodle animado...

Assine

spot_img

Veja Também

Câmeras Waymo capturam imagens de pessoa acusada de supostos cortes de pneus de robotaxi

Um morador de Castro Valley foi acusado na...

SoftBank adquire fabricante de chips de IA do Reino Unido Graphcore

Empresa de chips do Reino Unido Gráficooré foi...

Pesquisadores do Google alertam que a IA está destruindo a internet

Um estudo feito por pesquisadores do Google aponta...

César Lattes, físico e professor brasileiro, é homenageado no Google

Hoje, o Google celebra com um Doodle animado...

O WhatsApp agora permite que empresas enviem códigos de autenticação para usuários na Índia

O WhatsApp agora permite que empresas enviem códigos...
spot_img

Câmeras Waymo capturam imagens de pessoa acusada de supostos cortes de pneus de robotaxi

Um morador de Castro Valley foi acusado na quinta-feira por supostamente cortar os pneus de 17 robotaxis Waymo em São Francisco entre 24...

SoftBank adquire fabricante de chips de IA do Reino Unido Graphcore

Empresa de chips do Reino Unido Gráficooré foi formalmente adquirida pelo SoftBank do Japão.Rumores do acordo abundam há algum tempomas negociações prolongadas e...

Pesquisadores do Google alertam que a IA está destruindo a internet

Um estudo feito por pesquisadores do Google aponta que a IA generativa, a mesma que a gigante de Mountain View está super incentivando,...