Posts Recentes:

Ilya Sutskever, cofundador da OpenAI e cientista-chefe de longa data, parte

Ilya Sutskever, cientista-chefe de longa data da OpenAI...

Intuitive Machines quer ajudar NASA a devolver amostras de Marte

A Intuitive Machines está procurando ajudar a remodelar...

Gemini Advanced ganha envio de documentos

O Google anunciou hoje diversas novidades para o...

O Google agora está indexando arquivos CSV


O Google atualizou discretamente a documentação da Meão de Pesquisa do Google para observar que agora eles estão indexando arquivos .csv.

Isso abre uma novidade maneira de ser rastreado ou, se um editor não quiser que seus arquivos .csv sejam rastreados, isso pode valer atualizar o robots.txt para excluir esses arquivos.

Valores separados por vírgula (CSV)

Arquivos de valores separados por vírgula (CSV) são arquivos de texto que salvam dados em formato tabular que pode ser exibido uma vez que uma planilha.

Os arquivos CSV contêm dados em texto simples, o que significa que os arquivos CSV não contêm elementos de estilo uma vez que fontes, nem imagens ou links ativos.

Eles são úteis para fazer coisas uma vez que enviar uma lista de URLs para rastreamento em softwares uma vez que o Screaming Frog.

Mas também são úteis para organizar dados em uma planilha.

A indexação de arquivos CSV é novidade

A capacidade do Google de indexar arquivos CSV é uma novidade funcionalidade porque uma pesquisa de “tipo de registo” no Google por arquivos CSV atualmente não retorna arquivos CSV.

Atualmente, pesquisas uma vez que as seguintes não retornam arquivos CSV:

  • tipo de registo:csv site:.gov
  • tipo de registo:csv site:.edu
  • tipo de registo:csv site:.com

O Google já usou arquivos CSV indiretamente

Um tanto curioso sobre a indexação de arquivos CSV pelo Google é que a semblante de pesquisa do Dataset do Google já utilizava arquivos CSV, mas aparentemente exclusivamente quando descritos com dados estruturados.

A documentação de dados estruturados do conjunto de dados na antiga documentação do desenvolvedor do Google (visível em Archive.org) afirma que os arquivos CSV são um padrão suportável para surgir nos recursos de pesquisa do conjunto de dados.

O uso de dados tabulares uma vez que semblante de pesquisa remonta a 2018, quando o Google anunciou que mostraria esse tipo de dados na pesquisa quando os dados fossem acompanhados de dados estruturados.

De pacto com a documentação original:

“Os conjuntos de dados são mais fáceis de encontrar quando você fornece informações de suporte, uma vez que nome, descrição, pai e formatos de distribuição são fornecidos uma vez que dados estruturados…

Cá estão alguns exemplos do que pode ser qualificado uma vez que um conjunto de dados:

  • Uma tábua ou registo CSV com alguns dados
  • Uma coleção organizada de tabelas
  • Um registo em formato proprietário que contém dados
  • Uma coleção de arquivos que juntos constituem qualquer conjunto de dados significativo
  • Um objeto estruturado com dados em qualquer outro formato que você pode querer carregar em uma utensílio próprio para processamento
  • Imagens capturando dados
  • Arquivos relacionados ao aprendizagem de máquina, uma vez que parâmetros treinados ou definições de estrutura de rede neural
  • Qualquer coisa que pareça um conjunto de dados para você”

O Google atualizou a documentação supra em 2022 e a redirecionou para a novidade documentação da Meão de Pesquisa.

A documentação atualizada deixa mais evidente que o Google depende de dados estruturados para usar arquivos CSV na semblante de pesquisa do conjunto de dados.

Mas será que essa mudança significará que o Google acabará por rastrear arquivos CSV e usá-los para aparências de pesquisa (além de dados tabulares anotados em dados estruturados)?

Isso é o que a documentação atual explica hoje:

“Os conjuntos de dados são mais fáceis de encontrar quando você fornece informações de suporte, uma vez que nome, descrição, pai e formatos de distribuição, uma vez que dados estruturados.

A abordagem do Google para invenção de conjuntos de dados faz uso de schema.org e outros padrões de metadados que podem ser adicionados a páginas que descrevem conjuntos de dados…

Cá estão alguns exemplos do que pode ser qualificado uma vez que um conjunto de dados:

Uma tábua ou registo CSV com alguns dados…”

CSV de indexação do Google relacionado à atualização recente?

A definição de atualização de algoritmo principal é quando o Google faz “mudanças significativas” e “amplas” em seu algoritmo principal.

Pode ser uma coincidência que a indexação dos arquivos CSV e a atualização do algoritmo principal tenham ocorrido praticamente ao mesmo tempo.

Mas pode ser necessário considerar se o Google melhorou seu mecanismo de rastreamento para poder indexar CSV ou se essa capacidade já existia.

Leia a lista atualizada de tipos de registo indexáveis:

Tipos de arquivos indexáveis ​​pelo Google

Leia a documentação do conjunto de dados mediano de pesquisa do Google:

Dados estruturados do conjunto de dados (Dataset, DataCatalog, DataDownload)

Imagem apresentada por Shutterstock/Jane Kelly

Últimas

Ilya Sutskever, cofundador da OpenAI e cientista-chefe de longa data, parte

Ilya Sutskever, cientista-chefe de longa data da OpenAI...

Intuitive Machines quer ajudar NASA a devolver amostras de Marte

A Intuitive Machines está procurando ajudar a remodelar...

Gemini Advanced ganha envio de documentos

O Google anunciou hoje diversas novidades para o...

Gemini 1.5 Pro chega ao Gemini Advanced

O Google anunciou durante o Google I/O 2024,...

Assine

spot_img

Veja Também

Ilya Sutskever, cofundador da OpenAI e cientista-chefe de longa data, parte

Ilya Sutskever, cientista-chefe de longa data da OpenAI...

Intuitive Machines quer ajudar NASA a devolver amostras de Marte

A Intuitive Machines está procurando ajudar a remodelar...

Gemini Advanced ganha envio de documentos

O Google anunciou hoje diversas novidades para o...

Gemini 1.5 Pro chega ao Gemini Advanced

O Google anunciou durante o Google I/O 2024,...

O OpenAI GPT-4o Hype era um troll no Google?

A OpenAI conseguiu roubar a atenção do Google...
spot_img

Ilya Sutskever, cofundador da OpenAI e cientista-chefe de longa data, parte

Ilya Sutskever, cientista-chefe de longa data da OpenAI e um de seus cofundadores, deixou a empresa.CEO da OpenAI, Sam Altman anunciado a notícia...

Intuitive Machines quer ajudar NASA a devolver amostras de Marte

A Intuitive Machines está procurando ajudar a remodelar a arquitetura da missão Mars Sample Return com sua própria tecnologia, baseada na arquitetura que...

Gemini Advanced ganha envio de documentos

O Google anunciou hoje diversas novidades para o seu sistema de inteligência artificial, o Gemini.✨ Conteúdo criado e publicado no:...