Posts Recentes:

Google PageRank explicado para iniciantes em SEO


Comemore as festas de fim de ano com alguns dos melhores artigos da SEJ de 2023.

Nossa série Festive Flashback vai de 21 de dezembro a 5 de janeiro, apresentando leituras diárias sobre eventos significativos, fundamentos, estratégias viáveis ​​e opiniões de líderes inovadores.

2023 foi bastante agitado na indústria de SEO e nossos colaboradores produziram alguns artigos excelentes para acompanhar e refletir essas mudanças.

Acompanhe as melhores leituras de 2023 para ter muito o que refletir à medida que avança para 2024.


O PageRank já esteve no centro da pesquisa – e foi o que fez do Google o império que é hoje.

Mesmo que você acredite que a pesquisa deixou de ser o PageRank, não há como negar que esse é um conceito difundido no setor há muito tempo.

Todo profissional de SEO deve ter uma boa noção do que era o PageRank – e do que ainda é hoje.

Neste artigo, abordaremos:

  • O que é PageRank?
  • A história de como o PageRank evoluiu.
  • Como o PageRank revolucionou a pesquisa.
  • Barra de ferramentas PageRank vs. PageRank.
  • Como funciona o PageRank.
  • Como o PageRank flui entre as páginas.
  • O PageRank ainda é usado?

Vamos mergulhar.

O que é PageRank?

Criado pelos fundadores do Google, Larry Page e Sergey Brin, o PageRank é um algoritmo baseado na força relativa combinada de todos os hiperlinks na Internet.

A maioria das pessoas argumenta que o nome foi baseado no sobrenome de Larry Page, enquanto outros sugerem que “Page” se refere a uma página da web. Ambas as posições são provavelmente verdadeiras e a sobreposição foi provavelmente intencional.

Quando Page e Brin estavam na Universidade de Stanford, escreveram um artigo intitulado: O PageRank Citation Ranking: Trazendo Ordem para a Web.

Publicado em janeiro de 1999, o artigo demonstra um algoritmo relativamente simples para avaliar a força das páginas da web.

patente de pagerank: páginas iniciaisImagem de patentes.google.com, abril de 2023patente de pagerank: páginas iniciais

O artigo tornou-se patente nos EUA (mas não na Europa, onde as fórmulas matemáticas não são patenteáveis).

início ao fim do processo de pagerankImagem de patentes.google.com, abril de 2023início ao fim do processo de pagerank

A Universidade de Stanford possui a patente e a atribuiu ao Google. A patente está atualmente prevista para expirar em 2027.

processo pantente do pagerankImagem de patentes.google.com, abril de 2023processo pantente do pagerank

A história de como o PageRank evoluiu

Durante seu tempo em Stanford, no final da década de 1990, Brin e Page estavam estudando métodos de recuperação de informações.

Naquela época, usar links para descobrir o quão “importante” cada página era em relação a outra era uma forma revolucionária de ordenar as páginas. Foi computacionalmente difícil, mas de forma alguma impossível.

A ideia rapidamente se transformou no Google, que na época era um peixinho no mundo das buscas.

Havia tanta crença institucional na abordagem do Google por parte de algumas partes que a empresa inicialmente lançou seu mecanismo de busca sem capacidade de gerar receita.

E embora o Google (conhecido na época como “BackRub”) fosse o mecanismo de busca, o PageRank era o algoritmo usado para classificar as páginas nas páginas de resultados do mecanismo de busca (SERPs).

A dança do Google

Um dos desafios do PageRank era que a matemática, embora simples, precisava ser processada iterativamente. O cálculo é executado várias vezes, em todas as páginas e links da Internet. Na virada do milênio, essa matemática levou vários dias para ser processada.

Os SERPs do Google subiram e desceram durante esse período. Essas mudanças costumavam ser erráticas, pois novos PageRanks eram calculados para cada página.

Isso era conhecido como “Google Dance” e notoriamente paralisava os profissionais de SEO da época toda vez que o Google iniciava sua atualização mensal.

(O Google Dance mais tarde se tornou o nome de uma festa anual que o Google organizava para especialistas em SEO em sua sede em Mountain View.)

Sementes confiáveis

Uma iteração posterior do PageRank introduziu a ideia de um conjunto de “semente confiável” para iniciar o algoritmo, em vez de dar a cada página da Internet o mesmo valor inicial.

Surfista razoável

Outra iteração do modelo introduziu a ideia de um “surfista razoável”.

Este modelo sugere que o PageRank de uma página pode não ser compartilhado uniformemente com as páginas às quais ela vincula – mas pode ponderar o valor relativo de cada link com base na probabilidade de um usuário clicar nele.

O recuo do PageRank

Inicialmente, acreditou-se que o algoritmo do Google era “anti-spam” internamente, uma vez que a importância de uma página era ditada não apenas pelo seu conteúdo, mas também por uma espécie de “sistema de votação” gerado por links para a página.

A confiança do Google não durou, entretanto.

O PageRank começou a se tornar problemático à medida que a indústria de backlinks crescia. Portanto, o Google retirou-o da vista do público, mas continuou a confiar nele para seus algoritmos de classificação.

A barra de ferramentas PageRank foi retirada em 2016 e, eventualmente, todo o acesso público ao PageRank foi restringido. Mas a essa altura, o Majestic (uma ferramenta de SEO), em particular, conseguiu correlacionar muito bem seus próprios cálculos com o PageRank.

O Google passou muitos anos incentivando os profissionais de SEO a evitarem a manipulação de links por meio de sua documentação “Diretrizes do Google” e por meio de conselhos de sua equipe de spam, liderada por Matt Cutts, até janeiro de 2017.

Os algoritmos do Google também mudaram durante esse período.

A empresa dependia menos do PageRank e, após a compra da MetaWeb e do seu Knowledge Graph proprietário (chamado “Freebase” em 2014), o Google começou a indexar a informação mundial de diferentes maneiras.

PageRank da barra de ferramentas vs. Ranking da página

Inicialmente, o Google ficou tão orgulhoso de seu algoritmo que ficou feliz em compartilhar publicamente o resultado de seu cálculo com quem quisesse vê-lo.

A representação mais notável foi uma extensão de barra de ferramentas para navegadores como o Firefox, que apresentou uma pontuação entre 0 e 10 para cada página da Internet.

Na verdade, o PageRank tem uma gama de pontuações muito mais ampla, mas 0 a 10 deu aos profissionais e consumidores de SEO uma maneira instantânea de avaliar a importância de qualquer página na Internet.

A barra de ferramentas PageRank tornou o algoritmo extremamente visível, o que também trouxe complicações. Em particular, significava que estava claro que os links eram a maneira mais fácil de “enganar” o Google.

Quanto mais links (ou, mais precisamente, melhor o link), melhor será a classificação de uma página nas SERPs do Google para qualquer palavra-chave direcionada.

Isso significou que se formou um mercado secundário, comprando e vendendo links avaliados no PageRank da URL onde o link foi vendido.

Esse problema foi agravado quando o Yahoo lançou uma ferramenta gratuita chamada Yahoo Search Explorer, que permitiu a qualquer pessoa começar a encontrar links para qualquer página.

Posteriormente, duas ferramentas – Moz e Majestic – aproveitaram a opção gratuita construindo seus próprios índices na Internet e avaliando links separadamente.

Como o PageRank revolucionou a pesquisa

Outros motores de busca dependiam fortemente da análise do conteúdo de cada página individualmente. Esses métodos tinham pouco para identificar a diferença entre uma página influente e uma simplesmente escrita com texto aleatório (ou manipulativo).

Isso significava que os métodos de recuperação de outros mecanismos de pesquisa eram extremamente fáceis de serem manipulados pelos profissionais de SEO.

O algoritmo PageRank do Google, então, foi revolucionário.

Combinado com um conceito relativamente simples de “nGrams” para ajudar a estabelecer a relevância, o Google encontrou uma fórmula vencedora.

Logo ultrapassou os principais operadores da época, como AltaVista e Inktomi (que alimentavam o MSN, entre outros).

Ao operar no nível da página, o Google também encontrou uma solução muito mais escalável do que a abordagem baseada em “diretórios” adotada pelo Yahoo e posteriormente pelo DMOZ – embora o DMOZ (também chamado de Open Directory Project) tenha sido capaz de fornecer ao Google inicialmente um software de código aberto. diretório próprio.

Como funciona o PageRank

A fórmula do PageRank vem em várias formas, mas pode ser explicada em algumas frases.

Inicialmente, cada página da internet recebe uma pontuação estimada do PageRank. Pode ser qualquer número. Historicamente, o PageRank era apresentado ao público como uma pontuação entre 0 e 10, mas na prática as estimativas não precisam começar nesta faixa.

O PageRank dessa página é então dividido pelo número de links fora da página, resultando em uma fração menor.

O PageRank é então distribuído às páginas vinculadas – e o mesmo é feito para todas as outras páginas da Internet.

Então, para a próxima iteração do algoritmo, a nova estimativa do PageRank para cada página é a soma de todas as frações de páginas vinculadas a cada página específica.

A fórmula também contém um “fator de amortecimento”, que foi descrito como a chance de uma pessoa que navega na web parar de navegar completamente.

Antes do início de cada iteração subsequente do algoritmo, o novo PageRank proposto é reduzido pelo fator de amortecimento.

Esta metodologia é repetida até que as pontuações do PageRank atinjam um equilíbrio estabelecido. Os números resultantes foram então geralmente transpostos para um intervalo mais reconhecível de 0 a 10 por conveniência.

Uma maneira de representar isso matematicamente é:

Fórmula de classificação de páginaImagem do autor, abril de 2023Fórmula de classificação de página

Onde:

  • PR = PageRank na próxima iteração do algoritmo.
  • d = fator de amortecimento.
  • j = o número da página na Internet (se cada página tivesse um número único).
  • n=número total de páginas na Internet.
  • i = a iteração do algoritmo (inicialmente definido como 0).

A fórmula também pode ser expressa em forma de matriz.

Problemas e iterações para a fórmula

A fórmula tem alguns desafios.

Se uma página não tiver link para nenhuma outra página, a fórmula não alcançará um equilíbrio.

Nesse caso, portanto, o PageRank seria distribuído entre todas as páginas da Internet. Desta forma, mesmo uma página sem links de entrada poderia ser alguns PageRank – mas não acumularia o suficiente para ser significativo.

Outro desafio menos documentado é que as páginas mais recentes, embora potencialmente mais importante do que as páginas mais antigas, terão um PageRank mais baixo. Isso significa que, com o tempo, o conteúdo antigo pode ter um PageRank desproporcionalmente alto.

O tempo que uma página está ativa não é levado em consideração no algoritmo.

Como o PageRank flui entre as páginas

Se uma página começa com um valor de 5 e tem 10 links, então cada página vinculada recebe 0,5 PageRank (menos o fator de amortecimento).

Dessa forma, o PageRank flui pela Internet entre as iterações.

À medida que novas páginas chegam à Internet, elas começam com apenas uma pequena quantidade de PageRank. Mas à medida que outras páginas começam a ter links para essas páginas, seu PageRank aumenta com o tempo.

O PageRank ainda é usado?

Embora o acesso público ao PageRank tenha sido removido em 2016, acredita-se que a pontuação ainda esteja disponível para engenheiros de pesquisa no Google.

Um vazamento dos fatores usados ​​pelo Yandex mostrou que o PageRank permaneceu como um fator que poderia ser usado.

Os engenheiros do Google sugeriram que a forma original do PageRank fosse substituída por uma nova aproximação que requer menos poder de processamento para calcular. Embora a fórmula seja menos importante na forma como o Google classifica as páginas, ela permanece uma constante para cada página da web.

E independentemente de quais outros algoritmos o Google possa escolher, o PageRank provavelmente permanece incorporado em muitos dos sistemas do gigante das buscas até hoje.

Dixon explica como o PageRank funciona com mais detalhes neste vídeo:

Patentes e artigos originais para leitura mais aprofundada:

Mais recursos:


Imagem em destaque: VectorMine/Shutterstock

Últimas

Navigating The SEO Career Landscape: Degrees, Myths, And Realities

In the dynamic realm of search engine optimization...

O que é inventário de anúncios e por que é importante?

Temos escrito muito sobre o inventário de anúncios...

Google anuncia acordo para mostrar mais conteúdo do Reddit

O Google anunciou um acordo com o Reddit...

Assine

spot_img

Veja Também

Navigating The SEO Career Landscape: Degrees, Myths, And Realities

In the dynamic realm of search engine optimization...

O que é inventário de anúncios e por que é importante?

Temos escrito muito sobre o inventário de anúncios...

Google anuncia acordo para mostrar mais conteúdo do Reddit

O Google anunciou um acordo com o Reddit...

10web da Armênia traz construção de sites de IA para WordPress

A IA generativa fez um trabalho impressionante ao...
spot_img

Navigating The SEO Career Landscape: Degrees, Myths, And Realities

In the dynamic realm of search engine optimization (SEO), my career spans nearly two decades, starting in 2004 when I started working for...

O que é inventário de anúncios e por que é importante?

Temos escrito muito sobre o inventário de anúncios ao longo dos anos neste blog, mas você já pensou por que esse termo publicitário...