Ícone do site Gazeta do Cerrado

Dados expostos em vazamento revelam como o Google funciona; entenda

Imagem: Scott Barbour/Getty Images

Um grande vazamento no início desta semana abriu uma das principais caixas-pretas da internet: o Search Engine Optimization (SEO), ou Otimização para motores de busca, em tradução livre. O sistema do Google define quais páginas estarão no topo do buscador mais popular do mundo.

O funcionamento do SEO da gigante de Mountain View veio à tona em um documento de quase 2,6 mil páginas publicado por Rand Fishkin e Mike King, especialistas em SEO. Eles revelaram que as informações estavam no GitHub e foram repassadas pelo leaker Erfan Azimi, que queria explanar as “mentiras” sobre o algoritmo de buscas.

O assunto sempre foi um segredo guardado a sete chaves, já que o Google defendia que atores maliciosos poderiam se valer das informações para ranquear bem nas buscas.

De fato, a justificativa até faz certo sentido. Contudo, o que mostram os documentos é que o Google se contradisse ou no mínimo deu informações imprecisas sobre como o site de pesquisas funciona.

Por que o assunto SEO é importante?

Muitos dados contidos no arquivo de quase 2,6 mil páginas sobre o SEO do Google são bastante técnicos. Por causa disso, a leitura e interpretação têm sido feita por especialistas da área.

O fato, porém, é que o vazamento mudará o entendimento sobre as engrenagens do principal buscador da internet. A questão é importante porque milhões de páginas mundo afora dependem de uma boa classificação para se manter relevante, gerar tráfego e consequentemente se monetizarem.

Muitos especialistas argumentam que o poder do Google é tão grande – já que teoricamente ele é a portaria da internet –, que o sistema poderia até ser entendido como um serviço público. De maneira prática, o buscador pode sumir com páginas importantes de interesse público, enquanto dá evidência a conteúdos menos relevantes.


E apesar de não ser possível saber o quão atual é a classificação de SEO mostrada pelos dados, o fato é que em algum momento o Google Search tem ou teve pelo menos 14 mil indicadores para ranquear os sites na internet.

Dentro deste número gigantesco de parâmetros analisados estão a autoridade da página em determinado assunto, tamanho, número de cliques, palavras-chaves e muito mais. A granularidade é tão grande que torna bastante complexo o objetivo de entender as regras do jogo do SEO.

E para embaralhar ainda mais a mente dos especialistas em SEO, o vazamento sugere que o buscador estava sim fazendo algumas coisas que o Google havia dito que não.

Um dos principais exemplos é que o buscador aparentemente ranqueia páginas utilizando dados dos sites como número de cliques e dados dos usuários do Chrome. Anteriormente, representantes do Google afirmaram que estas informações não eram levadas em consideração.

Além disso, outro ponto importante é que o leak mostra que, contrariando o que o Google havia dito, um site popular com bastante acessos pode “furar fila” e ser mostrado primeiro no ranking de buscas em detrimento a sites desconhecidos, mesmo que eles tenham informações de pior qualidade.

Quais as revelações sobre o vazamento do SEO do Google?

O vazamento do SEO do Google pode ser apenas a ponta do iceberg, já que certamente o sistema ainda possui muitos segredos.

Apesar disso, as revelações municiam de argumentos aqueles que defendem vias mais democráticas e acessíveis de acesso às regras da “portaria da internet”.

Confira, a seguir, algumas das principais revelações sobre o vazamento do SEO do Google:

  • O Google Search pode definir um número máximo de páginas ou postagens de um site que aparecerão no buscador;
  • Diferente do que havia dito anteriormente, as Taxas de cliques (CTR) e tempo de permanência dos usuários em uma página são sim métricas para definir o ranqueamento dos sites no Google;
  • O buscador do Google possui classificadores específicos sobre temas sensíveis como eleições, indicando que a classificação pode também levar em consideração o teor político dos sites;
  • O buscador do Google tem uma pontuação de autoridade geral para os sites, identificada como “siteAuthority”. Anteriormente, a big tech havia negado a existência de uma “autoridade de domínio geral”;
  • O buscador do Google utiliza dados coletados pelo Google Chrome – como visualizações de páginas através do navegador – para ranquear os sites. O Google já havia dito que não utilizava dados do software para isso;
  • Conteúdos podem ser despriorizados no topo da busca por conterem informações como links que não correspondem ao site alvo, links de pornografia, insatisfação do usuário e mais;
  • O Google possui um histórico com a cópia de cada versão de cada página que já foi indexada pelo buscador e, com isso, o Search pode se lembrar de cada alteração já realizada. Apesar disso, ele analisa somente 20 alterações em uma URL quando está analisando os links;
  • Os sites indexados pelo Google são avaliados em relação ao tempo em que eles estão no ar, ou seja, de acordo com a longevidade na internet. O comando “hostAge” é o responsável por isso;
  • O Google foi, no mínimo, impreciso em relação à diretriz EEAT (Experiência, Especialização, Autoridade e Confiabilidade, em português) para os sites. A empresa disse que a diretriz serviria somente para melhorar a experiência do usuário, mas aparentemente utiliza esses dados também para ranquear as páginas.

O que diz o Google?

O Google confirmou a veículos como o The Verge que o vazamento é real. Contudo, um porta-voz da big tech defendeu que não é possível tirar conclusões precisas acerca dos dados expostos publicamente.

“Nós deixamos um alerta sobre fazer suposições imprecisas sobre a Pesquisa [do Google] com base em informações fora de contexto, desatualizadas ou incompletas”, afirmou o porta-voz Davis Thompson.

“Nós compartilhamos informações extensas sobre como a Pesquisa funciona e os tipos de fatores que nossos sistemas pesam, ao mesmo tempo em que trabalhamos para proteger a integridade de nossos resultados da manipulação”, concluiu.

Sair da versão mobile