Quer saber como é feita a indexação do seu site no Google? Legal! Isso indica que você está preocupado com a relevância do seu site. Para garantir o seu sucesso na Internet é crucial entender como o Google encontra o seu site e o coloca no índice de resultados.
O conteúdo deste artigo é baseado na documentação oficial do Google.
Indexação do seu site
Conteúdo extraído da documentação oficial do Google: https://support.google.com/webmasters/answer/70897.
Para que um site seja exibido no índice de resultados do Google, ele passa por três passos: Rastreamento, indexação e publicações de resultados.
Veja também: Quanto tempo leva para posicionar um site no topo do Google?
Rastreamento
O rastreamentos de novas páginas e páginas atualizadas é feito pelo Googlebot. Googlebot é o robô (também conhecido como bot ou spider) de rastreamento da Web do Google, um conjunto massivo de computadores trabalhando com o algoritmo de pesquisa capaz de verificar bilhões de páginas por toda a web.
O processo de rastreamento começa com uma lista de URLs de páginas geradas a partir dos processos anteriores e ampliada por sitemaps fornecidos pelos webmasters dos sites. A medida que o bot do Google vai visitando os sites, ele encontra os links das páginas e as coloca na lista de páginas a serem rastreadas. Tudo isso vale para novos sites, alterações em sites já indexados no Google e até mesmo links inativos.
Indexação
Depois do rastramento, o Googlebot processa as páginas e as compila em um gigantesco índice com todas as palavras encontradas e sua localização em cada página. Aqui, também são processadas outras informações pertinentes como os atritutos e tags de conteúdo (como o atributo alt das imagens) e tags html de títulos (h2). Há também tipos de conteúdos que não podem ser processados pelo Google, como conteúdos em flash. Se você os tem no seu site está na hora de atualizar para uma tecnologia mais nova.
Publicação dos resultados
Assim que um usuário do google faz uma procura através de certas palavras, o cluster de máquinas do Google procura em seu índice de páginas e entrega páginas relacionadas as palavras usadas na busca pelo usuário. Os resultados entregues são os que o algoritmo julga mais relevantes para o usuário. Essa relevância é determinada por mais de 200 fatores. Práticas como links de spam afetam negativamente os resultados. Os melhores tipos de links são aqueles retornados com base na qualidade do conteúdo. Sendo assim, aposte em um conteúdo de qualidade e condizente com o restante do seu site.
Quanto tempo demora para o meu site ser indexado no Google?
Conteúdo extraído da documentação oficial do Google: https://support.google.com/webmasters/answer/34439.
Não há como saber um tempo exato e nem de quanto em quanto tempo são feitos novos rastreios. Os rastreamentos são baseados em muitos fatores, como ranqueamento da página, links para uma página, e restrições de rastreamento como o número de parâmetros em um URL. Qualquer número de fatores pode afetar a frequência de rastreamento do seu site. Os algoritmos do Google determinam quais sites devem ser indexados, e com que frequência, e quantas páginas devem ser buscadas em cada site.
Como saber se seu site está sendo encontrado pelo Google
O Googlebot encontra sites seguindo os links de todas as páginas. A página Erros de rastreamento no Search Console lista todos os problemas encontrados ao rastrear seu site. É importante que você revise esses erros de rastreamento regularmente para identificar problemas no site. Além disso, a melhor ferramenta para controlar o que está sendo indexado sobre seu site é o Google Search Console. Através dele é possível verificar erros de indexação e até mesmo forçar a indexação de uma nova página ou página atualizada de seu site. Aprenda mais aqui: Google Webmasters.
Arquivo robots.txt
É um arquivo que você coloca em seu FTP e que está totalmente relacionado a indexação do site. Através dele é possível definir quais partes do seu conteúdo serão ou não indexadas. A criação do arquivo é bem simples, basta abrir um editor de texto, inserir as regras e salvar com o nome