OpenByt - A sua melhor fonte de conhecimento gratuito sobre WordPress

Compreender os Sitemaps e a sua importância para o seu Web site

A mapa do sítio é um ficheiro onde fornece informações sobre as páginas, os vídeos, as imagens e outros ficheiros do seu sítio Web e as relações entre eles. Motores de pesquisa como Google utilizam este ficheiro para rastrear o seu sítio Web de forma mais eficiente. Os mapas de sítios ajudam os motores de busca a compreender quais as páginas ou ficheiros do seu sítio que são mais essenciais e fornecem detalhes adicionais, como quando uma página foi actualizada ou se existem versões linguísticas alternativas.

Num mapa do site, pode fornecer detalhes para diferentes tipos de conteúdo, incluindo vídeos, imagens e artigos de notícias. Por exemplo:

Precisa de um Sitemap?

Um mapa do sítio pode continuar a desempenhar um papel crucial mesmo que o seu sítio esteja bem estruturado com ligações internas adequadas, em que todas as páginas necessárias são acessíveis através de ligações de navegação (como menus). É particularmente benéfico para sítios Web grandes e complexos ou para os que têm tipos de conteúdo específicos, como os multimédia (vídeos e imagens) ou notícias.

Deve considerar a utilização de um mapa do sítio se:

Por outro lado, pode não precisar de um mapa do sítio se:

Como o Googlebot rastreia o seu site

Googlebot is the name of Google’s web crawler, responsible for discovering and indexing content on the web. There are two versions:

Ambos os tipos de Googlebot seguem as mesmas regras no seu ficheiro robots.txt. No entanto, como o Google utiliza principalmente indexação mobile-first, most crawls are done by the mobile version. This means that your website’s mobile performance and structure play a crucial role in how Google indexes your content.

Googlebot crawls websites at an average pace of once every few seconds. This frequency can vary depending on your site’s size and the amount of new content. Google uses distributed computing, with multiple crawlers working simultaneously from different IP addresses. This helps improve performance and ensures that Googlebot doesn’t overload your servers with requests.

Para otimizar a localização, o Googlebot pode utilizar HTTP/2 se o seu sítio Web o suportar, o que reduz a carga tanto no seu servidor como no rastreador. No entanto, não existe qualquer vantagem de classificação na utilização do HTTP/2 em relação ao HTTP/1.1. Pode bloquear o rastreio do Googlebot através de HTTP/2 devolvendo um 421 Código de estado HTTP quando é feita uma tentativa de rastejamento.

Managing Googlebot’s Crawl Frequency and Limits

O Googlebot gere automaticamente a sua taxa de rastreio para a maioria dos sítios Web para evitar sobrecarregar o seu servidor. No entanto, se o seu servidor não conseguir acompanhar os pedidos do Googlebot, pode utilizar Consola de pesquisa do Google para reduzir a velocidade de deslocação.

O Googlebot está programado para rastrear até ao primeiro 15MB de um ficheiro HTML ou de um ficheiro baseado em texto suportado. Depois de atingir este limite de tamanho, o Googlebot deixa de rastrear o ficheiro e apenas os primeiros 15 MB são considerados para indexação. É importante notar que este limite se aplica a dados não comprimidos. Por conseguinte, se as suas páginas forem enormes, poderá querer otimizar os seus ficheiros para garantir que todo o conteúdo crítico se encontra nos primeiros 15 MB.

Bloquear o Googlebot de rastrear determinadas páginas

Se quiser impedir que o Googlebot rastreie páginas específicas do seu site, existem algumas opções:

Verifying Googlebot’s Identity

It’s essential to verify the authenticity of requests claiming to be from Googlebot because other crawlers can spoof Googlebot’s identity. The best way to confirm a request from Google is to check the request’s IP address and verify it against Google’s official list of Endereços IP do Googlebot.

Conclusão: É necessário um Sitemap para o seu sítio Web?

In conclusion, while Google can often find and crawl your website without a sitemap, there are situations where using a sitemap is highly beneficial. For large or new websites or those with rich media content, a sitemap is a valuable tool that helps search engines like Google discover and prioritize your content more efficiently. By providing a detailed sitemap, you ensure that your most important pages are indexed and visible in search results, potentially improving your website’s performance in search rankings.

Sair da versão móvel