SEO y Adquisición

Crawl budget: definición y optimización para Google

Guillaume Sallé

Responsable de contenido y glosario de analítica

Actualizado el February 22, 2026

Definición rápida

El crawl budget es el número de páginas que el robot de exploración de Google (Googlebot) está dispuesto a explorar e indexar en un sitio web dentro de una ventana de tiempo determinada. El crawl budget viene determinado por dos factores: el límite de crawl (para no sobrecargar el servidor) y la demanda de crawl (basada en la popularidad y la frescura del contenido). El crawl budget designa, por tanto, un recurso limitado que los propietarios de sitios deben gestionar estratégicamente para asegurar que sus páginas prioritarias se exploren correctamente.

Cómo funciona

El crawl budget es un concepto introducido oficialmente por Google en su documentación para sitios de gran tamaño. Representa la capacidad de exploración que Googlebot asigna a un sitio determinado. Esta capacidad está influida por dos dimensiones: el límite de crawl (crawl rate limit), que define la velocidad a la que Googlebot puede explorar sin sobrecargar el servidor (vinculada a los tiempos de respuesta del servidor), y la demanda de crawl (crawl demand), que refleja el interés de Google por las URL del sitio según la popularidad (backlinks, tráfico) y la frescura del contenido. Ejemplo concreto: un sitio de e-commerce con 500 000 URL, de las cuales un 40 % son páginas filtradas (talla, color, precio), malgasta su crawl budget en páginas de bajo valor añadido. Resultado: las nuevas páginas de productos importantes tardan varias semanas en indexarse. Bloqueando las URL de filtros mediante el archivo robots.txt o la etiqueta noindex y enviando un sitemap XML limpio, el sitio orienta a Googlebot hacia las páginas prioritarias y acelera su indexación.

Por qué es importante

Para sitios pequeños (menos de 1 000 páginas), el crawl budget no suele ser un problema. En cambio, para sitios grandes (e-commerce, portales, sitios de noticias), se vuelve crítico. Un crawl budget mal gestionado significa que páginas importantes permanecen sin indexar durante semanas, reduciendo su potencial de tráfico orgánico. Es especialmente problemático para sitios con alta tasa de renovación de contenido (noticias, nuevos productos).

Cómo mejorarlo o utilizarlo

Para optimizar tu crawl budget: limpia tu arquitectura de URL eliminando o consolidando las páginas duplicadas, parametrizadas y de bajo valor (páginas de filtros, de búsqueda interna, de paginación sin contenido único). Bloquea las URL inútiles mediante robots.txt. Envía un sitemap XML actualizado a Google Search Console. Mejora el rendimiento del servidor para aumentar tu límite de crawl. Implementa redirecciones 301 en lugar de dejar páginas con error 404. Usa la etiqueta canonical para consolidar las señales en las páginas de referencia.

Con Sublim

Sublim te indica qué páginas de tu sitio reciben tráfico orgánico real, ayudándote a identificar las que merecen ser prioritarias para el crawl. Visualizando las páginas sin tráfico a pesar de estar indexadas, detectas fácilmente el contenido de bajo valor que consume innecesariamente tu crawl budget. Datos recopilados sin cookies, alojados en Europa.

Preguntas frecuentes

¿Cómo ver cómo Googlebot explora mi sitio?

Google Search Console ofrece un informe de «Estadísticas de exploración» que muestra el número de páginas exploradas al día, el tiempo medio de descarga de las páginas y los tipos de recursos explorados. También puedes analizar tus logs de servidor con herramientas como Screaming Frog Log File Analyser para ver exactamente qué URL visita Googlebot y con qué frecuencia.

¿Es importante el crawl budget para un sitio pequeño?

Para un sitio de menos de 1 000 páginas bien estructurado, el crawl budget no suele ser un problema. Googlebot explora completamente los sitios pequeños en pocos días. Los problemas de crawl budget afectan principalmente a sitios grandes (e-commerce, portales) con miles o millones de URL potenciales.

¿Las páginas bloqueadas en robots.txt consumen crawl budget?

Sí, Googlebot lee el archivo robots.txt de cada dominio, pero aun así puede visitar una URL bloqueada para comprobar si el bloqueo sigue activo. Sin embargo, no indexará su contenido. Para ahorrar plenamente el crawl budget en páginas sin valor SEO, combina el bloqueo en robots.txt con la eliminación de los enlaces internos que apuntan a esas URL.

Términos relacionados

Indexación

La indexación es el proceso mediante el cual un motor de búsqueda como…

Sitemap XML

El sitemap XML es un archivo en formato XML que lista todas las URL im…

SEO (Search Engine Optimization)

El SEO (Search Engine Optimization) es el conjunto de prácticas destin…

Etiqueta canónica

La etiqueta canónica es una etiqueta HTML colocada en la sección `<hea…

Volver al glosario