Sitemap XML: definición, creación y envío a Google

Actualizado el February 22, 2026
Definición rápida
El sitemap XML es un archivo en formato XML que lista todas las URL importantes de un sitio web para ayudar a los motores de búsqueda como Google a descubrirlas y rastrearlas de forma eficaz. El sitemap XML es una recomendación (no una obligación) que facilita la indexación de las páginas, especialmente en sitios de gran tamaño o cuando algunas páginas no están bien conectadas mediante enlaces internos. El sitemap XML puede incluir metadatos como la fecha de última modificación, la frecuencia de cambio y la prioridad relativa de las páginas.
Cómo funciona
El sitemap XML sigue un formato estandarizado definido por el protocolo sitemaps.org y aceptado por todos los grandes motores de búsqueda (Google, Bing, Yandex). Su estructura básica es sencilla: cada URL se encapsula en una etiqueta `<url>` que contiene como mínimo una etiqueta `<loc>` con la URL completa. Pueden añadirse etiquetas opcionales como `<lastmod>` (fecha de última modificación), `<changefreq>` (frecuencia estimada de modificación) y `<priority>` (prioridad relativa de 0,0 a 1,0). El archivo sitemap.xml suele colocarse en la raíz del sitio (https://www.misitio.com/sitemap.xml) y declararse en el archivo robots.txt. Es posible crear sitemaps de índice para sitios grandes (más de 50 000 URL o 50 MB), así como sitemaps de imágenes, vídeos o noticias. Ejemplo concreto: un sitio de e-commerce con 80 000 referencias de producto crea un sitemap-productos.xml, un sitemap-categorias.xml y un sitemap-articulos.xml, todos referenciados en un sitemap-index.xml. Envía este último a Google Search Console y puede seguir la tasa de indexación de cada sitemap por separado.
Por qué es importante
El sitemap XML es especialmente importante para sitios con pocos enlaces internos hacia ciertas páginas, sitios nuevos cuya autoridad aún no basta para garantizar que Googlebot encuentre todas las páginas, sitios con contenido actualizado con frecuencia (noticias, productos) y sitios grandes en los que el crawl budget debe orientarse a las páginas prioritarias. Enviar un sitemap a Google Search Console también ofrece un informe detallado del estado de indexación de cada URL.
Cómo mejorarlo o utilizarlo
Para un sitemap XML eficaz: incluya únicamente las URL canónicas que desea que se indexen (evite las páginas en noindex, los parámetros de URL y las páginas de filtros). Actualice `<lastmod>` con cada modificación significativa del contenido. Envíe su sitemap a Google Search Console y a Bing Webmaster Tools. En sitios grandes, segmente su sitemap por tipo de contenido. Revise con regularidad el informe de cobertura de Search Console para detectar URL enviadas pero no indexadas.
Con Sublim
Sublim complementa su sitemap XML mostrándole qué URL enviadas generan realmente tráfico orgánico y cuáles están indexadas pero son invisibles para los usuarios. Esta visión cruzada entre sitemap y analítica, sin cookies y conforme al RGPD, le permite priorizar su contenido e identificar las páginas que deben mejorarse o consolidarse.
Preguntas frecuentes
¿Es obligatorio un sitemap XML para el SEO?
No, un sitemap no es obligatorio. Google puede descubrir e indexar sus páginas únicamente a través de los enlaces internos y los backlinks. No obstante, se recomienda encarecidamente para acelerar la indexación, especialmente en sitios nuevos, sitios grandes y sitios con contenido actualizado con frecuencia. Es una buena práctica básica de SEO con un coste reducido.
¿Cuántas URL puede contener un sitemap XML?
Un archivo sitemap XML puede contener un máximo de 50 000 URL y no debe superar los 50 MB sin comprimir. Si su sitio supera estos límites, debe crear varios archivos sitemap y referenciarlos en un archivo de índice de sitemaps (`sitemapindex.xml`). Este archivo de índice lista todos sus sitemaps y es el único que se envía a Search Console.
¿Hay que incluir la prioridad y la frecuencia en el sitemap?
Las etiquetas `<changefreq>` y `<priority>` son opcionales y Google indica oficialmente que no las utiliza para decidir la frecuencia de rastreo. La etiqueta `<lastmod>`, en cambio, sí es útil: Google la utiliza para detectar contenidos actualizados y volver a rastrearlos de forma prioritaria. Aportar un `<lastmod>` preciso y fiel a la realidad es la práctica más útil.
Términos relacionados
El crawl budget es el número de páginas que el robot de exploración de…
La indexación es el proceso mediante el cual un motor de búsqueda como…
La etiqueta canónica es una etiqueta HTML colocada en la sección `<hea…
El SEO (Search Engine Optimization) es el conjunto de prácticas destin…