Escrito por Sandra López
Índice
Qué es un sitemap
El sitemap es un archivo con un listado de las páginas que componen un sitio web. Los archivos sitemap facilitan el descubrimiento y rastreo de páginas para los robots de los buscadores. También son útiles para comparar el número de páginas indexadas con el de las enviadas en el sitemap, tal como vemos en Google Search Console. Las URLs incluidas en un sitemap deben corresponder a páginas actuales que consideramos importante indexar. Por eso se deben mantener actualizados.
Los buscadores que utilizan este protocolo de Sitemaps son: Google, pionera creando Google Sitemaps, Yahoo!, Bing, Ask.com y MSN.
El formato que se debe usar a la hora de crear este archivo es .XML, aunque los motores de búsqueda también admiten y leen otros archivos de texto y fuentes web RSS. Se listan en él las URL que queremos indexar del sitio web y se suele acompañar de metadatos que aportan información fundamental a los buscadores sobre la fecha de su última actualización, jerarquía de las URL y la frecuencia de modificación del mismo.
Ventajas del sitemap
Ayudan a los buscadores a rastrear de manera óptima e inteligente nuestro sitio web, pudiendo llegar, gracias a su jerarquización, a niveles más profundos e indexar así el contenido que deseamos tener en Google.
Por tanto, mejoran la indexación, de manera que pueden estar tus contenidos disponibles para el usuario en los buscadores cuando éstos estimen oportuno mostrarlos por considerarlos relevantes para las búsquedas realizadas.
Normalmente un sitio web bien enlazado, estructurado y de una arquitectura jerárquicamente bien construida, puede ser rastreado sin problemas por los bots de los buscadores, pero se hace fundamental tenerlo cuando es un sitio web muy grande, en el que pueden no llegar a rastrear páginas muy profundamente o deficientemente enlazadas; para sitios nuevos, con pocos enlaces externos y que queremos indexar lo antes posible; o si tienes una web de noticias u otros contenidos de soporte interactivo, para que Google los categorice y gestione de manera óptima.
Facilitan el trabajo a los rastreadores al indicarle con los metadatos el tipo de contenido que contiene cada URL o grupo de éstas, al poder especificar en el sitemap el tipo de archivos que va a encontrar: vídeos, imágenes o para móviles.
Cómo elaborar un sitemap
Formato de sitemap .XML con codificación UTF-8
Lo primero que te recomendaremos será usar el etiquetas de datos .XML y con codificación UTF-8, como vemos en la primera línea de código de la URL que lo contiene. En el ejemplo se observa la especificación del formato y la codificación que recomendamos, así como una muestra del listado de URL que contiene.
Gracias a los datos estructurados, podemos añadir datos adicionales a Google que le especifique elementos como la hora de la última actualización (<lastmod>), la frecuencia de rastreo (<changefreq>), la prioridad jerárquica (<priority>) y la URL en cuestión
En la imagen se contempla como el sitemap puede generarse con un plugin del CMS, es decir, un pequeño programa para el gestor de contenidos con el que creamos la web que nos facilita automáticamente el sitemap. Es recomendable revisar su funcionamiento y no dejarlo todo al automatismo.
La URL que contiene el sitemap, será parecida a la que mostramos a continuación.
Otros formatos que podemos utilizar
Además del formato que te hemos recomendado anteriormente, puedes elaborar tu sitemap con otros formatos admitidos:
- RSS, mRSS y Atom 1.0, en el caso de que tengas un blog con feed RSS o Atom, es recomendable enviar la URL del feed en cuestión en el sitemap.
- Texto, a través del envío de un archivo de texto .txt que contenga las URL, una por línea. No olvides igualmente codificar el archivo con UTF-8.
- Google Sites, si elaboras la web con él, te generará automáticamente el sitemap para enviar a Google.
Otros tipos de Sitemap
Si tu sitio web tiene habitualmente diferentes contenidos multimedia, deberemos utilizar las extensiones anteriormente nombradas para indicarle al buscador la existencia de esas agrupaciones de contenido multimedia:
- Sitemaps de vídeos, informan al buscador de los contenidos de vídeo que tenemos, éste los categoriza como tales y pueden ser luego encontrados en los resultados de búsqueda de Google vídeos, que ofrecerá el resultado junto a una miniatura del video que le proporcionaremos o generará automáticamente.
xmlns:video="http://www.ejemplo.com/schemas/sitemap-video/1.1"
- Sitemaps de imágenes, le indican al buscador los contenidos de imagen de la web, que aparecerán en los resultados de búsqueda de imágenes de Google ya que el sitemap va a ayudarle con este contenido que pudiera no identificar per se, facilitando su indexación. Puedes incluir hasta 1.000 imágenes por sitemap.
xmlns="http://www.ejemplo.com/schemas/sitemap-image/1.1"
- Sitemaps de Noticias, Google News, conteniendo en él solo las URL de los artículos publicados en los últimos dos días. Informa de contenidos de noticas que aparecerán en los resultados de búsqueda como tales y permanecerán en el índice de Google News durante 30 días. Puede contener hasta 1.000 URL. No crees nuevos sitemaps al incluir noticias, sino que actualiza el que tienes subido. Muy importante tener el portal dado de alta en el Centro de editores de Google News.
xmlns:news="http://www.ejemplo.com/schemas/sitemap-news/0.7
- Sitemaps para teléfonos de gama baja, que debes crear sólo si tienes una versión de la página para estos dispositivos. Debemos incluir la etiqueta <mobile:mobile/> para garantizar su indexación.
xmlns:mobile="http://www.ejemplo.com/schemas/sitemap-mobile/1.0
Buenas prácticas en sitemap
Debes tener en cuenta que el sitemap debe contener todas las URL que queramos indexar y que ofrezcan un código de respuesta del servidor 200, por lo que debes enviarlo en los formatos correctos anteriormente indicados e incluir en ellos las URL propias del sitio, con el formato correcto y que no recogan identificadores de sesión.
Si tu portal es multiidioma, incluye las URL canónicas de cada idioma e indica a Google su correspondiente en el resto de idiomas con las etiquetas hreflang.
Recuerda que cada sitemap debe contener un máximo de 50.000 URLs (salvo en los casos de los Sitemaps citados en el anterior punto), además de no superar los 10 MB de tamaño (sin comprimir), por lo que si incluyes varios sitemap para un sólo sitio web, es recomendable el crear y enviar a Google un archivo de índice de sitemaps que incluya todos .
Envía el sitemap a Google, con el archivo robots.txt de la página, a través de especificarlo en su contenido.
Puedes hacerlo igualmente utilizando la herramienta Google Search Console, donde además de enviar los sitemaps, puedes comprobarlos. En la plataforma podrás también comprobar el índice saturación en sitemaps, es decir, la relación entre las páginas que enviamos a Google y las que se indexan definitivamente. El objetivo de la indexabilidad será que la saturación en sitemaps tienda al 100%, estando todas las páginas disponibles, indexadas
Ubica el sitemap en la raíz del servidor con el nombre sitemap.xml a la hora de alojarlo en el servidor y actualizalos con regularidad, para que exista una coherencia entre el contenido que le indicamos al buscador que indexe y el existente en nuestro sitio web.