sitemap.xml ¿Qué es y como funciona?

Tras hablaros la semana pasada del archivo robots.txt, hoy os explicaremos otro de los archivos básicos del SEO, explicaremos qué es este archivo y para qué sirve, además de aportar un poco de información curiosa sobre el mismo para que tengáis toda la información necesaria sobre el mismo.

sitemap.xml el mapa del sitio

Como ya hemos comentado el sitemap.xml es un archivo, que como indica su extensión es de tipo XML. Los archivos XML (eXtensible Markup Language o lenguaje de marcas extensible)  son utilizados para almacenar datos en forma legible y estructurada.

¿Qué es el sitemap.xml?

De una forma simple se puede decir que los sitemaps son archivos que XML que contienen todas las páginas que componen una web. No serían exactamente todas, puesto que se puede eligir las páginas que quieres que aparezcan en el archivo XML. Estos archivo sirven de guía a las arañas o robots de los buscadores para realizar un rastreo optimizado de la web. Un archivo sitemap.xml generado correctamente, junto con otras pautas, conseguirá que nuestro sitio web se indexe de forma adecuada.

¿Cómo funciona el sitemap.xml?

A diferencia del robots.txt del que hablamos la semana pasada, que tiene una estructura muy simple y se puede escribir en poco segundos, la estructura del sitemap.xml es más compleja, pero al ser un XML, ésta está bien definida y seccionada en partes que permiten su sencilla lectura, aquí podéis ver un ejemplo de un archivo sitemap.xml

<urlset>
	<url>
		<loc>http://www.ejemplo.com/</loc>
		<lastmod>2013-07-12</lastmod>
		<changefreq>weekly</changefreq>
		<priority>1</priority>
	</url>

	<url>
		<loc>http://www.ejemplo.com/isocialweb.htm</loc>
		<lastmod>2013-07-22</lastmod>
		<changefreq>monthly</changefreq>
		<priority>0.5</priority>
	</url>
</urlset>

Como se ve en el ejemplo cada una de las secciones tiene una etiqueta que define la misma, por lo que es importante conocer las diferentes etiquetas para saber su funcionalidad y hacer un correcto uso de las mismas.

Etiquetas del sitemap.xml

<urlset> : Indica el comienzo del código, sería la etiqueta de apertura, que finalizaría con </urlset>

<url> : Especifica que el bloque que contendrá esta etiqueta es una url, tendremos una por cada una de las urls que vayamos a especificar en el sitemap.xml

<loc> :  El contenido de esta etiqueta define la ruta de la url, esta a su vez debe incluir el protocolo (http, https,…)

Estas tres primeras etiquetas son las obligatorias, pero además de ellas podemos incluir:

<lastmod> : Indica la fecha de la última modificación del archivo. Además de la fecha se puede incluir o no la hora de modificación, el formato de fecha debe ser: AAAA-MM-DD

<changefreq> :   Especifica la frecuencia con la que la página se modifica, este campo puede contener los siguiente valores:

  • always : cada vez que se accede al documento este cambia
  • hourly :  cada hora
  • daily : cada día
  • weekly : cada semana
  • monthly : cada mes
  • yearly : cada año
  • never : no se modifica nunca.

<priority> : Define global de la web en comparación con el resto de páginas. Esto puede ayudar a los buscadores a priorizar un resultado en deprimento en los resultados de búsqueda. El valor de esta etiqueta puede ir de 0,0 a 1,0 y su valor predeterminado es de 0,5.

Información adicional del sitemap.xml

Ubicación: El sitemap.xml puede estar ubicado y es su ubicación recomendada en el directorio raíz, aunque podría localizarse en una subcarpeta.

Compresión: El archivo sitemap.xml se puede almacenar también comprimido en formato GZIP, por lo que sería un archivo sitemap.xml.gz

Limitación: Un sitemap no puede tener más de 50.000 URLs y 10 Megas de peso, para solventar este problema podemos usar la compresión y dividir este archivo en varios.

¿Cuando es recomendable tener sitemap.xml?

Tener un archivo sitemap.xml no cuesta mucho, actualmente existen plugins que lo generan y renueva de forma automática, o incluso webs que generan el sitemap de tu sitio con un simple click de ratón, como por ejemplo: XML-Sitemaps.com

Pero existe una serie de circunstancias en las que es recomendable tener dicho archivo en tu web:

  • Si dispones de una web con contenido dinámico.
  • El alguna de las páginas de tu web, son difíciles de encontrar para los robots de búsqueda, por ejemplo, las páginas que incluyen imágenes o contenido AJAX enriquecido.
  • Cuando el sitio es de reciente creación.
  • Si tienes una web grande y el contenido de la misma no está correctamente enlazado o directamente no está enlazado.

Envió del sitemap a los buscadores

Como ya hemos comentado en varias ocasiones el uso de las herramientas para webmaster es muy recomendable y en este caso toma una mayor relevancia. Hacer uso de las herramientas para webmaster de Google nos permitirá enviar directamente a Google nuestro sitemap, de igual forma podemos hacerlo con Yahoo o Bing.

Artículos relacionados
Deja tu respuesta

Respuestas de otros usuarios:

  • Escrito 7 Febrero, 2014
    Jose Lopez

    Interesante artículo. No deje de escribir información tan valiosa como esta. Gracias