BUSCA Y ENCONTRARAS

jueves, 9 de febrero de 2017

Nuevo sitemap XML de serie en Blogger, Blogspot

Sitio de Referencia Nuevo sitemap XML de serie en Blogger

Esto es una sorpresita que hallé casualmente.

Para que la veas tú también teclea la URL principal de tu blog en la barra de direcciones de tu navegador y añádele /robots.txt. Lo que estás viendo es el fichero de texto que en un principio se usa para que los rastreadores web no visiten ciertas páginas de tu sitio. Su misión básica es indicar a las arañas que páginas pueden recuperar (Allow) y cuáles deben evitar (Disallow).

Si no habéis personalizado vuestro robots.txt desde la opción Preferencias para motores de búsqueda del panel de control, lo que os debería salir hoy día será algo como esto:



Sitemap XML para Blogger


Ahí podéis ver que se indica que no se deben indexar las direcciones que incluyan el parámetro /search y cómo por el contrario, sí que se deben recuperar todas las que cuelguen del dominio principal (/) (excepto las anteriores, claro).


El nuevo sitemap

Pero lo interesante que vemos ahí y que antes no estaba, es esa dirección que aparece al final con extensión .xml y que indica a los rastreadores cuál es la dirección de nuestro sitemap, una especie de mapa con el que los ayudamos a encontrar hasta el último rincón de nuestra web.

En realidad es una lista de todas las páginas del sitio (direcciones únicas) que incluye también algunos datos importantes como la fecha de actualización. Con esos datos los motores de búsqueda podrán conocer, a modo de índice, como es la organización del contenido para que rastreen de manera más eficiente.

Por tanto, enviar tu sitemap a los distintos buscadores es una parte importante de la optimización de tu sitio web, porque no sólo facilitarás que se encuentren fácilmente todas las páginas publicadas, sino que también se descargarán más rápido cuando estas cambien.

Pues bien, aunque yo no lo he visto anunciado, creo que todos ahora tenemos uno. El mío está actualizado según Herramientas para webmasters el día 16 de Diciembre pasado, así que no debe tener mucho tiempo el invento.


Añadir el nuevo sitemap a Herramientas para webmasters

En Herramientas para webmasters hay un apartado dedicado a los sitemaps que nos permite asegurarnos de que Google recibe correctamente toda la información que este tipo de ficheros contiene. Pero ojo con lo que se entiende, que "recibir" no es lo mismo que "indexar" y si bien es conveniente hacerlo, no nos garantiza nada.


Para añadir este nuevo que tenemos ahora sólo hay que acceder allí, seleccionar la página para la que vais a mandar el sitemap (si tenéis varias) y dentro del menú lateral buscar la opción con ese nombre dentro del apartado rastreo.

Enviar un sitemap con Herramientas para webmasters

Una vez allí pincháis en el botón Añadir o probar sitemap y en la ventana emergente tecleais "sitemap.xml", pues todo los ficheros se llaman igual y sólo cambia el dominio principal que ya sale automático. Con Enviar sitemap ya lo tendremos todo hecho y sólo nos queda esperar a que las arañas pasen... a veces unas horas, a veces algún día que otro.


Simultanear el formato Atom y el XML

Puede que en Herramientas para webmasters tengáis montado de antes algún sistema con Atom que sirve también como sitemap, construido con cadenas sucesivas como estas (*):

/atom.xml?redirect=false&start-index=1&max-results=500
/atom.xml?redirect=false&start-index=501&max-results=500
/atom.xml?redirect=false&start-index=1001&max-results=500
etc.

(*) Cada línea sirve sólo para 500 entradas como máximo.


Eso es lo único que teníamos en Blogger hasta ahora y por eso supongo que muchos lo tendréis ya. En cualquier caso no viene mal añadir ambos formatos.

La diferencia principal entre los que tienen el formato XML y los RSS/Atom es que los primeros detallan todas las URL que hay dentro de un sitio mientras que los segundos suelen incluir sólo las que tienen fecha de actualización más reciente. Por eso unos sirven para dar una información completa que se recorre más de tarde en tarde y los otros ayudan a que los cambios más recientes se actualicen antes.


Índice de sitemaps

Una última cosa. Si tenéis muchas entradas es posible que vuestro sitemap se haya dividido en varias páginas y entonces no veréis en él directamente la relación de todas vuestras URLs. En ese caso lo que veréis será un índice de sitemaps o relación de sitemaps parciales, dentro de cada uno de los cuales sí que podréis ver todas los artículos publicados:

http://www.oloblogger.com/sitemap.xml?page=1
http://www.oloblogger.com/sitemap.xml?page=2
http://www.oloblogger.com/sitemap.xml?page=3
etc.


¿Vemos otro post al azar por si le encuentras utilidad o quizás prefieres ser más metódico y suscribirte a nuestras entradas por correo? También puedes imprimir este artículo y por supuesto compartirlo en redes sociales si fue de tu agrado.