CÓMO HACER COMPATIBLE SU SITIO WEB CON LOS ROBOTS DE BÚSQUEDA DE INTERNET

Antes de comenzar con la optimización de su proyecto, verifique que su sitio web es compatible con los motores de búsqueda.

Se considera que un sitio web es compatible con los buscadores cuando es accesible e indexable por los mismos.

La indexabilidad de un sitio web se conoce como la capacidad para ser rastreado por los motores de búsqueda y ser incluido en sus índices, con el objetivo de facilitarles que almacenen y cataloguen toda la información que éste contiene.

Pero, ¿Cómo se comportan los motores de búsqueda de Internet?

Para ello utilizan programas llamados “Robots o Arañas” que recorren rápidamente toda la red siguiendo los enlaces de cada sitio, tanto internos como hacia otras páginas web, siguiendo a su vez los enlaces de éstos y añadiendo a sus índices toda la información que se encuentran.

Las arañas de los principales buscadores son:

Googlebot: el robot que utiliza Google para extraer toda la información de la red. Este robot no sólo extrae información de código html, sino que también extrae información de ficheros PDF, XLS y DOC entre otros.

Al número de documentos indexados en relación al total de páginas de su sitio se le llama “Saturación” o “Nivel de Saturación”.

Así pues, si su sitio consta de diez documentos y Google tiene almacenados cinco, su sitio tendrá un “Nivel de Saturación” de un 50%.

Uno de sus objetivos debe ser que los buscadores tengan almacenado en sus índices, el 100% del contenido de su sitio web que desee que aparezca en los resultados de búsqueda.

Para que su web sea accesible e indexable, las arañas de los buscadores no deben encontrar ningún tipo de barrera a la hora de rastrear su contenido. Tenga presente que las arañas no ven la web tal y como usted lo hace.

¿Cómo le ve una araña o robot a su página web?

Existen muchas herramientas para comprobar cómo visualizan las arañas el contenido y enlaces de un sitio web, como la que ofrece:

http://www.seo-browser.com y http://.webconfs.com/search-engine-spider-simulator.php

En el caso de que su sitio web ya almacenado en los índices de Google, puede utilizar la caché de Google “Versión de sólo texto” para ver su web tal y como la visualiza este buscador. Para ello, puede utilizar directamente el comando “cache: www.sudominio.com” y acceder a la “versión de sólo texto”.

Si en los resultados no aparece el contenido y enlaces que usted quiere mostrar a los buscadores y usuarios, es muy posible que existan  barreras técnicas que no permitan su correcta indexación.

Google también ofrece, desde su herramienta para websmasters, una función para comprobar cómo visualiza su sitio web su robot “Google-bot”.

Si los robots de los buscadores no visualizan el contenido o los enlaces que tiene su sitio web hacia otros documentos, no podrá rastrear ni almacenar la información de su proyecto. En ese caso es muy importante que averigüe la causa y ponga una solución lo antes posible.

Recuerde que una buena optimización parte de una correcta compatibilidad con los motores de búsqueda de Internet.

En caso de haber comprobado que su sitio web no muestra correctamente el contenido o los enlaces de sus documentos a través de la “versión de sólo texto” de la cache de Google, o desde cualquier herramienta que se le ha proporcionado, informe a su webmaster para que averigüe la causa.

Una vez localizado el problema de compatibilidad, solicite las modificaciones técnicas necesarias para que, cuando sus técnicos hayan realizado su trabajo, usted pueda verificar que su sitio muestre correctamente a los buscadores todo su contenido y enlaces.

Pero también puede checar algunas posibles causas de una mala compatibilidad entre su sitio web y los buscadores de Internet.

Formato “Flash”.

Flash es una tecnología que permite dar un dinamismo visual a su proyecto, pero dependiendo de su uso, puede limitar la posibilidad de que los buscadores rastreen su contenido y enlaces.

Le recomiendo utilizar la tecnología flash solamente para áreas de diseño concretas insertadas en una página HTML correctamente estructurada.

JavaScript y CSS.

El JavaScript es un lenguaje de programación  que se ejecuta en el ordenador del usuario cuando éste navega por la red. Los buscadores no navegan por los sitios tal y como lo hacen los usuarios, no ejecutan el código para visualizarlo, así que no seguirán los enlaces creados en este lenguaje.

Utilización de marcos (Frames e Inframes).

Los marcos o frames hoy día casi no se usan, pero todavía se ven proyectos web que han sido desarrollados mediante esta técnica.

Suelen utilizarse para crear un menú de navegación que permanece fijo en la pantalla sin necesidad de cargarse de nuevo mientras el usuario se desplaza por las distintas opciones de navegación, cargándose en un marco central la información de cada uno de estos apartados.

Una vez que su web sea accesible, puede indicar a los robots que visiten su sitio, que documentos y contenido desea que indexen y cuál es el contenido que no deben rastrear. Para ello debe crear un sencillo fichero llamado robots en formato de texto (txt). Este puede elaborarse con cualquier editor de texto.

El primer paso antes de crear un fichero robots es analizar con su equipo técnico y de marketing cuáles son los documentos que le interesa que almacenen los buscadores. Tenga en cuenta que no siempre le resultará interesante que los buscadores indexen todo su contenido.

Encargue a su webmaster que elabore un fichero llamado robots.txt para que los buscadores sólo rastreen el contenido que usted desea que aparezca  en sus resultados de búsqueda.

Este archivo no es más que un fichero de texto sencillo que debe colocarse en el directorio raíz de su sitio.

Recuerde que hoy en día existen páginas web responsivas, que son mucho más rastreables para el buscador de Google, que un sitio web programado con las anteriores especificaciones de lo que NO deben hacer con una página web.

 

Para estos efectos consulte con los referentes en México sobre sitios web responsivos: www.consultoriagrafica.com.mx

Escribir comentario

Comentarios: 0