Indexación: Como almacena sus contenidos Google.
Como ya hemos explicado, la indexación es el proceso mediante el que Google almacena los contenidos de nuestras páginas en sus bases de datos, de tal forma que cuando se realice una búsqueda por un término el buscador pueda localizar lo más rápidamente posible las páginas que contienen esa información. Para que esto pueda suceder, Google tiene que haber leído con anterioridad las páginas. Para ello utiliza su red de robots, estos robots van leyendo páginas web, analizando los textos y guardando índices de las palabras que aparecen en nuestro contenido.
Para que la indexación se realice correctamente se deben cumplir unas premisas:
En primer lugar Google debe saber de la existencia de nuestra página, esto puede suceder bien por haber encontrado un enlace que le ha llevado a nuestra página (enlace externo) o bien por haber dado de alta manualmente la URL en Google (
http://www.google.es/intl/es/addurl.html).
Una vez que Google sabe que existimos intentará leer nuestros contenidos. Para que pueda realizar esta tarea correctamente, debemos ser especialmente cuidadosos en la forma en la que se codifican las páginas; a Google no le gustan las páginas de frames, el Flash, y otras técnicas de programación que ofusquen o escondan el codigo HTML, como applets java, controles ActiveX, etc... También es importante que el código este bien formado, es por ello que es altamente recomendable cumplir las recomendaciones y especificaciones del W3C y codificar siguiendo el estándar HTML. Podemos comprobar y validar nuestras páginas utilizando la herramienta que el W3C pone a nuestra disposición para ello en la dirección web
http://validator.w3.org/
La indexación no es un proceso instantáneo, Google puede tardar desde semanas hasta meses en leer nuestras páginas, siempre dependiendo del número de enlaces externos que tengamos hacia ella y no habiendo ningún mecanismo por el que podamos agilizar el proceso. La indexación no se realiza una sola vez ya que los robots de google una vez descubren nuestra existencia nos visitaran con regularidad, por lo que irán incluyendo y actualizando nuestros contenidos poco a poco.
Como ya hemos indicado, Google no lee aplicaciones o páginas web desarrolladas utilizando tecnologías propietarias como Macromedia Flash, por lo que no leerá los enlaces que generemos usando dichas tecnologías. Este punto es muy importante tenerlo en cuenta, ya que si nuestra página principal esta diseñada utilizando alguna de estas técnicas difícilmente aparecerán nuestros contenidos y nuestras páginas internas.