¿Cuál es el origen de las listas de resultados?
Si observamos las listas de resultados que muestran los distintos buscadores podremos detectar que las entradas no tienen un formato homogéneo, el motivo de esto es porque el origen de la información es variado. La principal fuente proviene de las bases de datos alimentada por la tarea realizada por los robots, ya hemos visto resumidamente qué es lo que extraen los robots desde nuestros sitio web.
¿Cuáles son las otras fuentes de información? Es bueno conocerlas porque también deberemos preocuparnos en trabajar sobre esas fuentes para que nuestro sitio web sea tomado en consideración.
Motores de búsqueda
Buscadores
Google: el número 1
Motores de búsqueda
No analizaremos uno por uno a cada motor de búsqueda porque no es el objetivo del libro. Desde el punto de vista general, conocer un motor de búsqueda significa conocerlos a todos aunque puedan tener particularidades. Eso sí, nos detendremos especialmente y con más detalle en Google porque es el líder actual con mucha diferencia respecto a sus seguidores (Yahoo!, Live Search/Bing, AOL, Ask y otros de menor presencia). No sólo tomó la delantera en tráfico, también saca ventaja al resto en servicios y aplicación de nuevas tendencias.
Todos los motores de búsqueda tienen algo en común: uso de robots para el rastreo que permite la extracción de los datos de los sitios para alimentar sus base de datos indexadas. En particular, el robot de Google se denomina Googlebot.
Buscadores
Esta es una lista resumida de los principales buscadores a nivel internacional y de España en particular. Algunos de estos buscadores comparten los motores de búsqueda por lo que aunque hay variedad no es tanta como puede parecer a primera vista.
AllTheWeb | Altavista | AOL | Ask | Bing |
Biwe | dmoz | Euroseek | Excite | Go |
Hispavista | HotBot | Live Search | Lycos | |
MSN | NBCi | Netscape | Orange | Search |
Telepolis | Terra | Tiscali | Trovator | Voila |
WebCrawler | Yahoo! |
Google: el número 1
Google nació como motor de búsqueda pero paulatinamente ha ido ganado terreno en otras áreas: correo electrónico, mapas, lectores de feeds, calendarios, herramientas de análisis de webs, navegador y ahora se espera su sistema operativo para el 2010. Hasta ahora lo ha hecho todo con un grado de perfección envidiable, lo que le ha permitido desplazar poco a poco a la competencia. Recordemos el predominio de Yahoo! de hace unos años en el área de buscadores y ahora sólo mantiene un 20% del pastel cuando Google supera el 50%.
El mercado ganado por Google no se debió a inversiones publicitarias sino que cada usuario comprobaba rápidamente que Google era un innovador, que las listas de resultados de Google eran simplemente muy superiores a las obtenidas con otros buscadores. Google fue el primero en implementar muchas cosas que después se transformaron en estándar: integración de resultados de diversas fuentes, algoritmos perfeccionados para elaborar el orden de posicionamiento, valoración de los enlaces, etc.
Google desarrolló herramientas de análisis de tráfico y las puso a disposición de todos. Google Analytics, es un producto gratuito y fundamental para los que nos responsabilizamos en las tareas de posicionamiento en los buscadores, nos permite medir las conversiones, algo mucho más concreto y tangible que la simple posición dentro de una lista. ¿De qué nos sirve salir entre los tres primeros si después no realizamos ninguna conversión?
Un componente que realmente se destaca en Google es su herramienta para webmasters, que utilizaremos más adelante.
Google, al igual que el resto de los motores de búsqueda, posee servicios para anuncios de pago por clic y mecanismos para que los sitios envíen información para alimentar los directorios mediante XML Sitemap.
Etica e información
Pero el poder en expansión que está adquiriendo Google suele despertar suspicacias. Es una reacción natural estar un poco a la defensiva de las empresas que se hacen demasiado poderosas y que van monopolizando áreas. Es algo que le ha pasado a IBM primero, hace 40 años, y a Microsoft después, hace 20 años. Tanta concentración de información (indexación de toda la web, control sobre una buena parte del correo electrónico mundial con Gmail) les da un poder que puede pasar los límites de lo aceptable. Esto les permite saber vida y obra de cada uno, de esta manera colocan el anuncio adecuado a cada email que llega a un buzón.
Servicios pagos
PageRank
Aunque Google y otros buscadores nos ofrecen herramientas gratuitas, servicios y recomendaciones debemos siempre tener presente que nuestro sitio web no puede estar orientado únicamente a caer simpático a los motores de búsqueda sino que nuestro objetivo final es el visitante.
Con esto se quiere dejar claro que el sitio web debe diseñarse pensando primero en el visitante y después en los buscadores.
Servicios pagos
El servicio de pago por clic es AdWords (adwords.google.com) y el servicio de anuncios contextuales es AdSense.
Los anuncios Google aparecen en Google, AOL, Ask y en incontables sitios web pequeños y medianos que colaboran con Google a cambio de una compensación económica.
PageRank
El concepto PageRank es de propiedad de Google y es un grupo de algoritmos que se utilizan para determinar la relevancia de una página web. El algoritmo actual es secreto pero sí se conocen versiones iniciales que hacen suponer y especular qué criterios generales se aplican.
PageRank utiliza la estructura de enlaces como un indicador del valor de una página en concreto. Se contabiliza y valora cada enlace entrante que tiene nuestra página en cuestión. No sólo es importante la cantidad de enlaces sino se también se analiza cada página que posee el link. Si la página que tiene el enlace a nuestra página tiene un PageRank alto, tanto mejor se considera la calidad del enlace.
En la valoración de nuestra página web también intervienen los enlaces salientes: una página sin enlaces salientes es peor considerada que si tuviera enlaces.
Sólo por razones anecdóticas en el gráfico se muestra la fórmula original de PageRank de Google, actualmente podría ser totalmente distinta, pero en todo caso se sabe que en el cálculo intervienen las páginas enlazadas a la página que nos interesa valorar.
Los elementos utilizados en esa fórmula eran los siguientes:
- PR: es el PageRank de la página que nos interesa valorar.
- d: un coeficiente que tiene un valor entre 0 y 1.
- PR(i): son los valores de PageRank que tienen cada una de las páginas que enlazan con nuestra página.
- C(i): es la cantidad total de enlaces salientes de la página i (sean o no hacia nuestra página)
Algo que nos puede sorprender: un valor alto de PageRank no siempre asegura una buena posición en el buscador, aunque normalmente hay bastante coincidencia. Una de las razones es que el valor de PageRank no se actualiza constantemente sino que Google realiza valoraciones periódicas, cada 2 o 3 meses.
Google actualmente muestra el valor de PageRank a intervalos no previstos para evitar el continuo control sobre los resultados del algoritmo.