Hoy tuve la intención de releer un documento que en su momento me ayudó a aclarar algunas cuestiones relacionadas con el ordenamiento de resultados, no ya desde un punto de vista algorítmico, sino más bien desde connotación de las búsquedas.
En su momento Andrei Broder clasificó los tipos de búsquedas en tres categorías (algo así como los tipos ideales de Max Weber), es decir: búsquedas navegacionales, transaccionales e informativas. Pero Google ha hecho otra categorización en base a la relevancia que debe o no tener un resultado para una query dada.
Concretamente se trata de un documento interno de Google (PDF) que salió a la luz en junio 2005 en el blog del holandés Hek van Ess. Este documento “Guía general para la evaluación al azar de queries” data de diciembre 2003. Es de gran valor leerlo, para aquellos que aún no lo conozcan. La guía era y/o es utilizada por los así llamados “Quality Raters”, empleados temporales de Google para evaluar los resultados.
Google entonces hace la siguiente clasificación, por la cual el resultado de una búsqueda puede ser: vital, útil, relevante, fuera de tema (off-topic), ofensivo, erróneo y “la página no cargó”.
Uno de los ejemplos que se dan como palabra genérica pero cuyo resultado si es vital, es la querie [economist] cuyo significado genérico es “débil” y por ende Google entiende que el resultado vital ha de ser la web de la revista The Economist.
Los otros días, Telendro comparaba la búsqueda [digg] en los diferentes buscadores. En Google (español) la web de Digg.com aparece segundo trás la Wikipedia. ¿Será que al ser un medio tan novedoso y en inglés, editado “por la sabiduría de la mayoría”, es decir por los votos de los usuarios, entonces es necesario mostrar el resultado de la Wikipedia para explicar de que va Digg? La teoría se cae al buscar [meneame]: aparece primero en Google, la Wikipedia le sigue. Eso sí, en Google.com, Digg.com es el primer resultado
Por ejemplo, la búsqueda [stairway to heaven], la página principal del show “The Stairway to Heaven” es relevante porque el show de televisión está subordinado a la interpretación dominante de la búsqueda, es decir la canción de Led Zepellin con el mismo nombre.
Dejamos por hoy el resto de las categorías para que las leáis en el documento. Ahora cuando te pidan posicionar una web… ¿te preguntarás si la web a posicionar es vital, útil o relevante?
Como Google interpreta la relevancia de una página…
Concretamente se trata de un documento interno de Google (PDF) que salió a la luz en el blog del holandés Hek van Ess. Este documento “Guía general para la evaluación al azar de queries” data de diciembre 2003. Es de gran valor leerlo, para aqu…
[...] se que voy a tener que seguir pistas dejadas por algunos gurues del search, por ejemplo esta valiosa información recopilada por Tomy sobre la relevancia en Google, será mi tarea juntar y unir pistas para luego comenzar una experimentación y un análisis [...]
[...] También Javier Casares hablaba en su momento del Google Quality Raters Handbook y cómo filtran los humanos los resultados de Google y daba una clara explicación de cómo Google interpretaba tres de estos factores de relevancia. [...]