facebook
twitter
feed
OJO
artículo de publicado el 17 de octubre de 2006...

Los buscadores intentan que las palabras usadas en las búsquedas coincidan con las palabras encontradas en las páginas y en los enlaces que enlazan a esas páginas.

Con frecuencia, el orden en que se presentan los resultados se basa en la indización del texto de esas páginas, texto en los enlaces a esas páginas y una medición de la importancia basada en la popularidad de enlaces.

Sin embargo, antes de que los resultados sean entregados al usuario, puede pasar que se haga un reordenamiento por una razón u otra. Aqui tenemos algunas de las posibilidades:

1. Eliminación de contenidos duplicados, o casi duplicados

Los buscadores no quieren que sus resultados contengan páginas o contenidos duplicados, por lo que aquellas páginas que sean sustancialmente similares pueden ser filtradas. Si bien, técnicamente, no se trata de el reordenamiento de resultados, como el Dr. Garcia indica observa en Search Engine Patents On Duplicated Content and Re-Ranking Methods, este tipo de filtrado tiene como resultado la alteración del orden en que el usuario percibe los resultados de búsqueda.

2. Eliminación de múltiples páginas relevantes de un mismo sitio

Es poco común que no haya más de una página de un mismo sitio relevante para una búsqueda. Los buscadores intentan limitar el número de páginas mostradas de un mismo sitio en los resultados. De haber más de una página relevante de un mismo sitio, el buscador mostrará un segundo resultado de ese sitio, inmediatamente a continuación del primero e insertará un enlace a “más resultados de este sitio”. Puede que no se muestren resultados adicionales.

3. Basados en intereses personales

Los buscadores pueden intentar reordenar los resultados de una búsqueda basandose en búsquedas anteriores del usuario u otra información que hayan sido monitoreadas. Este tipo de re-ordenamiento puede producirse cuando un usuario se registra para recibir búsquedas personalizadas. Aqui presentamos algunas maneras en que esto pueder suceder:

* Búsqueda personalizada mediante el análisis automatizado de intereses y actividades (pdf)
* Personalización variable de los resultados de búsqueda en un buscador
* Personalización de web search

4. Reordenamiento basado en interconectividad local

El buscador puede obtener los resultados y reordenar el top N (ej. 100, 1000, etc) de los resultados en base a como se enlazan entre si.

* Reordenamiento de resultados de búsqueda dependiendo de su interconectividad local

Aqui tenemos una variaión de dicho método::

* Método para reordenar páginas hiperenlazadas utilizando análisis de contenido y conectividad.

5. Ordenando resultados según el país

Es posible que un usuario quiera ver resultados que sean de un país en particular. El usuario puede elegir la preferencia del país o el sistema puede intentarlo dinámicamente según la dirección IP. El pedido de patente a continuación explora métodos para reordenar resultados según las preferencias de país.

* Sistema y método para proveer de resultados según país de preferencia

6. Ordenando según el idioma

Las preferencias de lenguaje pueden ser establecidas por el usuario en el browser o en el buscador, al momento de buscar, en la interfaz y las características de la búsqueda. Aqui veremos como los resultados pueden ser modificados si se indentifica la preferencia del idioma:

* Sistema y método para proveer de resultados según la preferencia del idioma

7. Viendo la segmentación de población y audiencia

Este método puede observar cosas como la úbicación, otras informaciones demográficas e información de grupos a los cuales el usuario esta asociado, como ayuda para reordenar resultados. Técnicamente, esto puede no se considerado reordenamiento, ya que no se modifica el conjunto original de resultados, pero si hay un conjunto de resultados que son alterados según las diferencias en la población.

* Métodos y sistemas para mejorar resultados de búsqueda utilizando información demográfica.

8. Reordenamiento según datos históricos

Las páginas pueden ser reordenadas al incluir información como la antiguedad de un documento, de los enlaces a esos documentos y datos historicos que se relacionan con el factor temporal. Este pedido de paqtente de google contiene una larga lista de factores:

* Recuperación de información según datos historicos

9. Reordenamiento según “topic familiarity”

Una patente de Yahoo! describe como observar cosas como niveles de lectura, uso de “stop words” y otro tipo de funcionalidades textuales. La patente permite que los uusarios utilicen una interfaz para escoger entre resultados que son introductorios y otros que son de nivel avanzado:

* Sistema y método para influir resultados según la familiaridad con el tema

10. Reordenando según la intención comercial

Similar al método descripto más arriba, mediante el uso de un dial, Yahoo! Mindset permite que los usuarios decidan si quieren ordenar los resultados según su intención: resultados comerciales o resultados de naturaleza informativa.

11. Reordenamiento y eliminación de resultados según compatibilidad con dispositivos móviles

Microsoft provee de una manera para mostrar páginas que se muestran bien en dispositivos móviles y para desestimar aquellas que no son compatibles:

* Mobile friendly internet searches

12. Reordenamiento según accesibilidad

Google ha lanzado recientemente un buscador especializado que reordena los resultados según el grado de accesibilidad con su Accessible Web Search para personas con discapacidad visual.

13. Reordenamiento según contenido editorial

Una patente otorgada a Google describe el reordenamiento de resultados según si las páginas han sido definidas como favorecidas o no-favorecidas.

* Sistema y método que permite opinión editorial en el ordenamiento de los resultados de búsqueda.

14. Reordenamiento según términos adicionales (boosting) y comparación de similtud de textos.

Este documento de Google/Berkeley describre el reordenamiento de resultados para una búsqueda de noticias, considerando y agregando palabras de búsqueda adicionales y teniendo en cuenta la similutd de los documentos.

* Query-Free News Search

15. Reordenamiento según feedback implícito de la actividad del usario y ratio de clicks.

Hay muchos “papers” y pedidos de patente que describen el reordenamiento de resultados considerando el comportamiento del uusario y la selección de palabras. Aqui tenemos uno que observa queries diferentes durante una misma sesión de búsqueda:

* Query Chains: Learning to Rank from Implicit Feedback (pdf)

16. Reordenamiento según endorso de la comunidad

Un número de documentos hace referencia al uso de coleccionar información de un gran número de usuarios de redes sociales. Aqui unos ejemplos:

* Método computacional y aparato para búsquedas web colaborativas.
* Sistema de búsqueda y métodos con integración de anotación de usuarios agregada.
* Sistema de búsqueda y métodos con integración de anotaciones de usuarios de una trust network.
* Métodos y sustemas para edorsar resultados de búsqueda locales.

17. Reordenamiento basado en información redundante

La probabilidad de distribución de palabras de un número de resultados para intentar identificar topicos que pueden ser abarcados por una búsqueda y que puede ser isado para mostrar un set de resultados basados en dichas categorías.

* Uso de información redundante para mejorar búsquedas textuales.

18. Reordenamieto basado en “storylines”

Este documento de IBM explica como reorganizar resultados en “storylines” que se expanden de diferentes maneras y filtra otras, antes de presentarle al usuario.

* Sistema que identifica storylines que emergen de resultados de búsqueda bien posicionados.

19. Reordenamiento observando blogs, noticias y páginas como enfermedades infecciosas

Se utiliza la analogía de la propagación de epidemias como modelo de un pedido de patente de IBM que describe como segmentar temas, prestando atención a los cambios a lo largo del tiempo y la adición de esos temas en la blogosfera y foros. Este método podría indicarle al buscador que temas y palabras son populares y donde se puede ubicar dicha información. Si bien el proceso esta descrpto en el contexto de alertas de noticias, el concepto podría expandirse para ayudar al reordenamiento de resultados según popularidad.

* System, method, and service for segmenting a topic into chatter and subtopics

20. Reordenamiento según información conceptual relacionada, incluyendo factores basados en tiempo y uso

El pedido de patente a continuación, describe un proceso similar a los dos anteriores. Incluye la agrupación de conceptos y la observación de como cambian a lo largo del tiempo cuando las personas participan en esos cambios. Uno de los inventores es Apostolos Gerasoulis de Ask.

* Methods and systems for providing a response to a query

Conclusión

Los resultados que se ven para una búsquedas no siempre serán los que otra gente vea.

Si bien esto no pretender ser una lista completa de todos los documentos que describen formas en que un buscador puede reordenar resultados, si cubre una variedad de posibilidades. Algunos de estos procesos están implementados y en uso, otros podrían ser usados en el futuro, y otros quizá nunca. Pero es bastante probable que algunos de los procesos sean lanzados en el futuro cercado por alguno de los buscadores.

Para algunos de estos métodos de reordenamiento, puede ser que sea posible asegurarse un buen posicionamiento, a pesar de que no todos los usuarios vean los mismos resultados. Como estaís enfocando esto?

Traducción autorizada por Bill Slawski para OJObuscador.
Versión original en inglés: 20 Ways Search Engines May Rerank Search Results

  1. el 30 de octubre de 2006, Marketing Content Hosted ha dicho...

    [...] Aunque si yo fuera, evitaría que dichas página enlacen a mi página, teniendo en cuenta lo que contaba el otro día Bill Slawski en su artículo “20 maneras de reordenar resultados”: 4. Reordenamiento basado en interconectividad local El buscador puede obtener los resultados y reordenar el top N (ej. 100, 1000, etc) de los resultados en base a como se enlazan entre si. [...]

Rellena el formulario para poder comentar...

XHTML permitido:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>