hoy OJO mira los buscadores … mañana los buscadores mirarán OJO
anúnciate

posicionamiento en buscadores
First Tuesday
OJO
30 de Noviembre de 2006

Existen un montón de explicaciones sobre el Pagerank en la Web. Sin duda para mi una de las más claras es esta:

http://pr.efactory.de/

Sin embargo, no es el único algoritmo de ranking sobre análisis de enlaces que existe, ni siquiera nació solo, sino que en el mismo año que Brin y Page presentaban su Pagerank, 1998, Jon Kleinberg, premio Fields de matemáticas e investigador de IBM por aquellas fechas, presentaba HITS, un algoritmo similar a Pagerank pero con algunas particularidades que veremos a continuación.

La idea que reside detras de HITS es muy similar a la que sustenta Pagerank, y se basa en los dos mismos parámetros básicos:

POPULARIDAD: Si mucha gente te enlazan entonces eres importante:
AUTORIDAD: Si la gente que te enlaza ya es importante eso te hace más importante a ti

A partir de esta idea HITS define un doble ranking, el cual permite clasificar a una web por un lado como un recomendador, un hubs, y por otro lado como una autoridad:

  • Hubs (recomendadores) una web es un hub si contiene muchos enlaces salientes.
  • Authorities: Una web es una autoridad si contiene muchos enlaces entrantes.
Uno de los principales factores que diferencian a HITS de Pagerank es que mientras que Pagerank sólo tiene en cuenta los enlaces entrantes (los salientes son sólo un factor de normalización en Pagerank) HITS tiene en cuenta los enlaces entrantes y salientes para definir los rankings de una página web, de hecho en HITS hay dos rankings distintos, uno definido por los enlaces entrantes y que permite medir la popularidad de un sitio, y otro definido por los enlaces salientes y que caracteriza a un sitio como una autoridad.
A continuación tenemos como se formalizan los dos rankings de HITS
Como se puede ver, HITS, al igual que PageRank es un algoritmo recursivo que necesita de unos valores iniciales para comenzar. Estos valores se pueden asignar de forma más o menos arbitaria ya que se van refinando en las sucesivas iteraciones del algoritmo.
Dentro del esquema de HITS cada página web puede ser a la vez una autoridad y un hub, de forma que una página web es un buen hub si apunta a muchas autoridades y es una buena autoridad si es apuntada por muchos hubs.
Como veis muy cerquita de Pagerank sin ser Pagerank, y, eso si, tan relevante desde un punto de vista científico como Pagerank.
Muchos se preguntarán que a qué se dedicaba Kleinberg mientras Brin y Page se forraban a pasta con Google. La respuesta es simple: se dedicó a convertirse en uno de los matemáticos más importantes de mundo, que tampoco está nada mal.
De hecho, la primera implementación comercial de HITS tuvo que esperar hasta 2001 y se hizo en un buscador llamado Teoma, el cual fue comprado por Ask Jeeves quien por lo que yo sé (que alguien me corrija si no es cierto) sigue utilizando HITS como algoritmo de ranking basado en enlaces.

Tags:

7 comentarios »
  1. Fran ha dicho el 1 de Diciembre de 2006

    Esto me recuerda que tienes una reseña pendiente ;)

  2. jose.aguera ha dicho el 1 de Diciembre de 2006

    jajajaja, tienes toda la razón, ya me lo he leido y me ha gustado un montón, de esta semana no pasa, prometido

  3. Reseña de Google’s PageRank and Beyond ha dicho el 1 de Diciembre de 2006

    [...] El capítulo sobre HITS no desmerece, aunque se le dedica mucho menos espacio que a la explicación de Pagerank, no insistiré sobre los detalles de HITS, ya que podeis ver más o menos como funciona en este post que acabo de publicar. [...]

  4. José R. Pérez Agüera ha dicho el 1 de Diciembre de 2006

    Lo prometido es deuda :-)

    Promesa cumplida

  5. Jesús ha dicho el 16 de Diciembre de 2006

    Es un artículo muy interesante, enhorabuena y gracias por compartir la información :)

  6. jose.aguera ha dicho el 17 de Diciembre de 2006

    muchas gracias a ti por el interés, me alegra mucho que te haya gustado :-)

  7. Ernesto ha dicho el 20 de Mayo de 2007

    Hola,
    como puedo utilizar HITS o bien que buscador lo utliza?

Rellena el formulario para poder comentar...

XHTML permitido:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>