facebook
twitter
feed

Qué comentan tus amigos

OJO
artículo de publicado el 16 de agosto de 2006 y con 1 comentario...

Acaba de salir este interesante libro para aquellos que quieran profundizar en los algoritmos de ranking. Google’s PageRank and Beyond: The Science of Search Engine Rankings Amy N. Langville and Carl D. Meyer http://www.pupress.princeton.edu/titles/8216.html Yo ya me lo he pedido en Amazon y prometo hacerle una reseña cuando me llegue Fuente: SIG-IR List

Continuar leyendo Google’s PageRank and Beyond

artículo de publicado el 9 de agosto de 2006 y con ningún comentario...

Otro video sobre Google, en este caso nos hablan sobre los desafíos de montar un buscador que no sólo depende de los algoritmos de búsqueda, sino también de como puede escalar su arquitectura para asumir el tráfico y la enorme cantidad de datos que se van almacenando a lo largo del tiempo. Video del 2004 [...]

Continuar leyendo Google: A Behind-the-Scenes Look

artículo de publicado el 9 de agosto de 2006 y con ningún comentario...

Para aquellos que se atrevan con el inglés, aquí tienen un video sobre el cluster de máquinas que soportan toda la carga de trabajo de Google. El video es del 2002 pero sigue siendo muy interesante: Google’s Linux cluster currently processes over 150 million queries a day, searching a multi-terabyte web index for every query [...]

Continuar leyendo The Google Linux Cluster

artículo de publicado el 7 de agosto de 2006 y con ningún comentario...

En el post anterior hemos visto como indexar una colección de documentos con Terrier. En este veremos como acceder a ese índice para buscar documentos en él. También le echaremos un vistazo a la interfaz gráfica de Terrier y veremos como extraer datos del índice como la frecuencia de las palabras por documento o la [...]

Continuar leyendo Terrier: TERabyte RetrIEveR (II)

artículo de publicado el 5 de agosto de 2006 y con 1 comentario...

Mañana domingo 6 de agosto comienza SIGIR 2006 una de las conferencias más importantes del año sobre Recuperación de Información. SIGIR es el grupo de interés de la ACM para Recuperación de Información. En este foro se reunen los mayores expertos en IR del mundo junto con los ingenieros de I+D de las principales empresas [...]

Continuar leyendo SIGIR 2006

artículo de publicado el 5 de agosto de 2006 y con 2 comentarios...

La gente de AOL Research en un alarde de generosidad sin precedentes, ha puesto disponibles en su web una buena cantidad de recursos para la investigación en recuperación de información web. Entre los más interesante destacan: 20,000 etiquetadas y clasificadas a mano. 3.5 millones de consultas web pregunta/respuesta del tipo quien, qué, donde, cuando, etc.) [...]

Continuar leyendo Recursos de AOL Research para la investigación en IR

artículo de publicado el 4 de agosto de 2006 y con 6 comentarios...

Existen un montón de herramientas disponibles en Internet que pueden ser de gran utilidad para un SEO. La mayoría de ellas han sido generadas por grupos de trabajo que llevan dedicandose varios años a estos temas y que han tenido a bien dejar el fruto de su trabajo en la Red para que los demás [...]

Continuar leyendo Terrier: TERabyte RetrIEveR (I)

artículo de publicado el 3 de agosto de 2006 y con 6 comentarios...

Este es mi primer post, y antes de empezar a meterme en faena, me gustaría contar muy brevemente de que van a tratar mis intervenciones aquí. En principio la idea es hablar sobre recuperación de información (Information Retrieval) de ahí lo de IR. El objetivo fundamental es dar a conocer mediante notas más o menos [...]

Continuar leyendo IR en OJObuscador

Páginas: << 1 2 3