feed
contacto
legal
publicidad
equipo
OJO

Contacta conmigo en mi dirección electrónica jose.aguera@fdi.ucm.es

artículo de José R. Pérez Agüera publicado el 2 de Marzo de 2007 y con ningún comentario...

Hace un tiempo se hablaba por aquí del tipo de trabajo que iban a realizar los ingenieros que contrate Google en España. Para aquellos a los que todavía les interese el tema, hay un vídeo que describe exactamente los mismos puesto que Google está ofreciendo para Madrid: Google Partner Solutions Organization

artículo de José R. Pérez Agüera publicado el 14 de Febrero de 2007 y con ningún comentario...

Ahora que está tan de moda hablar de Quaero, Exalead y los buscadores europeos, no me puedo resistir a enlazar este excelente artículo de opinión publicado hace unos años por Ricardo Baeza-Yates (Yahoo! Research) en la revista Informática donde, en mi opinión se ve como los europeos perdimos la gran oportunidad de tener nuestro propio Google:

La increible historia de FAST por Ricardo Baeza-Yates

Después de leer el texto de Baeza-Yates y por lo que he ido viendo estos últimos años, el aparente retraso en el desarrollo de tecnologías de búsqueda europeas, no tiene tanto que ver con la calidad de nuestra investigación, que está al nivel de los EE.UU. y Asia, sino con las reducidas posibilidades de encontrar inversión y financiación en este campo que existe en toda Europa y particularmente en España.

¿Cuántos FAST’s más vamos a perder? ¿Cuántos nos podemos permitir perder? Yo creo que son preguntas que cualquier político y empresario europeo centrado en temas de IT debería plantearse hoy en día.

artículo de José R. Pérez Agüera publicado el 9 de Febrero de 2007 y con 2 comentarios...

El otro día escribí un post sobre si realmente es posible llamar buscador a cualquier cosa que tire del API de los grandes buscadores. El caso es que hoy, revisando antiguas lecturas me he encontrado con este artículo que explica lo complicado que es desarrollar un buscador y que creo que es un buen complemento para aquella discusión.

Why Writing Your Own Search Engine is Hard
ACM Queue vol. 2, no. 2 – April 2004
by Anna Patterson, Stanford University

¿Pensáis que hoy en día es más fácil o que los problemas que plantea la autora siguen vigentes? Yo lo veo bastante actual y a decir verdad, creo que la afirmación que he oído en algún sitio de que la tecnología es, a día de hoy, tan sólo una commodity a la hora desarrollar un buscador me parece bastante aventurado.

artículo de José R. Pérez Agüera publicado el 30 de Enero de 2007 y con 34 comentarios...

De un tiempo a esta parte no hago más que escuchar que fulano o mengano ha sacado un buscador. Cada vez que leía o escuchaba la noticia me iba corriendo a ver el “nuevo” buscador para estudiar que ofrece, como ordena, que tamaño estimado tiene el índice, etc. En cada una de esas ocasiones me he encontrado con que el nuevo buscador no era otra cosa que una capa de búsqueda sobre Google, Yahoo!, Live o Ask donde no había nada más que alguna funcionalidad rollo Web 2.0 que reordena de forma más o menos dudosa los resultados de alguno de los cuatro grandes.

No me voy a meter en detalles sobre lo complicado que es a nivel algorítmico mezclar los resultados de varios buscadores y/o modificar su orden en función a determinados parámetros, tan sólo decir que no basta con cambiar el orden de los resultados obtenidos de Google usando información externa, ya que si esta información (por ejemplo votos de usuarios) no está integrada en el algoritmo que calcula el ranking final, lo único que se consigue es estropear los resultados. Sobre esto hay bastante escrito y está más que demostrado en la literatura de IR, pero apelo a vuestra fe para no extenderme en exceso ;-)

Aún así, independientemente de aspectos tecnológicos, desde mi punto de vista nadie que haga un buscador basado en los resultados de otro buscador puede decir que tiene un buscador, el buscador lo tiene Google, o Yahoo! o Live, y si un día cambian el modo de acceso o modifican el API te quedaste sin buscador como yo me quedé sin abuelo.

Para “tener” un buscador debes “tener” un índice propio, un crawler propio y un algoritmo de recuperación propio, si no, es que no tienes un buscador.

Creo sinceramente que todas estas iniciativas no aportan mucho, es más creo que no aportan nada, por lo menos a mi, ya que provocan una falsa sensación de diversidad y de multiplicidad de opciones cuando realmente no la hay, ya que seguimos buscando en los mismos sitios, Google, Yahoo!, Live y Ask. De todas formas me gustaría saber vuestra opinión al respecto, ya que no deja de sorprenderme la proliferación de este tipo de buscadores últimamente y lo mismo se me está escapando algo ¿realmente son útiles? ¿los usa alguien?

artículo de José R. Pérez Agüera publicado el 1 de Diciembre de 2006 y con 1 comentario...

Con muy buen tino me recordaba Fran de Xeoweb que ya me estaba columpiando con mi promesa de hacer una reseña de este libro:

Google’s PageRank and Beyond:
The Science of Search Engine Rankings
Amy N. Langville and Carl D. Meyer

Continuar leyendo …

artículo de José R. Pérez Agüera publicado el 30 de Noviembre de 2006 y con 7 comentarios...

Existen un montón de explicaciones sobre el Pagerank en la Web. Sin duda para mi una de las más claras es esta:
http://pr.efactory.de/
Sin embargo, no es el único algoritmo de ranking sobre análisis de enlaces que existe, ni siquiera nació solo, sino que en el mismo año que Brin y Page presentaban su Pagerank, 1998, Jon [...]

Continuar leyendo HITS: Porque no sólo de Pagerank vive el SEO

artículo de José R. Pérez Agüera publicado el 20 de Noviembre de 2006 y con 1 comentario...

Aprovechando que el Pisuerga pasa por Valladolid y que Technorati saca sus versiones locales creo que es importante recordar que nuestro buscador favorito de blogs usa Lucene como base de su software de búsqueda.
Lucene powers search in surprising places–in discussion groups at Fortune 100 companies, in commercial issue trackers, in email search from Microsoft, in [...]

Continuar leyendo Uso de Lucene por Technorati

artículo de José R. Pérez Agüera publicado el 3 de Noviembre de 2006 y con 7 comentarios...

Llevo una tarde de los más tonta, distraído con cualquier cosa menos con lo que me tengo que distraer, y no será porque no tengo curro. El caso es que se me ha ocurrido lo siguiente:
Os propongo un reto, casi todos los que hay por aquí tienen un weblog o similar sobre temas de SEO, [...]

Continuar leyendo ¿Otro concurso de Posicionamiento? Sí, pero NO

artículo de José R. Pérez Agüera publicado el 28 de Octubre de 2006 y con ningún comentario...

Leo en la lista de SIGIR esta noticia sobre el lanzamiento de CLAIRLIB
El grupo de Lingüística Computacional y Recuperación de Información de la Universidad de Michigan, CLAIR (Computational Linguistics And Information Retrieval) group, presenta Clair library, unas librerías escritas en perl que pretenden simplificar tareas generales de Natural Language Processing (NLP), Information Retrieval (IR) y [...]

Continuar leyendo CLAIRLIB

artículo de José R. Pérez Agüera publicado el 27 de Octubre de 2006 y con 2 comentarios...

El gigante de la búsqueda de empleo en Internet ha desarrollado un prototipo de buscador para su portal usando Lucene, y por lo que han dejado ver hasta ahora les está quedando bastante bien. Cada día hay más desarrollos comerciales que usan Lucene, el cual se está posicionando frente a otras opciones como las librerías [...]

Continuar leyendo Prototipo del buscador de Monster con Lucene

Páginas: 1 2 3 >>