El gigante de la búsqueda de empleo en Internet ha desarrollado un prototipo de buscador para su portal usando Lucene, y por lo que han dejado ver hasta ahora les está quedando bastante bien. Cada día hay más desarrollos comerciales que usan Lucene, el cual se está posicionando frente a otras opciones como las librerías para IR más usadas de Internet para la implementación de buscadores verticales. ¿A qué esperáis para probarlo?
En nuestros buscadores verticales utilizamos desde el principio Lucene y la verdad es que estamos encantados, además de la calidad de los resultados y la impresionante rapidez de respuesta tiene unas posibilidades de personalización increíbles (por ejemplo, nosotros hemos desarrollado un sistema de eliminación de duplicados del índice que nos está dando muy buen resultado)
Es una herramienta muy buena, el desarrollo con él es muy rápido y los resultados son más que aceptables. El principal problema que yo le veo, por poner alguna pega, es que no es fácil reimplementar las funciones internas. Por ejemplo, reimplementar la función de ranking es bastante follón, al menos para mi. Se pueden conseguir mejores resultados implementando BM25 o algún esquema basado en DFR ó LM para la función de ranking. De hecho herramientas como Lemur o Terrier tienen más aceptación en ámbitos académicos que Lucene por este motivo. Eso si para un desarrollo rápido y de calidad Lucene es el rey por ahora en entornos comerciales.