Leo en la lista de SIGIR esta noticia sobre el lanzamiento de CLAIRLIB
El grupo de Lingüística Computacional y Recuperación de Información de la Universidad de Michigan, CLAIR (Computational Linguistics And Information Retrieval) group, presenta Clair library, unas librerías escritas en perl que pretenden simplificar tareas generales de Natural Language Processing (NLP), Information Retrieval (IR) y Lexical Network Analysis.
Entre sus funcionalidades encontramos:
- Nativo: Tokenization, Summarization, LexRank, Biased LexRank, Document Clustering, Document Indexing, PageRank, Biased Pagerank, Web Graph Analysis, Bioinformatics Text Analysis, Political Science Text Analysis, Network Building, Power Law Distribution Analysis, Network Analysis and Computation (Watts-Strogatz Clustering Coefficient, Cosines, Random Walks), Tf, Idf
- Importado: Stemming, Sentence Segmentation, Web Page Download, Web Crawling, XML Parsing, XML Tree Building, XML Writing
Casi nada y lo llevaba colgando, que decía mi abuelo
ya no hay excusa para no probar los algoritmos más conocidos de IR y ver como funcionan.
Los responsables del proyecto son:
- Project design: Dragomir R. Radev
- Main implementers: Anthony Fader, Mark Hodges, and Dragomir R. Radev
- Additional code by: Timothy Allison, Michael Dagitses, Aaron Elkiss, Gunes Erkan, Scott Gifford, Mark Joseph, Samuela Pollack, and Adam Winkel.