hoy OJO mira los buscadores … mañana los buscadores mirarán OJO
anúnciate

OJO
13 de Junio de 2007

El análisis del uso del buscador por parte de los usuarios es la mejor manera de abordar una estrategia de innovación en valor (creación de valor y ahorro de costes) en la gestión de la información de la organización. Mediante el análisis de los logs de búsquedas, podemos identificar las temáticas de interés de los empleados, conocer cómo buscan lo que quieren o identificar las fuentes de información más satisfactorias.

El proceso de análisis de logs

El proceso se divide en tres fases:

FASE 1: Extracción, transformación y carga de datos

Durante esta fase, se realiza la adquisición de los logs del motor de búsqueda empresarial para seguidamente someterlos a un proceso de transformación consistente en la eliminación de términos no significativos (preposiciones, artículos), y la identificación de los atributos que finalmente serán cargados en la bases de datos de la aplicación de análisis estadístico.

FASE 2: Generación de los informes de búsquedas

A partir de los datos que han sido cargados en la base de datos de la aplicación de análisis, el sistema debe permitir al usuario visualizar un conjunto de informes para los cuales debe indicar el espacio temporal de interés. Los informes tipo permiten identificar:

  • Términos más frecuentes
  • Errores de deletreo más comunes
  • Evolución del uso de términos
  • Nuevos términos
  • Búsquedas que no producen resultados.

FASE 3: WebMining - Análisis de asociación de términos

Esta fase aglutina las tareas relacionadas con el análisis de asociación y posterior generación de términos asociados. Las tareas que se ejecutan en este módulo son:

  • Generación del conjunto de datos sobre el cual se aplicará posteriormente el análisis de reglas de asociación, que implica la reducción del espacio de búsqueda y discretización de los datos.
  • Ejecución del algoritmo apriori sobre los datos.
  • Visualización de las reglas generadas.
  • Generación del conjunto de términos asociados y posterior almacenamiento para su revisión por el experto.

La organización de la información en categorías

Como resultado del análisis de logs, identificaremos las principales categorías de información de nuestra organización. Las categorías son agrupaciones lógicas de documentación sobre las que se realiza una búsqueda concreta. De este modo una categoría define una colección de documentos que pertenecen a un área de conocimiento común. Veamos algunos casos prácticos.

Varios gobiernos autonómicos han implementado en los últimos años soluciones de búsqueda empresarial en sus entornos internet e intranet. En estos escenarios, con más de 7 millones de visitas mensuales, y más de 80 millones de páginas servidas al mes, su principal misión es ofrecer servicios e información a los ciudadanos, empresas y visitantes de sus portales. Algunos ejemplos son: www.madrid.org, www.gencat.net, www.jccm.es, www.jcyl.es, www.xunta.es,…

Los servicios de búsquedas en este tipo de portales son utilizados diariamente por más de 140.000 personas, lo que constituye entre un 45%-65% del total de visitantes. En estos portales son habituales tasas de aumento del uso del buscador superiores al 10% mensual, y que se duplique el número de visitantes respecto al año anterior. Parte del éxito de estos portales es debido a la mayor facilidad de acceso a los contenidos a través del motor de búsqueda de la organización.

Del análisis de logs, y la revisión de resultados por parte de los expertos, se identifica que en este escenario las categorías más demandas son las de Boletín Oficial y Noticias (Actualidad), y por ello son categorías comunes en todos estos portales.

En intranet no es tan fácil.

La búsqueda empresarial en el ámbito de las intranets corporativas es una tarea dependiente del contexto y del individuo, y por tanto, esta información debe ser incorporada a los logs de búsqueda para su posterior análisis estadístico.

Veamos un ejemplo: Supongamos que nos encontramos ante el buscador corporativo de una empresa de energía, y que realizamos la búsqueda [reservas]. El resultado de esta consulta debería ser distinto si se realiza desde el departamento de finanzas, ya que el término [reservas] hace referencia a una cuenta del balance de situación, a si se realiza desde el departamento de ingeniería, donde el término [reservas] hace referencia a la cantidad de recursos energéticos que todavía no han sido utilizados.

En resumen, el reto de la búsqueda empresarial en la intranet corporativa es conseguir buenos resultados con consultas pobres, y para ello necesitamos la información de contexto y del individuo.

Tags:

Rellena el formulario para poder comentar...

XHTML permitido:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>