hoy OJO mira los buscadores … mañana los buscadores mirarán OJO
anúnciate

posicionamiento en buscadores
First Tuesday
OJO
19 de Septiembre de 2007
GeoBúsqueda Empresarial

Leo a Bernardo Hernández en Cinco Días que “el 70% de las búsquedas tiene un vínculo geográfico”. Según nuestra experiencia estos datos también son extrapolables al ámbito empresarial, y el reto sigue siendo el mismo, “ofrecer buenos resultados a partir de consultas pobres”.

Qué debemos entender por un buen resultado

Desde hace miles de años, la humanidad ha utilizado la geografía como una herramienta para intercambiar conocimiento, y en el caso de una consulta con vínculo geográfico, que mejor resultado que un mapa con el resultado geolocalizado, sin olvidar que una vez más el punto crítico de estas herramientas es su usabilidad.

Soluciones para construir aplicaciones de geobúsqueda

Existen dos aproximaciones para implementar aplicaciones de geobúsqueda: la utilización de metadatos geográficos generados manualmente por los usuarios, y la utilización de técnicas de interpretación del lenguaje natural que permitan identificar entidades geográficas.

En el primer caso, mediante una estrategia web 2.0, los editores de contenido incluyen manualmente la localización geográfica de los documentos. Esta operación puede ser facilitada mediante interfaces gráficos tipo Google Maps, Yahoo Maps, MicroSoft Maps Live o ArcWeb Services. Ejemplos de estas aplicaciones son la geocodificación manual de fotografías en Flickr o Picassa.

Con una orientación 3.0, los metadatos geográficos son generados automáticamente. La tecnología es capaz de interpretar la semántica de los contenidos, y mediante técnicas de inteligencia artificial se analizan los documentos en busca de entidades geográficas. A partir de estas localizaciones, y mediante la utilización de un Gazetteer, es posible asignar las coordenadas geográficas a los documentos. Esta información es utilizada posteriormente para realizar las geobúsquedas.

Un ejemplo práctico de Geobúsquedas.

Geointel for Petroleum es un portal web sectorial para empresas energéticas de gas y petróleo. Esta herramienta permite geolocalizar los resultados de una consulta, presentado un mapa en tiempo real.

Imaginar por un momento que trabajáis en el departamento de exploración de una empresa petrolera, y que os encargan localizar toda la documentación de vuestra empresa relacionada con [exploraciones en aguas profundas en el área del golfo de México]. ¿y si os piden una mapa de cómo se distribuyen esta información en el territorio?. Sin duda alguna, la geobúsqueda tiene un gran futuro.

Tags:

27 de Junio de 2007
Administración 2.0: Escuchando a los ciudadanos

Leo en el Blog de Rafael Chamorro que este año, las X Jornadas sobre Tecnologías de la Información para la Modernización de las Administraciones Públicas, Tecnimap, tendrán lugar entre los días 27 y 30 de noviembre en Gijón.

Al igual que ocurre con la Web 2.0, la Administración 2.0 es un conjunto de iniciativas con el foco dirigido hacia los ciudadanos, y cuyo objetivo es conocer mejor sus necesidades, y lograr resultados más eficaces y útiles.

Motores de búsqueda empresarial en la Administración 2.0

Muchos son los ejemplos de aplicación de los motores de búsqueda empresarial en la Administración. Sólo por citar alguno, podemos observar como el Ministerio de Justicia, en su portal www.mjusticia.es, utiliza los términos destacados para mejorar los servicios ofrecidos a los ciudadanos.

Veamos un ejemplo: Si desde el buscador del portal, realizamos la consulta [matrimonio], los dos primeros resultados son términos destacados por los expertos en base a su experiencia y el análisis de los logs del buscador. Concretamente los resultados son los enlaces a los documentos sobre Inscripción de matrimonio y Certificado de matrimonio.

De esta manera, a partir de consultas pobres, se proporcionan excelentes resultados, mejorando la usabilidad del portal, su eficiencia y la utilidad del servicio para los ciudadanos.

Queda mucho por hacer, y los buscadores empresariales son una pieza clave de esta estrategia de la Administración 2.0.

Los buscadores empresariales representan una fuente de mejora continúa para la Administración. El análisis de los logs permite identificar las necesidades de información de los ciudadanos y sus temas de interés en relación a la función pública. Cada € que la administración invierte en estas herramientas, representa un mínimo de 7 € de ahorro para los ciudadanos.

Tags:

13 de Junio de 2007
Análisis de los logs del buscador empresarial

El análisis del uso del buscador por parte de los usuarios es la mejor manera de abordar una estrategia de innovación en valor (creación de valor y ahorro de costes) en la gestión de la información de la organización. Mediante el análisis de los logs de búsquedas, podemos identificar las temáticas de interés de los empleados, conocer cómo buscan lo que quieren o identificar las fuentes de información más satisfactorias.

El proceso de análisis de logs

El proceso se divide en tres fases:

FASE 1: Extracción, transformación y carga de datos

Durante esta fase, se realiza la adquisición de los logs del motor de búsqueda empresarial para seguidamente someterlos a un proceso de transformación consistente en la eliminación de términos no significativos (preposiciones, artículos), y la identificación de los atributos que finalmente serán cargados en la bases de datos de la aplicación de análisis estadístico.

FASE 2: Generación de los informes de búsquedas

A partir de los datos que han sido cargados en la base de datos de la aplicación de análisis, el sistema debe permitir al usuario visualizar un conjunto de informes para los cuales debe indicar el espacio temporal de interés. Los informes tipo permiten identificar:

  • Términos más frecuentes
  • Errores de deletreo más comunes
  • Evolución del uso de términos
  • Nuevos términos
  • Búsquedas que no producen resultados.

FASE 3: WebMining - Análisis de asociación de términos

Esta fase aglutina las tareas relacionadas con el análisis de asociación y posterior generación de términos asociados. Las tareas que se ejecutan en este módulo son:

  • Generación del conjunto de datos sobre el cual se aplicará posteriormente el análisis de reglas de asociación, que implica la reducción del espacio de búsqueda y discretización de los datos.
  • Ejecución del algoritmo apriori sobre los datos.
  • Visualización de las reglas generadas.
  • Generación del conjunto de términos asociados y posterior almacenamiento para su revisión por el experto.

La organización de la información en categorías

Como resultado del análisis de logs, identificaremos las principales categorías de información de nuestra organización. Las categorías son agrupaciones lógicas de documentación sobre las que se realiza una búsqueda concreta. De este modo una categoría define una colección de documentos que pertenecen a un área de conocimiento común. Veamos algunos casos prácticos.

Varios gobiernos autonómicos han implementado en los últimos años soluciones de búsqueda empresarial en sus entornos internet e intranet. En estos escenarios, con más de 7 millones de visitas mensuales, y más de 80 millones de páginas servidas al mes, su principal misión es ofrecer servicios e información a los ciudadanos, empresas y visitantes de sus portales. Algunos ejemplos son: www.madrid.org, www.gencat.net, www.jccm.es, www.jcyl.es, www.xunta.es,…

Los servicios de búsquedas en este tipo de portales son utilizados diariamente por más de 140.000 personas, lo que constituye entre un 45%-65% del total de visitantes. En estos portales son habituales tasas de aumento del uso del buscador superiores al 10% mensual, y que se duplique el número de visitantes respecto al año anterior. Parte del éxito de estos portales es debido a la mayor facilidad de acceso a los contenidos a través del motor de búsqueda de la organización.

Del análisis de logs, y la revisión de resultados por parte de los expertos, se identifica que en este escenario las categorías más demandas son las de Boletín Oficial y Noticias (Actualidad), y por ello son categorías comunes en todos estos portales.

En intranet no es tan fácil.

La búsqueda empresarial en el ámbito de las intranets corporativas es una tarea dependiente del contexto y del individuo, y por tanto, esta información debe ser incorporada a los logs de búsqueda para su posterior análisis estadístico.

Veamos un ejemplo: Supongamos que nos encontramos ante el buscador corporativo de una empresa de energía, y que realizamos la búsqueda [reservas]. El resultado de esta consulta debería ser distinto si se realiza desde el departamento de finanzas, ya que el término [reservas] hace referencia a una cuenta del balance de situación, a si se realiza desde el departamento de ingeniería, donde el término [reservas] hace referencia a la cantidad de recursos energéticos que todavía no han sido utilizados.

En resumen, el reto de la búsqueda empresarial en la intranet corporativa es conseguir buenos resultados con consultas pobres, y para ello necesitamos la información de contexto y del individuo.

Tags:

30 de Mayo de 2007
Googlelizando nuestras organizaciones

Si nos gustan tanto, ¿por qué no usar en nuestras organizaciones las mismas herramientas 2.0 que utilizamos en casa? Hoy en día, se da la paradoja de que disponemos de mejores herramientas para buscar información en nuestros hogares (buscadores, wikis…) que las que nos proporcionan nuestras organizaciones.

La búsqueda empresarial se convertirá en breve en un sistema crítico dentro de nuestras empresas. Su misión, “Organizar la información de nuestra organización, haciéndola útil y accesible de manera segura”. Para ello los buscadores empresariales son capaces de indexar información de distintos repositorios como: directorios de ficheros, bases de datos, gestores documentales y otras aplicaciones, permitiéndonos realizar consultas de manera segura contra todos estos repositorios/silos de información.

Es la usabilidad, idiota

Entre las características fundamentales que toda solución empresarial de búsqueda debe presentar se encuentran la escalabilidad, la seguridad en el acceso a los contenidos, la indexación de fuentes de datos heterogéneas o el basarse en estándares abiertos, pero sin duda, la característica principal que todos los motores de búsqueda empresarial deben cuidar al máximo, es la usabilidad. Esta característica debe implementar un interfaz sencillo de uso (tiempo de aprendizaje cero), y sobre todo garantizar la relevancia y rapidez en la presentación de resultados. Algunos responsables de IT entenderán este requisito rápidamente, otros no lo harán nunca y fracasarán en sus proyectos de implantación de búsqueda empresarial.

ROI y PayBack de una solución de búsqueda empresarial

Según el informe Intranet Usability 2004, del Nielsen Norman Group, “la búsqueda de información en el ámbito empresarial, puede implicar hasta un 43 % de diferencia en la productividad de empleados que cuentan con una buena intranet, y aquellos que trabajan en una intranet con una usabilidad pobre”.

Una de las formas de calcular el ROI (retorno de la inversión) y el Payback (tiempo necesario para recuperar la inversión) de una solución de búsqueda empresarial, es analizar el número de horas anuales que cada miembro de la organización emplea en buscar información. Con este dato, y tomando como referencia una organización con 200 empleados, que emplean de media un 5% de su tiempo en buscar información, podemos esperar ROI’s anuales superiores al 700% y un payback de menos de 2 meses. Esto quiere decir que por cada € que esta empresa invierte en búsqueda empresarial gana un mínimo de 7€, y que esta inversión tarda en amortizarse menos de 2 meses. Y en tu organización, ¿cuántas horas anuales empleáis en buscar información?.

Quién es quién

En el ámbito de la búsqueda empresarial, y según el informe Forrester Wave, Enterprise Search Plaforms Q2′06, las plataformas con mayor presencia son Autonomy, Google, Fast, IBM, y Endeca. Sin olvidar los esfuerzos de Microsoft y Oracle por entrar en el suculento mercado de la búsqueda empresarial.

Pedro Torres, Responsable de Desarrollo de Negocio de SITESA

Tags: