feed
contacto
legal
publicidad
equipo
OJO
artículo de Javier Casares publicado el 18 de Abril de 2009 y con ningún comentario...

SindiceAyer tuve la oportunidad de comer con Giovanni Tummarello y la verdad es que es un tipo muy interesante del que aprendí algunas cosas, sobretodo cuando empezamos a hablar de microformatos.

Los sitios web se puede marcar semánticamente con microformatos y con RDF. Además, existen otros elementos como Semanitic HTML, KLM, alghunos meta-tags…

Existen millones de páginas web en las que ya encontramos información semántica: Last.fm, Linkedin, BBC, Youtube… Aunque también hay algunas aplicaciones / APIs interesantes como SearchMonkey, Ubiquity, Google Social Graph…

La respuesta a algunas preguntas semánticas ya está disponible en algunos sitios web que ya permiten exportar o tienen integrada la información…

Un ejemplo de sistema que podría agrupar este tipo de es Síndice que permite hacer ping al buscador y este agrupa toda la información y la contextualiza.

Otro paso que habría que plantear es generar un tipo de sitemaps semánticos, en los que se indicarían los sitios a indexar de forma semántica. Con los microformatos pasaría lo mismo, ya que las herramientas ya existen, pero aún no se aplican.

El principal problema es organizar toda la información semántica, ya que puede haber conceptos similares para diferentes elementos, algo que complica su organización.

artículo de Javier Casares publicado el 17 de Abril de 2009 y con ningún comentario...

FreebaseJamie Taylor de Metaweb nos presenta Freebase que es un proyecto en el que se quiere organizar todo lo que uno conoce.

La base de datos está organizada en varias categorías dentro de más de 5 millones de temas en este momento (más de 14 millones de entidades introducidas).

Cada uno de estos temas trata única y exclusivamente de una cosa, y se intenta clasificar de forma semántica según los diferentes tipos de datos.

De esta forma, los buscadores pueden llegar a acceder a esta base de datos libre y organizar algunas de las respuestas semánticas que necesitan. Uno de los que la utilizan ya es Powerset.

artículo de Javier Casares publicado el 17 de Abril de 2009 y con ningún comentario...

Ziv Bar-YossefLa primera de las Keynotes del día la está realizando Ziv Bar-Yossef, de Google Haifa (Israel).

Los logs son algo bastante complejo para utilizar, por lo que tal vez no sea interesante investigar en los propios logs sino realizar una serie de consultas a los resultados de búsqueda.

El principal de los costes se calcula en base a la cantidad de consultas que se realizan en los servicios de búsqueda.

¿Por que realizar “external mining”?

  • Lo puede realizar cualquiera
  • No hay restricciones, sólo limitadas a la interfaz de los propios buscadores
  • Puede ser aplicado a los diferentes buscadores

Eso sí… ¿esto es fiable? ¿es eficiante?

El estudio realizando en los últimos 2 años se basa en saber si son fiables y eficientes esta forma de extracción de datos.

Un detalle que hay que investigar es la cantidad de consultas que se realizan para unas palabras, si disponen de alguna relación con campañas publicitarias y el interés de la consulta (por ejemplo para Google Trends).

Para estimar los rankings, se puede estudiar cuantas veces aparece un documento (sitio web) en el TOP 10 de los resultados de búsqueda en una cantidad específica de tiempo. Con esto podemos tener información para herramientas como Google Trends for Websites o para Analítica Web.

Otro elemento a investigar son las palabras por las que aparecen esos sitios web. Con esto se puede investigar y extraer información para los “suggest” y anuncios y para encontrar sitios relacionados.

La información se puede tomar en base a la uniformidad y popularidad, además de sacar el ImpressionRank (que vendría a ser un ranking basado en las veces que aparece el sitio en los resultados de búsqueda). Con esto podemos llegar a sacar un sistema de evaluzación de los resultados de búsqueda, además de sacar un modelo de búsquedas informacionales, navigacionales, transacionales, comerciales o geolocalizadas.

Hoy en día la mayoría de los grandes buscadores ofrecen un sistema de sugerencias de búsquedas. Están basados en los “query logs”, ordenadas por popularidad, anónimas y las “bad-queries” están filtradas.

Cuando el servidor de sugerencias recibe una consulta, encuentra el top sugerencias para esa consulta. Sólo se devuelve el TOP10 de esa consulta. Para calcular la fuerza de la estimación necesitamos una mezcla entre la información de la popularidad de la consulta junto a su ranking.

Los resultados de los sistemas de sugerencias podrían basarse en la popularidad o, por ejemplo en un sistema basado en un cálculo del volumen de búsquedas.

En resumen, podemos definir que hay 4 algorimos de minería:

Conclusiones

artículo de Javier Casares publicado el 17 de Abril de 2009 y con ningún comentario...

Un año más, Yahoo! Research Barcelona está realizando unas charlas sobre el futuro de los sistemas de búsquedas.

En esta ocasión en Ibiza, donde vamos a estar hoy y mañana cubriendo este evento, un año más (y ya es la tercera vez, aunque sea la cuarta edición).

Future of Web Search 2009

artículo de Javier Casares publicado el 5 de Abril de 2008 y con 1 comentario...

La última presentación (en este caso keynote) del Future of Web Search comienza con uno de los máximos responsables de Yahoo!, Usama Fayyad: “no todo son búsquedas”.

Yahoo! es el sitio que más usuarios recibe cada día… cada día se recopilan 25 TBytes de información de sus más de 100 aplicaciones. Un 73% de los estadounidenses utiliza Yahoo!. Cada día se procesan 14.000 millones de eventos al día, y es que hay más problemas que “las búsquedas”.

El 99% de los usuarios no sabe diferenciar la publicidad de los resultados naturales. En 1995 se inicia Yahoo! Directory, juntamente con Altavista, que es simple y escalable. De 1999 a 2006 nos encontramos con el primer gran cambio: Google (la relevancia es lo más importante y las búsquedas navigacionales desaparecen ya que mandan directamente al sitio). Goto.com inventa los “resultados de búsqueda de pago” (que pasan a Overture y luego a Yahoo!). En 2003 Yahoo! compra Overture para publicidad e Inktomi para búsquedas.

Las búsquedas se reducen sobretodo por búsquedas navigacionales, pero crecen los nuevos formatos en la red… para mejorar habría que integrar procesos. De metadatos se producen unos 180 GBytes de nuevas páginas al día, 40 MBytes de tags y 100 MBytes de “anchotext”. Además, los contenidos se complican y la forma de organizarse también, ya que se distribuyen más por la red.

La evolución de la interfaz de búsqueda acaba de comenzar. Para empezar se han implementado los “rich media” (Yahoo! Shortcut) y los asistentes de búsqueda entre los resultados. La forma de agregar la información ha sido estructurada y algunas búsquedas dan resultados interactivos con el usuario.

Poco a poco se han de implementar microformatos y se van haciendo pruebas con información como Google Base. Los generadores de contenido comienzan a colaborar con los buscadores. Microformatos, RDFa, OpenSearch y feeds, además de herramientas sociales/grupales no harán cambios en los rankings pero producirán mejores respuestas y mayor satisfacción a los usuarios.

Hasta ahora las búsquedas eran informacionales, navigacionales o transacionales y ahora esto está cambiando. Un primer paso podría ser el uso de sitios como Yahoo! Respuestas que ayudarían a las búsquedas más semánticas y naturales.

Si un usuario busca algo, Yahoo! le puede mostrar la información y a ese usuario se le puede mostrar información comercial sobre esa búsqueda durante una hora en la red de Yahoo!… esto incrementa el ROI en un 25%. En determinados canales verticales se puede llegar a aumentar hasta un 600% de conversión por impulso.

artículo de Javier Casares publicado el 5 de Abril de 2008 y con ningún comentario...

La última presentación (a falta de la Keynote) es la de Marco Pellegrini, que presenta la propuesta llamada VISTO.
Esta propuesta lo que quiere es realizar un resumen de los vídeos para poder verlos en una misma pantalla. Una versión comprimida de información visual que permita dedicar menos tiempo y aumente la eficacia.
Se podría ver en [...]

Continuar leyendo FoWS: Visual Storyboard (for Web Video)

artículo de Javier Casares publicado el 5 de Abril de 2008 y con ningún comentario...

Mor Naaman habla de algunos temas sociales y para ello comienza con ejemplos de Flickr, donde encontramos las imágenes, tags, mapas… En las imágenes podemos encontrar datos erróneos, fallos en la geolocalización, problemas con las imágenes…
¿Qué es el Social Media? Contenido que se publica o comparte y en el que entran factores como la discusión [...]

Continuar leyendo FoWS: Social Media Opportunity

artículo de Javier Casares publicado el 5 de Abril de 2008 y con 1 comentario...

Las formas de recuperar la información multimedia de forma textual es lo que Vanessa Murdock presenta. Porque las búsquedas son más cortas, es complejo explicar los detalles y los idiomas, en las imágenes, por ejemplo, “no existen”.
Flickr por ejemplo tiene el título, los tags y las descripciones. A veces los tags son sensibles e incluso [...]

Continuar leyendo FoWS: Text-retrieval Models for Media Search

artículo de Javier Casares publicado el 5 de Abril de 2008 y con 1 comentario...

Qué hace falta para personalizar un servicio de búsquedas para dispositivos móviles es lo que está presentando Ben Bratu de Motorola Labs.
Una de los primeros retos que plantea es el del hardware, ya que ha de estar todo preparado para tener soporte por todos los dispositivos, y eso es algo complejo, además de encontrarse problemas [...]

Continuar leyendo FoWS: Mobile personalized service

artículo de Javier Casares publicado el 5 de Abril de 2008 y con 2 comentarios...

José Manual Cantera muestra la necesidad de contar con contenidos específicos para dispositivos móviles e indica que los dominios .mobi han dado un empujón a que esto se produzca. El usuario, una de las cosas que no quiere, es encontrar información que no pueda gestionar desde el dispositivo si no está adaptado a él.
Uno de [...]

Continuar leyendo FoWS: MyMobileSearch

Páginas: 1 2 >>