A mediados de diciembre Google Blog Search comenzó a indexar las páginas completas donde se incluyen los artículos que se van viendo en los feeds, pero eso implicó también que se incluyeran los enlaces del blogroll.
Aunque se comenzó a trabajar sobre ello, si haces una búsqueda con el comando link: pueden aparecer enlaces que no corresponden al propio artículo.
Parece ser que ahora se van a poner en marcha, de forma visible, los nuevos resultados de detección de blogroll, ya que se han ido probado internamente, y ahora se harán visible a todos, de forma que se puedan mejorar los resultados de búsqueda.
Jeremy Hylton, uno de los responsables de Google Blog Search ha dejado un comentario en los grupos de Google en el que comenta los problemas sobre la indexación de los blogroll (lista de enlaces de los blogs).
Desde hace unos días el sistema en vez de indexar los feeds indexa las páginas que contienen toda la información y es por eso que hay un problema a la hora de tener en cuenta y mostrar los enlaces que aparecen en los laterales de los mismos.
Aunque Google ha hecho bastantes progresos, aún se encuentran muchos problemas a la hora de filtrar este tipo de contenidos, y por eso ahora solicitan la ayuda de los usuarios para avisar y mejorar las plantillas de detección, aunque ya lo han comenzado a hacer.
Aún así, el sistema que sigue las Alertas de Google sigue devolviendo muchos resultados en los que aparecen estos listados y no el contenido real de los artículos.
Hasta ahora el buscador de blogs Google Blog Search indexaba a través de los feeds de cada sitio. El problema es que no siempre está toda la información de los feeds al completo, por lo que el equipo de este buscador ha decidido reaprovechar los resultados de Googlebot para que en los resultados no aparezcan los contenidos del feed sino el contenido real del sitio web.
La cuestión es que en las alertas se pueden encontrar textos que no deberían aparecer (como el blogroll o elementos de la barra lateral), tema que están solucionando de forma que sólo se tenga en cuenta a la hora de mostrar información la parte del mensaje que interesa y que correspondería a la información que se muestra en el feed.
Buenas noticias para Google y malas para los que piensan que Google no puede acabar con otros servicios ya existentes. El buscador de blogs de Google ha sobrepasado en tráfico a Technorati, según los últimos datos de Hitwise.

El crecimiento se debe principalmente a la integración de Google News de un enlace hacia el buscador Blogsearch a mediados de octubre.
Además, como dato curioso, los rangos de edad de uso de cada sistema benefician ahora mismo a Technorati por quedarse con la mayor parte de gente entre 25 y 45 años, mientras que Blogsearch tiene a los menores de 25.
Al igual que Technorati y otros buscadores de blogs, Google ha implementado la posibilidad de hacerle un “ping” desde tu blog cada vez que hay contenido nuevo.
De esta forma se reduce la labor del robot, al no tener que rastrear constantemente por nuevo contenido. Es raro que recien ahora implementen esto. Google continuará haciendo uso de otros servicios de pings, pero aseguran que usando el de ellos puede aumentar la frescura de actualización.
Danny Sullivan en SEW recomienda utilizar http://blogsearch.google.com/ping/RPC2 para Movable Type.
Más información sobre el funcionamiento del Blog Search Pinging Service.
Al igual que Google dispone de su buscador gratis para insertar en tu web, ahora ha aparecido un código que permite realizar búsquedas de tu web pero para Google Blog Search: <form id=”b-search” name=”b-search” action=”http://blogsearch.google.com/blogsearch”> <input type=”text” id=”b-query” name=”as_q” /> <input type=”hidden” name=”ie” value=”UTF-8″ /> <input type=”hidden” name=”bl_url” value=”http://www.ojobuscador.com/” /> <input type=”submit” name=”Search” id=”b-searchbtn” value=”Buscar” [...]
Continuar leyendo Mi buscador de contenidos
Parece que, mientras Blogger no acabe de limpiar el spam que hay en sus entradas y comentarios, Google Blog Search ha decidido eliminar de su índice algunos de los resultados de su propio sistema de Blogs. Aunque, no han sido todos… Si hacemos una búsqueda de los sitios de BlogSpot, podremos ver que, si ordenamos [...]
Continuar leyendo Google Blog Search no indexa Blogger
Otro nuevo producto aparece. Google Reader es una aplicación, muy similar en aspecto a GMail, para leer RSS / Atom, es decir, feeds. Lo cierto es que, aunque no hemos tenido mucho tiempo de jugar con ello, hemos podido comprobar varias cosas. Puntos a favor: La interfaz es muy similar a la de GMail, lo [...]
Continuar leyendo Google Reader, lector de feeds
Sabemos que el robot de búsqueda de Google siempre ha sido el Googlebot, pero, para el Blog Search han decidido prescindir de él y centrarse en el llamado Feedfetcher. Este robot de búsqueda únicamente lee los RSS / Atom sin acceder nunca a la página web (ya que eso lo hace GoogleBot).
Continuar leyendo Feedfetcher
Parece que en unas horas (calculamos que a mediodía-tarde hora española) aparecerá el buscador de blogs de la mano de Google. Según se comenta estará disponible desde estas direcciones: search.blogger.com, blogsearch.google.com y google.com/blogsearch. Ahora mismo no funcionan. Según parece, y para aparecer en este buscador, se ha de tener un RSS o alguna otra estructura [...]
Continuar leyendo Blog Search de Google