El responsable de Google Research, Peter Norvig, ha estado haciendo algunas reflexiones en un evento en el que ha participado y que han dejado algunas perlas interesantes.
Pero básicamente la mayor de ellas es:
One thing that I think is still overhyped is PageRank. People think, yeah, you do this computation on the web graph and then you just order all the pages by that. Yes, that computation is important but it’s just one of many things. And people say, “Oh, well you’re stuck if you don’t have that.” We never felt that way. We never felt that it was such a big factor. It’s got the catchy name and the name recognition, but we’ve always looked at all the available data
There is this confusion that there’s this one component that’s called PageRank, but the whole thing has been called that. That was a mistake. We need some better branding.
Una cosa que creo que está sobrevalorado es el PageRank. La gente cree, sí, hacer este cálculo en el grafo web es todo lo necesario para ordenar las páginas y ya está. Sí, ese cálculo es importante, pero es sólo una de muchas cosas. Y la gente dice, “Oh, así que estás atrapado si no tienes eso.” Nunca nos hemos sentido así. Nunca sentí que era como un gran factor. Tiene un nombre pegadizo y el reconocimiento, pero siempre hemos mirado en todos los datos disponibles…
Hay esta confusión en que sólo existe un componente llamado PageRank, pero el caso es todo se ha acabado llamando así. Eso fue un error. Necesitamos una mejor marca.
Aunque el Pagerank se atribuye a Google en el año 97-98, en alguna ocasión os había comentado que esta idea se basaba en algoritmos de hace algunos años atrás. Yo tenía entendido que esta forma de organizar información rondaba los principios de los 80, pero parece que va mucho más atrás y se remonta a los años 40.
Massimo Franceschet desde la Universidad de Udine en Italia marca que esta idea lleva utilizándose desde los años 20 en varios elementos científicos con bastante éxito. Si hacemos una retrospectiva el algoritmo se utilizó para algo similar a lo que hicieron Brin y Page pocos años, por Jon Kleinberg de la Universidad de Cornell, al que los propios de Google hacían referencia en su trabajo.
Kleinberg llamó a su algoritmo Hypertext Induced Topic Search (HITS) teniendo dos elementos clave: nodos y autoridad. Se utilizó la definición circular en que la autoridad es el peso que se le da a cada uno de los nodos, por lo que se necesita un sistema reiterativo para resolver la respuesta.
Franceschet también examina la obra de Gabriel Pinski y Francis Narin que desarrollaron un sistema de clasificación para “el papel” diciendo que un diario es importante si es citado por otras revistas importantes.
En 1965 Charles H. Hubbell, desde la Universidad de California, hizo un análisis de redes sociales usando una idea similar. La ideas era presentar los usuarios importantes en base a la cantidad de personas que tiene como respaldo. Hubbell es reconocida por muchos, como Kleinberg, como un pionero en la teoría de clasificación iterativa.
Aunque la sorpresa se encontró en 1941 cuando el economista de Harvard, Wassily Leontief, publicó un documento en el que se divide la economía de un país en base a aquellos sectores, y la oferta y demanda de cada uno de ellos. Para saber el valor de cada uno de los sectores desarrolló un sistema iterativo de valoración de cada sector sobre la base de la importancia de los sectores que las abastecen. En 1973, Leontief fue galardonado con el Premio Nobel de Economía para este trabajo.
Sin duda Google no puede acabar el año sin ser el último en dar una noticia… esto es como lo de saber cuál es el último anuncio de la tele, pero en la web.
Y como bien dice el titular, Google ha decidido actualizar entre los días 30 y 31 de diciembre el Pagerank visible en la Toolbar; sin duda una forma muy entretenida de acabar el año para que los SEO se queden en casa tomando las 12 barritas verdes.
Y es que hace un par de semanas la barrita empezó a quedarse gris mostrando a los sitios que se han portado mal este año que tienen una penalización y los Reyes Magos les han decidido traer mucho carbón. Y ahora, tras las penalizaciones llegan las calmas, reajustando el Pagerank visible al resto de usuarios de la web.
Como curiosidad, comentar que hace justo un año también ocurría exactamente lo mismo, ya que también hubo una última actualización antes de comenzar el año… ¿habrán puesto un evento recurrente en el Google Pagerank Calendar para los 31 de diciembre? Habrá que esperar al del año que viene… si es que la cafeína no nos ha puesto de los nervios…
Aún recuerdo cuando hace unos años la gente de Google anunciaba uno de los microformatos más conocidos: el nofollow. Desde tiempo inmemorables existe un “meta robots” que incluye un nofollow, aunque en este caso se indica que no se deben seguir todos los enlaces de la página. Este microformato implicaba no seguir un enlace concreto.
La filosofía decía que se enlace se debía tratar como si no existiera, pero todos los buscadores, incluidos Google, siempre los han seguido… ¿para qué servía entonces? Para nada.
Según Google, su inventor, se suponía que con este sistema no se iba a traspasar Pagerank y una serie de factores y que los webmasters debían ponerlo cuando hubiera enlaces hacia sitios de publicidad principalmente. Muchos han hecho un uso abusivo de esta herramienta y ahora la propia Google ha decidido que todo lo que había dicho que no haría, lo hará. Así que el “nofollow” vuelve a pasar todas las peculiaridades de un enlace.
El microformato nofollow, conceptualmente es una muy buena idea. Sobretodo si se hace un uso correcto de él. Por ejemplo, cuando tenemos una página con su versión para imprimir, o tenemos un enlace hacia un ZIP o un PDF que no queremos que siga. En el primer caso, el de la versión para imprimir, es sencillo que no se indexe, ya que se puede incluir un “meta robots noindex”, algo que haría que no aparezca en los resultados de búsqueda, pero a un PDF no se puede “negar” su indexación.
Y ¿a qué viene todo esto? Pues muy sencillo. En uno de los eventos realizados estos días en Estados Unidos, Matt Cutts ha decidido que el “nofollow” no va a servir para lo que se propuso, y se ha liado parda cuando los webmasters que lo utilizaban para intentar “engañar” al buscador se han enterado.
Al fin y al cabo, hasta que se inventó esto nadie pensaba en los enlaces… si es necesario enlazar, se enlaza, sino, no. Internet tiene una gran diferencia con el mundo que son los hiperenlaces… en el momento en el que el gigante de la red decide una cosa, Internet se acaba, y no tiene sentido que eso sea así…
Hace unos años comenté que, de un día para otro puse, tal y como afirmaba Google, un anuncio de publicidad con un “nofollow” y me penalizaron… ¿no será que el nofollow se ha utilizado durante este tiempo para “pillar a los tramposos”?
Parece que estos días Google está aplicando una de sus actualizaciones de la “barrita verde” para tener entretenidos a los webmasters y seguir distrayendo la atención de lo que realmente importa a la hora de hacer aparecer un sitio en los resultados de búsqueda.
La primera de las actualizaciones del Pagerank de 2009 se producía a principios de año, más o menos el 2 de enero para sorpresa de muchos. Y hasta hace 2 meses no se producía el último cambio, en Abril de 2009.
Ahora, justo a la llegada de Junio, aparecen unos nuevos datos en la barra de herramientas del buscador estadounidense.
Hace un tiempo alguien me comentó que el Pagerank es una técnica genial, los que dicen ser SEOs se fijan en ella, mientras Google les despista, y los que saben de que va esto sólo ven lo que hay que ver en su fórmula. Y es que hace un par de días el propio Matt [...]
Continuar leyendo El Pagerank se ha actualizado
Uno de los factores clave para la ordenación de resultados de Google siempre ha sido el Pagerank, pero según los ingenieros asiáticos de Microsoft creen que hoy en día ya pierde muchos de sus valores ya que es fácilmente manipulable al poder crear granjas de enlaces. Es por esto que tras un estudio y un [...]
Continuar leyendo Microsoft BrowseRank
Hace unos días se celebró la Web2Expo y Matt Cutts estuvo allí explicando algunos detalles sobre lo que Google sabe sobre spam y SEO: Entre alguno de los detalles que comenta: El PageRank va relacionado con el TrustRank, lo que significa que cuanto más PageRank menos probabilidades hay de que un sitio haga o contenga [...]
Continuar leyendo Google sabe algo sobre SEO y spam
El pasado jueves estuve en la mesa de posicionamiento que se organizó en la II Jornada de Networking Activo. Tras la presentación de los ponentes y una frase mía de estas para no dormir que dice “el SEO ha muerto”, Jaume Ferré comentó varios puntos que llevábamos estudiando desde hace unas semanas y que si [...]
Continuar leyendo Prepárate para la versión 2 del SEO
Matt Cutts y Maile Ohye han publicado un artículo en el blog oficial de Google Webmaster, que habla de la compra y la venta de enlaces con el propósito de “manipular los rankings de los motores de búsqueda”. En el post declaran que Google se reserva el derecho a proteger la calidad de su índice [...]
Continuar leyendo Venta y compra de enlaces que pasa el PageRank