Nos acaban de confirmar desde Google los nombres de los que vendrán a exponer, debatir y responder preguntas durante el Congreso OJObuscador 2.0 del jueves 8 y viernes 9 de marzo.
Comentan en E-Consultancy sobre Steve Crossan: No encuentras a menudo a un “techie” tan talentoso pero que además tiene excelentes habilidades comerciales y de marketing. Probablemente por eso Google lo ha contratado. Si hay alguien que puede contarnos sobre el uso y ventaja comercial de API’s abiertas, él es el indicado.
El viernes 9 de marzo el Dr. Garcia dará una ponencia en el Congreso OJObuscador de título “Desmitifcando Latent Semantic Indexing para SEOs”. Está orientada a personas con amplia experiencia en posicionamiento y que quieran aprender conocimientos adicionales teóricos de information retrieval (recuperación de la información)
Abstracto: La presentación cubre indización de documentos, SVD (Singular Value Decomposition) y LSI (Latent Semantic Indexing). Se discutirán los mitos de SEO y posicionamiento en relación con LSI. Se trata de una explicación “soft” sobre indización de documentos, modelos de peso de palabras y LSI.
La presentación incluye una explicación básica de SDV, cómo este algoritmo descompone una matríz de documento-palabra y como se hacen clusters de término-término y documento-documento.
Se discutirá investigación personal del ponente en el área de teoría de gráfos para explicar la formación de caminos de co-ocurrencia de alto orden en la matriz de término-término. Este fenómeno puede ser utilizado para explicar la formación de clusters en la matriz de términos LSI. Se discutirán posibles aplicaciones para search marketing y keyword research.
Puede sonar muy complejo pero le hemos pedido al Dr. Garcia que ejemplifique lo máximo posible.
El blog de Fortune Interactive publica un interesante artículo sobre las consecuencias que tiene y puede tener la personalización de los resultados para el trabajo del SEO.
Con personalización se hace referencia a cuando los buscadores (particularmente Google) ofrecen diferentes resultados “acomodados” según el perfil del usuario y su historial de búsqueda.
Sin una método confiable para comprobar posiciones, el SEO tradicional pierde sus fundamentos para tomar decisiones de optimización. No pueden saber quienes son los líderes. También se pierde de vista aquellos sitios que sirven para influenciar.
Sin una método confiable para comprobar posiciones, el SEO tradicional también pierde la medición para determinar el éxito o fracaso de los cambios realizados para la optimización. El proceso tradicional del SEO es una metodología en la que predomina la prueba y error.
Aaron Wall de SEObook responde:
El SEO de calidad no se basa en la comprobación de posiciones de palabras arbitrarias para hacer reportes de posiciones. Se basa en la medición de tráfico y conversiones. Si los buscadores te están enviando más leads o mejores conversiones, entonces tu SEO está funcionando.
A los clientes que valen la pena no les importa los reportes de posiciones. A ellos les importan las conversiones. ¿Por qué se han hecho repentinamente tan importantes los chequeos de posiciones?
Personalmente comparto ambas posturas. Aquellos clientes obsesionados por el branding, el valor de ser primero “para todos los usuarios” cobra sentido si se pueden comprobar posiciones. Pero dada la experiencia, aquellos negocios más rentables en internet, son los que entienden que el objetivo más importante es aumentar el ROI y reducir el costo por adquisición.
Mientras, sorprendentemente, la aparente desactivación del “Google Bombing” no aparece como lo más buscado ni lo más escrito en Technorati, pese a estar despertando todo tipo de pasiones, he aquí una recopilación de las teorías que se están barajando, en cuanto cómo funcionaría este nuevo sistema de análisis de enlaces de Google:
[0153] Este enfoque tiene el beneficio de prevenir por completo ciertos tipos de manipulación de páginas web, con el objetivo de alterar los resultados para una búsqueda. Los buscadores usan un algoritmo de ranking que se basa en el número de enlaces que apuntan a un documento dado, y para rankear dicho documento es posible “bombardearlo” mediante la creación artificial de una gran cantidad de páginas con las palabras seleccionadas que luego enlazan al documento en cuestión. Como resultado, cuando se busca ese texto, la página bombardeada aparece, aún cuando de hecho la página tiene poco o nada que ver con el texto de los enlaces. Al importar el “bit vector” relacionado del documento en cuestión URL1 en la frase A, el “bit vector” de la frase relacionada al documento URL0 elimina la confianza en el sistema de búsqueda, pero solamente en la relación entre frase A en la URL0 apuntando a la URL1, como un indicador del significado, o URL1 al texto de la frase.
Parte de la respuesta puede encontrarse en algún análisis de redes. Me puedo imaginar que los Googlebombs tienen algún criterio en común, como que siempre utilizan el mismo texto en los enlaces (cosa que también comparten con algunas no-bombas), pero también se perciben como “puentes” de redes que sino estarían desconectadas. Con qué razón podrían un alto número de redes (vecindarios, comunidades) que no están estrechamente conectadas con una otra red mediante enlaces generales, de repente aparecen relacionados con su red opuesta? Para usar el ejemplo “failure”: por qué la red websites de los demócratas norteamericanos irían a enlazar todos juntos contra su red opuesta, la de los repúblicanos?
Resumiendo
Google dice que no es 100% efectivo y que algunas “bombas” podrían no estar desactivadas. De hecho en numerosos blogs y foros aparecen palabras en otros idiomas que aún siguen vigentes como bombas. ¿Será qué el nuevo sistema de análisis no re-analiza los millones de billones de enlaces de la web en busca de bombas?
Cuando se dice que esto ha sido manual, no es que nadie de Google se meta en sus servidores a borrar manualmente nada, sino que ha sido un retoque manual del algoritmo para ciertas palabras y que dichas palabras sí fueron seleccionadas a mano. Vale, sí, que luego el análisis de si se trata efectivamente de una bomba o no, es algorítmico, no hay duda alguna. De otra manera no sería escalable y como bien sabemos, todo lo que no sea escalable no es rentable.
De todas formas y como me dice Ricardo Baeza-Yates de Yahoo! sobre esto: “No tengo opinión, no se puede adivinar que cambios se hicieron en el algoritmo.”
Leo en Miislita (el Dr. García será ponente en el Congreso OJObuscador) que el pasado 21 de diciembre la Facultad de Derecho de la Universidad de Haifa en Israel, organizó una conferencia con el nombre “La Ley de los Buscadores”.
El propósito de la conferencia fue identificar el rol del derecho y de las regulaciones en la gobernabilidad del funcionamiento de los buscadores. Los buscadores son nuevos tipos de intermediarios que no sólo proveen de puertas de acceso a la información, pero a veces también reducen el acceso, forma el significado de los datos y afecta las prácticas relacionadas con el uso de la información.
Entre los temas principales, encontramos: propiedad intelectual, competencia y libertad de expresión.
Las presentaciones de los oradores están disponibles online. Por ejemplo:
De alguna forma nunca he leído este post de Telendro iniciando una campaña para que Google ponga a disposición un Matt Cutts, pero en español, es decir un Matías Cortés. Hoy me lo han comentado y pensé que es una idea excelente.
SEO Hispanic community - who cares? reza el eslogan de la iniciativa. Pero a diferencia de enlazar todos al blog de Matt Cutts como había propuesto Telendro, con el texto “we want our Matías Cortés for de hispanic seo community“, ya que creo ahora lo pueden considerar bombing, vamos a intentar otra cosa.
Pedimos a los que nos leen desde Torre Picasso en Madrid y en Mountain View (sabemos que nos leen, porque el blog oficial de Google nos enlaza) que se anime a dejarnos un comentario aquí o donde sea por lo menos diciéndonos que no. Ojalá que nos digan que sí, pero si es no o por ahora no, por lo menos saberlo.
Alemania por ejemplo, que es un mercado mucho más importante, aún no lo tiene. Pero también es cierto que en Alemania casi todos hablan muy buen inglés, a diferencia de los países hispanos.
Ya que Matt Cutts solo llega hasta Londres (estará en la SES), por lo menos que nos den una copia doblada en español.
Más allá de las consecuencias SEO que pueda tener esta movida de Google y lo que tengamos que especular, analizar y experimentar de ahora en más, lo que realmente importa es el trasfondo ético y político de esta resolución.
Matt Cutts comenta que la razón de solucionar la “debilidad” de PageRank es que mucha gente pensaba que listar resultados influenciados por Google Bombings era parte de la opinión editorial del buscador. Mucha gente me había comentado y preguntado por esto y era vox populi y en general había una conciencia bastante colectiva sobre la posibilidad de manipular los resultados mediante campañas de enlaces. Mucha gente que no tenía ningún conocimiento técnico, querían a Google porque creían que era “cool” o más bien, políticamente hablando, justo poder hacer algo así.
En qué consiste PageRank: PageRank se basa en la exclusiva naturaleza democrática de la web y usa su extensa estructura de vínculos como un indicador del valor de una página individual.
Cuando Google se jacta de la democracia ilusoria del PageRank, nos hace creer que realmente podemos cambiar algo, de forma democrática. Pareciera que en plena lucha contra el terror y el fracaso de la invasión a Irak produce que un buscador estadounidense no puede tolerar que le pongan “bombas” en forma de links.
Pero según Google la lucha contra el terror de los links hay que resolverla con un algoritmo. Recordando lo que escribía Gideon Haig en su artículo “Cómo Google nos está haciendo estúpidos”:
Neil Postman decidió que Estados Unidos y el Occidente se convertirían en una “tecnópolis”: un estado donde la cultura busca su fundamento en la tecnología, halla la satisfacción en la tecnología y acepta ordenes de la tecnología. Es difícil concebir eso sin pensar en algo llamado la Sociedad Google.
Tras tanta discusión sobre si ahora Google es “evil” o no, yo creo personalmente que el 23 de enero de 2006 debería ser nombrado el día oficial en que Google ha dejado de ser bueno.
En octubre pasado comenté que Google en español sugería, “tommy” en lugar de “tomy” de forma un tanto autoritaria. Concretamente, al final de la primer página de resultados decía “Usted quiso hacer su búsqueda con respecto a: tommy” cuando lo que estaba buscando era “tomy”.
Ahora Google nos sugiere “tommy” más amablemente al decir “Quizás quiso hacer su búsqueda con respecto a: tommy”.
¿Nos habrán leído?
Por otro lado, Yahoo! no sugiere nada (4 de 10 son resultados míos) y Live Search tampoco sugiere nada (2 de 10 son resultados míos).
Tras el nuevo estudio que realizó Enquiro sobre eyetracking en los diferentes buscadores, Gord Hotchkiss entrevistó a Marissa Mayer, vicepresidenta de search y experiencia del usuario de Google.
Recomiendo la lectura completa del artículo original en inglés pero he aquí algunas de las partes más sobresalientes:
Si se separa los anuncios que aparecen en la parte de arriba de los que aparecen a la derecha, la mayor parte de la interacción ocurren en la zona de la esquina izquierda arriba de la página. Una cosa que se hizo muy aparente, fue el hecho de que Google parece tener la mayor percepción de relevancia en esa zona de lo que llamamos el Triángulo de Oro. En todos nuestros escenarios, Google mostró resultados patrocinados arriba de la página en menor cantidad y en menos veces. Vimos una tendencia natural, donde el usuario separa los 3 o 4 primeros resultados de la página para escoger uno de ellos. En Google, esos 3 o 4 resultados siempre incluye 1 o 2 resultados orgánicos y a veces todos son orgánicos.
Marissa Mayer: Ese es absolutamente el caso. Si, siempre estamos mirando como podemos mejorar la relevancia de nuestros anuncios. Pero creemos que parte del targeting de los anuncios es “cuán bien los anuncios responden tu búsqueda”. Y luego la otra parte es saber cuán bien el formato y la prominencia influyen en la percepción de relevancia.
Nuestro equipo de anuncios ha trabajado muy duramente. Uno de los equipos más celebrados en Google es el equipo de “anuncios inteligentes”. De hecho, uno de los primeros equipos en ganar el premio de los fundadores de Google por valor de 10 millones de dólares en acciones de la empresa, ha sido el equipo de “anuncios inteligentes”. Ellos se ocupan en como mejoramos la relevancia y han estudiado la probabilidad de clic en cualquier resultado, por lo que la probabilidad impacta nuestra idea de relevancia y la forma en que decidimos mostrar el resultado.
Por lo que tendemos a ser muy selectivos y mantener muy alto el límite de lo que aparece en el top de la página. Solo mostramos cosas en el top cuando estamos convencidos de que el ratio de clic en ese anuncio será muy alto. Lo mismo para los resultados OneBox que aparecen ocasionalmente. Larry y Sergey, cuando comencé trabajando en la interfaz de usuario, dijeron que estaban pensando en hacer mi salario proporcional a la cantidad de pixels en promedio por arriba del primer resultado natural. No dejamos que la gente ponga demasiadas cosas allí. Piensa en la cantidad de espacio vertical como un espacio absolutamente “premium” y diséñalo y prográmalo como si tu salario dependiese de eso.
Algunas observaciones interesantes de la entrevista:
Hitchkiss comenta que el estudio de eyetracking mostró que el 33% de lo que se mira en Google se dedica a resultados naturales, aún cuando la página está repleta de anuncios, mientras que en Yahoo! era un 14%. Mayer responde que en Google no se contabiliza el espacio de la página en términos de porcentajes de centímetros lineales o cuadrados, sino que la guía es mantener siempre un resultado orgánico en el top, cuando se utiliza el navegador con resolución 800×600, ya que un poco mas del 30% de los usuarios de Google aún utiliza esa resolución. El estudio de Enquiro utilizó 1024×768.
Los resultados OneBox mostraron poca relevancia en el estudio. Sobre todo se debate en Google cuando mostrar OneBox con noticias y Marissa Mayer dice que hay dos “escuelas de pensamiento”. La de Google es que hay que mostrar noticias sobre una búsqueda en casos donde por ejemplo una noticia negativa sobre un producto pueda tener mucha relevancia para la compra o no de ese producto.
Comentábamos el otro día que se había descubierto un nuevo caso de Google Bombing. En ese caso “la victima” era el primer ministro de Israel. Parece bastante curioso que a los pocos días Google publique en forma oficial en el blog Webmaster Central (y no en el blog personal de Matt Cutts) que al parecer han mejorado el análisis algorítmico de enlaces y que por ende ciertas búsquedas ya no son afectadas por ningún Google Bombing.
Agregan Matt Cutts, Ryan Moulton y Kendra Carattini, autores del post, que dicho nuevo algoritmo también puede detectar y es efectivo contra “link bombings” en otros idiomas. Otra casualidad más, siendo el caso del ministro de Israel un caso en hebreo.
Habrá que analizar la situación un poco más y ver si realmente esta intervención ha venido a solucionar un problema político de forma automática o no. Aquí dicen que “después de muchos meses de haberlo dejado ‘aparcado’, han tomado la decisión de “modificar a mano” los resultados para determinadas consultas afectadas por ‘Google Bombings’, por lo que cabe suponer que otras búsquedas que no tienen relación con este asunto no deberían verse afectadas.”, siendo esto totalmente falaz ya que Google dice justamente lo contrario.
Yo por lo menos no me lo creo y será cuestión de ver que efecto puede tener esta supuesta mejora en casos de linkbaiting, donde si bien la palabra enlazada puede variar mucho más que en un caso de bombing, aún podría dar señal de alarma.
Danny Sullivan recopila toda la historia de los bombings y recomiendo leer los comentarios donde se barajan posibles formas en que esto podría funcionar. Por ejemplo un comentario elabora la siguiente teoría:
- Hay muchos enlaces con la palabra “bomba”
- “bomba” no aparece ni en la página ni los metas
- “bomba” es el enlace más común
- hay pocos enlaces tipo “bomba otras palabras”
Entonces: ignora todos los enlaces con la palabra “bomba”
En los mismos comentarios Bill Slawski sugiere mirar el análisis de una patente sobre “sistemas de recuperación de la información y frases relacionadas”, a lo que Matt Cutts responde “interesante, pero no voy a dar más detalles”.