Google se preocupa en buscarte, clasificarte y posicionarte. Pero depende de ti en que posición lo haga.
Imagina una biblioteca con miles de libros. Su utilidad es nula hasta que todos esos libros son listados y ordenados de alguna forma. En Internet pasa lo mismo con la información. Desde el origen de Internet, el crecimiento de sitios web ha sido exponencial y han ido surgiendo diferentes retos para los que no hay una solución clara o al menos, totalmente satisfactoria.
Tras el reto de la ordenación y la clasificación de una cantidad ingente de información — recuerda, no sirve de nada la información que no es accesible o no se puede encontrar — hemos derivado en otro problema que sigue empeorando a pasos agigantados: la calidad de esa información. Hablamos de la verdad, de lo que es legítimo, de relevancia real, de separar el trigo de la paja.
Hasta el momento, el algoritmo sobre el que se sustenta Google como buscador para mostrar resultados de calidad se basa en una premisa sencilla. Simplificando mucho, PageRank — así se llama el algoritmo de Google — es lo mismo que el citation index en el mundo de la ciencia, una forma de clasificar y medir la relevancia de un científico a partir de las menciones que otras publicaciones hacen de sus artículos. A más menciones, se infiere que el autor es más relevante y sobre todo, que sus publicaciones son de más calidad.
PageRank hace lo mismo, pero con las páginas web. Cuando una página web es enlazada por otras páginas web, PageRank entiende que están hablando de ella y que por lo tanto tiene relevancia, que su contenido debe ser de calidad y por lo tanto merece salir antes en los resultados de una búsqueda. Pero lo que funciona bien para el mundo de la ciencia con el tiempo ha dejado de ser efectivo en Internet.
La inclusión de las redes sociales en PageRank — siguiendo la misma lógica, si se habla mucho de una cosa, esa cosa tiene que ser buena — ha desvirtuado los resultados. Los usuarios nos hemos convertido en una fuente de ruido y tanta información ha terminado por alienarnos. No somos capaces de discernir entre la verdad y la mentira, somos manipulables y nuestro criterio es cuestionable. No somos gente de fiar.
Lo que inicialmente se contempló como una forma de añadirle calidad a los resultados ha terminado por posicionar en los primeros puestos de una búsqueda a páginas que promocionan las teorías de los antivacunas, la homeopatía, el reiki y otros miles de mitos o teorías pseudocientíficas. Blogs sensacionalistas, sesgados o claramente manipuladores le quitan el puesto a publicaciones serias. Y todo esto nos lo comemos cuando hacemos una búsqueda.
Considerando que el grueso del beneficio de Google gira alrededor de su buscador, es lógico pensar que los esfuerzos que se están invirtiendo en cambiar esto son enormes. Por eso, la próxima actualización de PageRank dará menos crédito a las redes sociales e introducirá una novedad polémica. Una forma de analizar si un resultado es verdad, si tiene legitimidad o no. Para esto, se apoyará en fuentes de conocimiento probado como la Wikipedia — entre otros muchos.
Ahora bien, tenemos a una empresa privada decidiendo lo que es verdad y lo que es mentira. Un algoritmo al que nadie tiene acceso pero que el 98% de los internautas utiliza para navegar, para informarse, que utiliza prácticamente para todo. Las implicaciones reales de esto son gigantescas. Y por eso hay un movimiento cada vez mayor pidiendo transparencia, pero hablamos de una empresa privada. Cada parte defiende sus intereses, pero cuando hablamos del bien común pocas veces podemos hablar de soluciones ideales. No porque no las haya, sino porque no hay voluntad. Al final, solo nos queda elegir el mal menor.