Mi historia con internet no es tan larga como la de muchas personas de mi generación. Cuando (casi) todos mis compañeros de clase ya tenían un ordenador en casa y sabían lo que era Yahoo, Messenger, Terra, etc., yo todavía andaba viéndolas venir.
Así es que básicamente me incorporé a este mundo cuando el buscador por excelencia era Google. Para conocer la historia de Google solo tendrías que poner “Historia de Google” en el propio buscador y pinchar en el primer enlace, que te dirige a una página donde los propios fundadores te cuentan sus comienzos. Para ahorrarte trabajo te resumiré, brevemente, lo que allí cuentan.
Estamos en 1995 en la Universidad de Stanford. Larry Page quiere estudiar un posgrado en esta universidad y Sergey Brin (un alumno de esta uni) le lleva a hacer un recorrido por ella. Parece ser que en este primer encuentro no hubo muy buen rollo pero, al año siguiente empiezan a trabajar juntos y crean su primer motor de búsqueda al que llaman Backrub. Un nombre que no debió gustarles mucho ya que finalmente lo cambiaron por Google.
Viajamos a 1998
donde estos chicos se mudan a su primera oficina (garaje) gracias a una importante inversión que le hace el
cofundador de Sun. Para saber más
Finalmente se trasladan a las que, actualmente, son sus oficinas, conocidas como Googleplex (California) creando cientos de productos (YouTube, Android, Gmail…).
Estaremos de acuerdo en que Larry y Sergey se lo han montado bastante bien desde aquellos días en los que lo único que tenían era una habitación para trabajar.
Pero, ¿por qué han tenido tanto éxito?, ¿qué tiene Google que no tenga otro buscador?, ¿será su algoritmo?
Repasemos lo que sabemos sobre PageRank, el algoritmo de Google que se usa para determinar la importancia o relevancia de una página. Y esto es súper interesante si, por ejemplo, eres empresario y quieres que tu producto aparezca el primero en la lista. Pues bien para intentar entender esto nos tenemos que adentrar en el mundo de las matemáticas y en concreto, en el mundo de los grafos.
Un grafo es un conjunto de puntos (llamados vértices) y líneas (llamadas aristas) que estudia las relaciones que existen entre unidades que interactúan con otras. Se utilizan en distintas áreas como la física, química, análisis de redes sociales, arquitectura, etc. La siguiente imagen muestra un ejemplo.
PageRank nace de la teoría de grafos, en concreto, trabaja con grafos dirigidos, en los que tendremos flechas que indicaran, en nuestro caso, qué páginas webs están enlazadas. Mostramos otro ejemplo considerando que del 1 a 4 lo que tenemos son páginas webs.
Veremos dos formas de obtener la relevancia de nuestras páginas.
Si observamos el grafo vemos, fácilmente, el enlace de unas páginas con otras. Pero, ¿qué página es la más relevante? Pues cada página tendrá su relevancia pero la repartirá entre las páginas a las que enlaza. Así, al principio todas comenzarán con la misma relevancia y repetiremos el proceso de reparto muchas veces hasta llegar a un punto en el cual la relevancia se estabilice. A este modelo se le conoce como Cadena de Markov.
A partir de aquí emplearíamos cálculo matricial para moldear nuestro grafo de tal forma que podamos hacer cálculos matemáticos.
De esta manera podríamos conocer la relevancia de cada página.
Página 1: 3/2
Página 2: 1/3
Página3: 5/6
Página 4: 4/3
De tal manera que, repitiendo este proceso a partir de las relevancias calculadas anteriormente, llegaríamos a conocer la relevancia de cada página puesto que, como comentamos anteriormente, llegaríamos a estabilizar dicha relevancia.
Otra forma de verlo sería planteando un sistema de ecuaciones lineales, de tal manera que:
Tenemos un sistema compatible indeterminado. Si aplicamos el método de Gauss (hacia un tiempo que no resolvía ninguno), nos queda:
Pues ya tendríamos el orden de páginas por relevancia.
Puede ocurrir que tengamos páginas que no tengan ninguna otra enlazada. ¿Quiere decir esto que si yo hago mi búsqueda en Google no voy a encontrar nada? En este caso lo que hace nuestro buscador es comprobar los enlaces disponibles y tejer una red “imaginaria” de enlaces a las páginas disponibles.
Esto es solo una explicación sencilla a partir de un grafo sencillo (imagina las dimensiones del grafo de internet. Parecido al de la foto de portada) sobre el funcionamiento de PageRank pero a todo esto hay que sumar los datos que almacena el buscador sobre nuestras preferencias, localización, etc. De hecho, si estas con alguien en este momento, os invito a que busquéis una misma cosa en el buscador, conectados a vuestras cuentas de Google, y comprobéis si os salen diferentes resultados.
¿Y qué pasa si nos da por comprar enlaces para conseguir un mejor posicionamiento? Pues que Google te penaliza, bajándote el posicionamiento o quitándotelo directamente. Quizás una de las razones por las que el algoritmo de Google es el secreto mejor guardado de la compañía es precisamente evitar que no se alteren los resultados de la búsqueda en beneficio de unos pocos.
Me gustaría que terminaras este artículo siendo consciente de toda la ciencia (en este caso hablamos de matemáticas), que hay detrás de todas las “cosas” que utilizas en tu día a día y que, en definitiva, hacen tu vida mucho mejor.
No hay comentarios:
Publicar un comentario