Artículos que son como… metáforas

METAeuFORiAS

¿Qué es
Google
? ¿Qué es
un cerebro
?
Mie, 4-Jun-2008

Google es como un gran cerebro

Aunque en cierto sentido podemos ver a Google como un “gran ojo” (no sólo por las imágenes que nos ofrecen Google Maps y Google Earth, sino también porque parece “ver” todo lo que se escribe en la red), lo cierto es que el funcionamiento de su aplicación base, el buscador, se parece más al de un inmenso cerebro.

Logo de Google con dos cerebros


NOTA: este artículo es una adaptación de otro anterior publicado en jordisan.net.

Google y el PageRank

Los detalles del proceso que permiten a Google ofrecer tan buenos resultados en las búsquedas no son públicos; además, según Google indica, dicho proceso se actualiza continuamente. Sin embargo, sí se conoce que la parte fundamental de ese proceso es el algoritmo PageRank, que asigna un valor numérico a las páginas publicadas en Internet; las páginas con mayor PageRank aparecen en los primeros lugares en los resultados de búsqueda aunque, como ya hemos dicho, existen otros muchos factores “no públicos” para calcular esos resultados (por ejemplo, la frecuencia de aparición de los términos buscados en la página). Sin entrar en sus detalles, lo que resulta interesante es que el algoritmo de cálculo del PageRank funciona de modo similar a como lo hacen las neuronas en el cerebro. Veamos por qué.

Cada página indexada por Google tiene un PageRank que va de 0 a 10. Este valor sigue una escala logarítmica (es decir, hay mucha menor diferencia entre 3 y 4 que entre 4 y 5), y se calcula en función del número de enlaces desde otras páginas hacia ella; crear un enlace hacia otra página supone votar a favor de ella.

Al contrario que en una democracia, no todos los votos tienen el mismo valor: un enlace desde una página con un PageRank alto tiene mayor valor que un enlace desde una página con PageRank bajo. De algún modo, el PageRank indica el prestigio de la página; se obtiene mayor prestigio consiguiendo referencias desde otras páginas con prestigio alto (de hecho, un algoritmo similar fue propuesto para valorar el prestigio de artículos científicos).

Pero el prestigio también se reparte: un enlace desde una página que enlaza a otras muchas páginas tiene menos valor que desde una página con el mismo PageRank, pero con menos enlaces totales.

El cerebro como una red de neuronas

Haciendo una gran simplificación, el sistema nervioso central y, en concreto, el cerebro, puede verse como una red de muchísimas células, conocidas como neuronas, interconectadas entre ellas. Cada neurona está formada por un núcleo (o soma) del que parten diferentes ramificaciones nerviosas llamadas dendritas; surge además una larga fibra nerviosa llamada axón que también se ramifica al final.

Las dendritas de una neurona se ponen en contacto con las terminaciones del axón de otras en la zona que se conoce como sinapsis; en realidad no entran en contacto directo, sino que se encuentran a muy poca distancia.

Esquema de una neurona

Las señales electroquímicas viajan en las neuronas desde el núcleo, a lo largo del axón, hasta sus ramificaciones donde provocan la emisión en la sinapsis unas sustancias conocidas como neurotransmisores que son detectados por las dendritas de las neuronas cercanas.

Cada neurona recibe pues, a través de sus dendritas, diferentes estímulos, de diferente intensidad, provenientes de otras neuronas; unos son excitatorios y “animan” a la neurona a propagar la señal; otros son inhibitorios y “desaniman” a la neurona. Al final, unos y otros impulsos son sumados y, únicamente si el resultado supera cierto límite, la neurona se “dispara”, la señal viaja a lo largo del axón, y se propaga a las neuronas vecinas.

Similitudes

La asociación es inmediata: cada página web podría ser vista como una neurona y su PageRank como el valor de activación; los enlaces entrantes, las conexiones de otras neuronas a través de las dendritas; y los enlaces salientes, las conexiones a través del extremo del axón. Así, el cálculo del PageRank (del nivel de activación de la neurona) es función de los enlaces entrantes (los impulsos recibidos por otras neuronas) que, a su vez, es transmitido a las páginas enlazadas (los impulsos enviados a otras neuronas). Es más; no todas las páginas tienen el mismo peso en el cálculo del PageRank, al igual que no todos los impulsos recibidos por las neuronas tienen el mismo nivel de activación.

En ambos casos la información del sistema no reside en sus elementos, sino en las conexiones entre ellos. Y, lo que es más importante, las conexiones no son fijas: los enlaces entre páginas cambian y también lo hacen las conexiones entre neuronas (de hecho, algunas teorías afirman que precisamente en esos cambios residen la memoria o el aprendizaje).

Diferencias

Veamos algunos puntos en los que difieren ambos sistemas:

  • El nivel de activación de las neuronas es del tipo “todo o nada”, mientras que el PageRank es un valor numérico de 0 a 10
  • El algoritmo original de cálculo del PageRank no incluye enlaces que aporten valor negativo, que serían el equivalente a los impulsos inhibitorios; sin embargo, sí es conocido que Google penaliza las granjas de enlaces (link farms), que son páginas que se crean únicamente con el propósito de incrementar artificialmente el PageRank.
  • Las activaciones entre neuronas se realizan continuamente (”en tiempo real”), mientra que el cálculo del PageRank es realizado por Google aproximadamente una vez al mes, en lo que se conoce como “Google Dance”.
  • Relacionado con el punto anterior, la información está realmente distribuida en las neuronas, mientras que el valor del PageRank está centralizado en los servidores de Google (aunque se calcule a partir de los enlaces de la red).

Extendiendo la metáfora

Podemos elucubrar sobre qué sentido tendría aplicar otras características de las redes neuronales al algoritmo de cálculo de PageRank (no podemos hacerlo en sentido contrario ya que ¡todavía no podemos modificar cómo funcionan las neuronas!).

  • Reducir el rango de valores del PageRank, pasando de una escala de 0-10 a otra “todo-nada” (como en el caso de las neuronas) no parece que aportara gran cosa; al contrario, sería hacer menos flexible el cálculo del PageRank.
  • Considerar enlaces que aportaran valor negativo (similares a impulsos inhibitorios) sería peligroso, ya que un sitio penalizado de ese modo podría fácilmente perjudicar a otros, simplemente enlazándolos.
  • Sería enorme la cantidad de recursos necesarios para que Google realizara el cálculo del PageRank cada vez que se realiza una búsqueda; por eso el cálculo se hace de modo periódico y se almacena. Aunque podría pensarse que, cuanto más frecuentemente se haga, mejor.
  • Idealmente, cada servidor podría almacenar el PageRank de sus páginas para optimizar los procesos de búsqueda; pero resulta difícil confiar en que todos serían tan capaces (y honestos) como para almacenar correctamente ese valor.

Valora esta metáfora:

1 Star2 Stars3 Stars4 Stars5 Stars (2 votes, average: 4,50 out of 5)
Loading...
 

5 comentarios to “Google es como un gran cerebro”

  1. google lo ve todo porque evidentemente le viene informacion de todas partes, incluso de aquellas en donde no deberia poder tener acceso como nuestros email por ejemplo..

    no han notado que los avisos y propagandas asi como las noticias y busquedas son alucivas a sus preferencias!?!?!

    yo soy usuario que le gusta rap, anime, manga y linux, y en la cabezera de gmail, asi como en los anuncios solo me sale propaganda y noticias de linux y de manga.. asi como de musica basuron..(que no es rap) raro que sea tan casualmente propio!!!!

  2. […] primer artículo de METAeuFORiAS, que compara Google con el funcionamiento del cerebro, es una adaptación de otro que escribí en este mismo […]

  3. […] Conseguir que otras páginas enlacen hacia la página propia para conseguir mejor posicionamiento, especialmente por el algoritmo PageRank de Google. […]

  4. […] Versión en español aquí. […]

  5. […] Versión en español aquí. […]

Opina sobre esta metáfora