miércoles, 9 de enero de 2008

Google procesa 20 Petabytes de datos al día

Jeffrey Dean y Sanjay Ghemawat, dos ingenieros con su correspondiente doctorado que trabajan en Google desde el año 1999, han publicado un informe en el que revelan que el buscador de buscadores procesa 20 Petabytes de datos al día. Para que os hagáis una idea de la enormidad de esta cifra, 20 PB equivalen a 20.000.000.000.000.000 de bytes, o sea, 20.000 billones de bytes.

Para organizar tal maremágnum de datos, Google ha creado un entorno de trabajo en C++ llamado MapReduce que es capaz de procesar y trabajar con grandes volúmenes de datos y que le permite reducir significativamente el tiempo que sus servidores necesitan para manejar toda la información que les llega a diario procedente de los millones de búsquedas que efectuamos los internautas de todo el mundo.

Los 20 Petabytes se procesan en 400 clústers, cada uno de los cuales está compuesto por 2 microprocesadores Intel Xeon a 2 GHz, 4 GB de RAM, 2 discos duros 160 GB IDE. Casi nada.

No hay comentarios: