La inmensidad de Google
 
Para la gran mayorÃa de la gente Google es solo lo que se les muestra: un gran buscador web, un excelente sistema de correo electrónico web, una base de datos de imágenes satelitales de todo el mundo, y un largo etcétera de muy buenas aplicaciones. Pero toda esa información y software es soportado y funciona gracias a hardware, a servidores dispuestos alrededor del mundo e interconectados. Y de esto es de lo que os voy a hablar, de una parte de la infraestructura de Google.
El mes pasado Cnet cubrió la conferencia I/O organizada por Google en donde se habla sobre el futuro de sus aplicaciones y tecnologÃas de código abierto. Una de las charlas estaba dirigida a desmitificar el funcionamiento interno del buscador del que poco y nada se sabÃa hasta ahora.
Para empezar, Google usa hardware más o menos común en sus servidores (Común dentro del mundo de los servidores), procesadores que después dieron a entender que son algún modelo de varios núcleos Intel, memoria, discos duros. Esto concuerda con lo que más tarde se dirÃa “Nuestra visión es que es mejor tener más servidores que no son tan confiables, que tener pocos servidores más confiables” Un servidor o un grupo de servidores por más confiables que sean van a fallar, es regla, y cuantos más servidores se tiene más fallas, por eso Google prefiere invertir en software tolerante a esos fallos.

Todo esto viene a razón de la cantidad de servidores que tienen esparcidos por el mundo. Si bien no se conoce su cantidad exacta el periodista de Cnet lo estimó con datos que ya se conocen. Google posee 36 DataCenter en todo el mundo, cada uno de ellos posee 150 racks de servidores, y en cada uno de esos racks hay 40 servidores. Eso nos da la cifra de 216000 servidores, una cantidad impresionante que según Cnet debe ser bastante mayor. Una cantidad de servidores tan alta también tiene una cantidad alta de fallas, por esto es que Google prefiere invertir en software más que en hardware especial. Por ejemplo: cuando 100 máquinas fallan el servidor maestro sabe qué tarea tenÃan asignadas esas máquinas y asà redirecciona esas tareas a otras 100 máquinas. De esta manera no se pierden trabajos y el Ãndice de fallos se reduce muchÃsimo.
Todos esos servidores sumado al software hecho por el mismo Google es lo que permite que, luego de haber atravesado entre 700 y 1000 servidores, una búsqueda tarde menos de medio segundo en devolvernos resultados.



¿Qué opinas?
Ir al formulario | RSS de los comentarios | URL del trackback