Explicación oficial del apagón en GMAIL del martes 24 de Febrero. El problema surgió cuando se mantenían tareas de mantenimiento en uno de los centros de Google en Europa...
#5:
Traduzco lo esencial, la parte en que dan realmente explicaciones, por si a alguien le sirve.
Esta mañana teníamos una operación rutinaria de mantenimiento en uno de nuestros centros de datos europeos. Esto normalmente no causa ningún transtorno, porque simplemente las cuentas se sirven desde otro centro de datos.
Inesperados efectos colaterales de unos códigos nuevos que tratan de mantener los datos geográficos más cerca del usuario provocaron la sobrecarga de otro de los centros de datos de Europa, y eso provocó problemas en cascada de un centro de datos a otro. Nos llevó alrededor de una hora recuperar el control sobre todos ellos.
Los bugs han sido encontrados y reparados, y estamos en el proceso de impulsar unos cambios. Sabemos lo dañino que puede ser un apagón como este (nosotros corremos Google en Gmail, así que apagones como este nos afectan del mismo modo que a vosotros). Siempre investigamos las causas de origen de apagones como este, de modo que podamos prevenir problemas similares en el futuro.
#11:
#2: ¿por qué no pones la frase completa y la siguiente?
"Durante dos horas y media empezando a las 1.30 hora del Pacífico (donde está la sede de Google, añado yo), mientras muchos de nuestros usuarios en EEUU dormían, mucha gente no pudo acceder a su correo. Gran cantidad de usuarios por todo el mundo que dependen de Gmail fueron interrumpidos en sus horas de actividad y trabajo, y lo sentimos".
La verdad, a veces el antiamericanismo roza el ridículo. Más aún cuando este problema parece que viene de un intento de descentralizar.
Traduzco lo esencial, la parte en que dan realmente explicaciones, por si a alguien le sirve.
Esta mañana teníamos una operación rutinaria de mantenimiento en uno de nuestros centros de datos europeos. Esto normalmente no causa ningún transtorno, porque simplemente las cuentas se sirven desde otro centro de datos.
Inesperados efectos colaterales de unos códigos nuevos que tratan de mantener los datos geográficos más cerca del usuario provocaron la sobrecarga de otro de los centros de datos de Europa, y eso provocó problemas en cascada de un centro de datos a otro. Nos llevó alrededor de una hora recuperar el control sobre todos ellos.
Los bugs han sido encontrados y reparados, y estamos en el proceso de impulsar unos cambios. Sabemos lo dañino que puede ser un apagón como este (nosotros corremos Google en Gmail, así que apagones como este nos afectan del mismo modo que a vosotros). Siempre investigamos las causas de origen de apagones como este, de modo que podamos prevenir problemas similares en el futuro.
#2: ¿por qué no pones la frase completa y la siguiente?
"Durante dos horas y media empezando a las 1.30 hora del Pacífico (donde está la sede de Google, añado yo), mientras muchos de nuestros usuarios en EEUU dormían, mucha gente no pudo acceder a su correo. Gran cantidad de usuarios por todo el mundo que dependen de Gmail fueron interrumpidos en sus horas de actividad y trabajo, y lo sentimos".
La verdad, a veces el antiamericanismo roza el ridículo. Más aún cuando este problema parece que viene de un intento de descentralizar.
bueno ahora parece que se va a hundir nuestra insignificante vida cada vez que se cae google o algún sucedáneo. En fin, yo incluso dudo si no hacen estas cosas a posta para darse importancia y parecer que son imprescindibles.
Lots of folks are asking what happened, so we thought you'd like an explanation. This morning, there was a routine maintenance event in one of our European data centers. This typically causes no disruption because accounts are simply served out of another data center.
Claro , la culpa de Europa
#19 Si el documento lo habías redactado tu, creo que el problema fué que el corrector ortográfico de google, se cepillo los recursos de todos sus centros de datos en corregirlo ...
#8 Jojo, no se si sera así. Lo que si que esta claro es que cada vez que google estornuda todo el mundo va con el pañuelo a limpiarle el moquillo. En dos palabras... somos unos PAGA-FANTAS (de google en este caso)
#28 No entiendo la mitad de lo que escribes, pero entiendo que en cierto modo era un DDOS provocado por el propio sistema; si tienes dos datacenters en Europa, y desconectas uno, y en vez de repartir el tráfico al resto del mundo, envías todo el tráfico al otro datacenter de Europa (por el algoritmo ese de enviarlo al más cercano) tendría toda la pinta de un DDOS sobre ese datacenter. (Y todo respondería a las peticiones, pero no respondería el datacenter sobrecargado; que creo son los síntomas que describes.)
Lo siento, pero no me lo creo, los detalles que da google en el blog, son poco menos que insignificantes, no hay nada tecnico en ellos que me haga creerme su explicacion.
1 Al principio del apagon cuando intentabas entrar se producia en time up
2 El ping respondia puesto que los servidores de google estan puestos en balanceo de carga
3 Si realizabas un telnet al puerto smpt de gmail esta respondia perfectamente con el hello
4 Los protocolos pop3 y imap funcionaban perfectamente puesto que muchos usuarios pudieron descargar sus correoss por ellos.
5 El problema estaba en el "front end" de la aplicacion web, el cual no estaba caido porque respondia perfectamente a solicitudes get y post
Lo siento llamarme paranoico pero me inclino a que el problema es que recibio un ataque DOS distribuido, y si buscais por la red vereis que no soi el unico que piensa en ello.
#28, claro que recibió un DDOS, pero de los propios usuarios.
En este caso no es necesario buscar hadas en el bosque.
Según indica #5, entiendo, que los datos geográficos servían para aproximar el tráfico al datacenter más cercano. Si el algoritmo fallaba y daba siempre el mismo datacenter, pues DDOS al canto.
#2 si hubiera sido así hasta hace unas horas no se habría resuelto el problema. El hecho es que yo empecé a tener fallos a las 11am de ayer y a las 13.00 ya funcionaba bien.
¿Así es como piensan convencer a las empresas para que se pasen a google apps?
Ha sido una caída muy breve pero suficientemente larga para ver que para Google dar información a sus clientes equivale a meter una nota en su blog al día siguiente.
Esto de la nube veremos si no acaba siendo más bien humo.
Comentarios
Traduzco lo esencial, la parte en que dan realmente explicaciones, por si a alguien le sirve.
Esta mañana teníamos una operación rutinaria de mantenimiento en uno de nuestros centros de datos europeos. Esto normalmente no causa ningún transtorno, porque simplemente las cuentas se sirven desde otro centro de datos.
Inesperados efectos colaterales de unos códigos nuevos que tratan de mantener los datos geográficos más cerca del usuario provocaron la sobrecarga de otro de los centros de datos de Europa, y eso provocó problemas en cascada de un centro de datos a otro. Nos llevó alrededor de una hora recuperar el control sobre todos ellos.
Los bugs han sido encontrados y reparados, y estamos en el proceso de impulsar unos cambios. Sabemos lo dañino que puede ser un apagón como este (nosotros corremos Google en Gmail, así que apagones como este nos afectan del mismo modo que a vosotros). Siempre investigamos las causas de origen de apagones como este, de modo que podamos prevenir problemas similares en el futuro.
#1 mejor es esto,
while many of our users in the US were asleep,
Esto es que, se joda el mundo.
La he liao parda mode
"se mantenían tareas de mantenimiento..."
y el mantenedor que las mantenga, buen mantenedor será
#0 "se llevaban a cabo", "se realizaban", "tenían lugar", "se efectuaban"...
#2: ¿por qué no pones la frase completa y la siguiente?
"Durante dos horas y media empezando a las 1.30 hora del Pacífico (donde está la sede de Google, añado yo), mientras muchos de nuestros usuarios en EEUU dormían, mucha gente no pudo acceder a su correo. Gran cantidad de usuarios por todo el mundo que dependen de Gmail fueron interrumpidos en sus horas de actividad y trabajo, y lo sentimos".
La verdad, a veces el antiamericanismo roza el ridículo. Más aún cuando este problema parece que viene de un intento de descentralizar.
bueno ahora parece que se va a hundir nuestra insignificante vida cada vez que se cae google o algún sucedáneo. En fin, yo incluso dudo si no hacen estas cosas a posta para darse importancia y parecer que son imprescindibles.
Lots of folks are asking what happened, so we thought you'd like an explanation. This morning, there was a routine maintenance event in one of our European data centers. This typically causes no disruption because accounts are simply served out of another data center.
Claro , la culpa de Europa
#19 Si el documento lo habías redactado tu, creo que el problema fué que el corrector ortográfico de google, se cepillo los recursos de todos sus centros de datos en corregirlo ...
#8 Jojo, no se si sera así. Lo que si que esta claro es que cada vez que google estornuda todo el mundo va con el pañuelo a limpiarle el moquillo. En dos palabras... somos unos PAGA-FANTAS (de google en este caso)
¿Cual era el boton que no tenía que tocar?
#28 No entiendo la mitad de lo que escribes, pero entiendo que en cierto modo era un DDOS provocado por el propio sistema; si tienes dos datacenters en Europa, y desconectas uno, y en vez de repartir el tráfico al resto del mundo, envías todo el tráfico al otro datacenter de Europa (por el algoritmo ese de enviarlo al más cercano) tendría toda la pinta de un DDOS sobre ese datacenter. (Y todo respondería a las peticiones, pero no respondería el datacenter sobrecargado; que creo son los síntomas que describes.)
#13 Jaja, yo pensé que estaba empezando a tomar conciencia de sí mismo como Skynet...
Os habeis fijado pero, la de problemas que están teniendo desde que hicieron regulación del personal... se estan quemando ahora..
¿Esta vez sí se podrá decir? "Ha sido un fallo informático"
(¿O será culpa del becario de turno?)
Claro, asi que la culpa es de los de testing, no? por no encontrar el bug antes de llevarlo a produccion [/tester]
#6 eso me recordo el status en twitter que mando un excompañero de trabajo, me parecio bastante gracioso ->
Esto acerca Gmail a Hotmail
Categoria "Caidas de google" ya!
#28 Cuidado ¡te vigilan! El canal ya no es seguro
Lo siento, pero no me lo creo, los detalles que da google en el blog, son poco menos que insignificantes, no hay nada tecnico en ellos que me haga creerme su explicacion.
1 Al principio del apagon cuando intentabas entrar se producia en time up
2 El ping respondia puesto que los servidores de google estan puestos en balanceo de carga
3 Si realizabas un telnet al puerto smpt de gmail esta respondia perfectamente con el hello
4 Los protocolos pop3 y imap funcionaban perfectamente puesto que muchos usuarios pudieron descargar sus correoss por ellos.
5 El problema estaba en el "front end" de la aplicacion web, el cual no estaba caido porque respondia perfectamente a solicitudes get y post
Lo siento llamarme paranoico pero me inclino a que el problema es que recibio un ataque DOS distribuido, y si buscais por la red vereis que no soi el unico que piensa en ello.
¿Acacio Cruz? No me esperaba ese nombre del Gmail Site Reliability Manager
¡Y nada contra los Acacios, eh!
#28, claro que recibió un DDOS, pero de los propios usuarios.
En este caso no es necesario buscar hadas en el bosque.
Según indica #5, entiendo, que los datos geográficos servían para aproximar el tráfico al datacenter más cercano. Si el algoritmo fallaba y daba siempre el mismo datacenter, pues DDOS al canto.
#20 si puede ser pero son unos hijos de.............. y no molaaaa:D
Disculpas aceptadisimas, vamos, al menos te cuentan lo que pasa. No es como lo típico de "¿a ti te va el messenger?" que nunca sabias que habia pasado
Yo me cague, pensaba que era un golpe de estado mundial de google. Vamos, un 24F
#6
(al parecer trabajaba para google también jajaajja)La pobre socorrista:
1ª Ley de TI: "Ten siempre backup" aunque en la medida de lo posible lo aplicaría a la vida misma
#2 si hubiera sido así hasta hace unas horas no se habría resuelto el problema. El hecho es que yo empecé a tener fallos a las 11am de ayer y a las 13.00 ya funcionaba bien.
k cabron mientra enviava un gran decumento lo perdiy lo tuve k repeti las 100 paginas k llevava de esta se acuerda!!!!! grrrrrrr
aleeee!!!!!!
¿Así es como piensan convencer a las empresas para que se pasen a google apps?
Ha sido una caída muy breve pero suficientemente larga para ver que para Google dar información a sus clientes equivale a meter una nota en su blog al día siguiente.
Esto de la nube veremos si no acaba siendo más bien humo.
esta se la paso porque no me afectó directamente, en el tiempo que permanecio caído no lo utilicé