301 meneos

Apagón de GMAIL: disculpas y explicaciones de qué pasó [ENG]

Explicación oficial del apagón en GMAIL del martes 24 de Febrero. El problema surgió cuando se mantenían tareas de mantenimiento en uno de los centros de Google en Europa...

negativos: 4   usuarios: 160   anónimos: 141  
compartir:  twitter  facebook  tuenti  
  1. #1   Lots of folks are asking what happened, so we thought you'd like an explanation. This morning, there was a routine maintenance event in one of our European data centers. This typically causes no disruption because accounts are simply served out of another data center.
    Claro , la culpa de Europa :-P
    31  votos: 1   link
    el 25-02-2009 13:13 UTC por splinter splinter
  2. #3   #2 si hubiera sido así hasta hace unas horas no se habría resuelto el problema. El hecho es que yo empecé a tener fallos a las 11am de ayer y a las 13.00 ya funcionaba bien.
    6  votos: 0   link
    el 25-02-2009 13:45 UTC por avraham01 avraham01
  3. #5   Traduzco lo esencial, la parte en que dan realmente explicaciones, por si a alguien le sirve.

    Esta mañana teníamos una operación rutinaria de mantenimiento en uno de nuestros centros de datos europeos. Esto normalmente no causa ningún transtorno, porque simplemente las cuentas se sirven desde otro centro de datos.

    Inesperados efectos colaterales de unos códigos nuevos que tratan de mantener los datos geográficos más cerca del usuario provocaron la sobrecarga de otro de los centros de datos de Europa, y eso provocó problemas en cascada de un centro de datos a otro. Nos llevó alrededor de una hora recuperar el control sobre todos ellos.

    Los bugs han sido encontrados y reparados, y estamos en el proceso de impulsar unos cambios. Sabemos lo dañino que puede ser un apagón como este (nosotros corremos Google en Gmail, así que apagones como este nos afectan del mismo modo que a vosotros). Siempre investigamos las causas de origen de apagones como este, de modo que podamos prevenir problemas similares en el futuro.
    168  votos: 20   link
    el 25-02-2009 15:25 UTC por Alecto Alecto
  4. #6   La he liao parda mode xD
    78  votos: 8   link
    el 25-02-2009 15:47 UTC por --92745-- --92745--
  5. #7   ¿Cual era el boton que no tenía que tocar?
    16  votos: 1   link
    el 25-02-2009 16:09 UTC por Kaphax Kaphax
  6. #10   "se mantenían tareas de mantenimiento..."

    y el mantenedor que las mantenga, buen mantenedor será :-D

    #0 "se llevaban a cabo", "se realizaban", "tenían lugar", "se efectuaban"...
    64  votos: 6   link
    el 25-02-2009 16:50 UTC por JanSmite JanSmite
  7. #11   #2: ¿por qué no pones la frase completa y la siguiente?

    "Durante dos horas y media empezando a las 1.30 hora del Pacífico (donde está la sede de Google, añado yo), mientras muchos de nuestros usuarios en EEUU dormían, mucha gente no pudo acceder a su correo. Gran cantidad de usuarios por todo el mundo que dependen de Gmail fueron interrumpidos en sus horas de actividad y trabajo, y lo sentimos".

    La verdad, a veces el antiamericanismo roza el ridículo. Más aún cuando este problema parece que viene de un intento de descentralizar.
    55  votos: 5   link
    el 25-02-2009 16:51 UTC por krollspell krollspell
  8. #13   Yo me cague, pensaba que era un golpe de estado mundial de google. Vamos, un 24F xD
    6  votos: 0   link
    el 25-02-2009 17:01 UTC por Apatikorl Apatikorl
  9. #14   Claro, asi que la culpa es de los de testing, no? por no encontrar el bug antes de llevarlo a produccion >:-( [/tester]
    10  votos: 0   link
    el 25-02-2009 17:03 UTC por flekyboy flekyboy
  10. #15   esta se la paso porque no me afectó directamente, en el tiempo que permanecio caído no lo utilicé
    -2  votos: 1   link
    el 25-02-2009 17:07 UTC por flashinghurt flashinghurt
  11. #16   Disculpas aceptadisimas, vamos, al menos te cuentan lo que pasa. No es como lo típico de "¿a ti te va el messenger?" que nunca sabias que habia pasado xD
    6  votos: 0   link
    el 25-02-2009 17:14 UTC por king_of_losers king_of_losers
  12. #18   ¿Así es como piensan convencer a las empresas para que se pasen a google apps?
    Ha sido una caída muy breve pero suficientemente larga para ver que para Google dar información a sus clientes equivale a meter una nota en su blog al día siguiente.
    Esto de la nube veremos si no acaba siendo más bien humo.
    -1  votos: 1   link
    el 25-02-2009 17:25 UTC por quicksort quicksort
  13. #19   k cabron mientra enviava un gran decumento lo perdiy lo tuve k repeti las 100 paginas k llevava de esta se acuerda!!!!! grrrrrrr

    aleeee!!!!!!
    -1  votos: 1   link
    el 25-02-2009 17:36 UTC por oskar145 oskar145
  14. #20   #19 Si el documento lo habías redactado tu, creo que el problema fué que el corrector ortográfico de google, se cepillo los recursos de todos sus centros de datos en corregirlo ... ;)
    28  votos: 2   link
    el 25-02-2009 17:39 UTC por Thyng Thyng
  15. #21   Os habeis fijado pero, la de problemas que están teniendo desde que hicieron regulación del personal... se estan quemando ahora.. :-/
    12  votos: 1   link
    el 25-02-2009 17:41 UTC por mr_apr mr_apr
  16. #22   #6 eso me recordo el status en twitter que mando un excompañero de trabajo, me parecio bastante gracioso -> twitter.com/polecito/status/1244589052
    9  votos: 0   link
    el 25-02-2009 17:46 UTC por Markcial Markcial
  17. #23   #20 si puede ser pero son unos hijos de.............. y no molaaaa:D
    6  votos: 0   link
    el 25-02-2009 17:53 UTC por oskar145 oskar145
  18. #24   ¿Esta vez sí se podrá decir? "Ha sido un fallo informático"

    (¿O será culpa del becario de turno?) :-D
    11  votos: 0   link
    el 25-02-2009 17:53 UTC por michaelknight michaelknight
  19. #25   Categoria "Caidas de google" ya!
    7  votos: 0   link
    el 25-02-2009 18:02 UTC por jorgerubira jorgerubira
  20. #26   ¿Acacio Cruz? No me esperaba ese nombre del Gmail Site Reliability Manager

    ¡Y nada contra los Acacios, eh!
    6  votos: 0   link
    el 25-02-2009 19:36 UTC por --58812-- --58812--
  21. #27   Esto acerca Gmail a Hotmail
    8  votos: 0   link
    el 25-02-2009 21:35 UTC por Mastin_zgz Mastin_zgz
  22. #28   Lo siento, pero no me lo creo, los detalles que da google en el blog, son poco menos que insignificantes, no hay nada tecnico en ellos que me haga creerme su explicacion.

    1 Al principio del apagon cuando intentabas entrar se producia en time up
    2 El ping respondia puesto que los servidores de google estan puestos en balanceo de carga
    3 Si realizabas un telnet al puerto smpt de gmail esta respondia perfectamente con el hello
    4 Los protocolos pop3 y imap funcionaban perfectamente puesto que muchos usuarios pudieron descargar sus correoss por ellos.
    5 El problema estaba en el "front end" de la aplicacion web, el cual no estaba caido porque respondia perfectamente a solicitudes get y post

    Lo siento llamarme paranoico pero me inclino a que el problema es que recibio un ataque DOS distribuido, y si buscais por la red vereis que no soi el unico que piensa en ello.
    6  votos: 0   link
    el 25-02-2009 23:02 UTC por --41062-- --41062--
  23. #29   #28 No entiendo la mitad de lo que escribes, pero entiendo que en cierto modo era un DDOS provocado por el propio sistema; si tienes dos datacenters en Europa, y desconectas uno, y en vez de repartir el tráfico al resto del mundo, envías todo el tráfico al otro datacenter de Europa (por el algoritmo ese de enviarlo al más cercano) tendría toda la pinta de un DDOS sobre ese datacenter. (Y todo respondería a las peticiones, pero no respondería el datacenter sobrecargado; que creo son los síntomas que describes.)
    15  votos: 0   link
    el 26-02-2009 01:33 UTC por natrix natrix
  24. #30   #28, claro que recibió un DDOS, pero de los propios usuarios.
    En este caso no es necesario buscar hadas en el bosque.

    Según indica #5, entiendo, que los datos geográficos servían para aproximar el tráfico al datacenter más cercano. Si el algoritmo fallaba y daba siempre el mismo datacenter, pues DDOS al canto.
    6  votos: 0   link
    el 26-02-2009 08:10 UTC por joffer joffer
  25. #31   #28 Cuidado ¡te vigilan! El canal ya no es seguro
    6  votos: 0   link
    el 26-02-2009 11:28 UTC por colecciono.negativos colecciono.negativos
comentarios cerrados

menéame