Microsoft enfrenta un incidente importante: La interrupción de CrowdStrike explicada
En un giro sorprendente de los acontecimientos temprano el viernes por la mañana, CrowdStrike se vio inundada con informes de fallos mientras los ingenieros de Microsoft se dieron cuenta de la gravedad de la situación. Millones de máquinas con Windows estaban experimentando lo que se conoce como la notoria Pantalla Azul de la Muerte (BSOD), interrumpiendo servidores y PCs críticos a nivel mundial.
Entendiendo la gravedad del incidente
Microsoft clasificó rápidamente el incidente como de "gravedad cero", referido internamente como sev0. Esta designación es la clasificación más urgente para incidentes que afectan productos o servicios de Microsoft. Los incidentes sev0 son extremadamente raros, lo que lleva a la notificación de ingenieros de guardia y a la acción inmediata para abordar el problema, a menudo en medio de la noche.
El papel de CrowdStrike
La complejidad de la situación se vio aún más aumentada por la participación de CrowdStrike, una firma de ciberseguridad de terceros. El 19 de julio a las 12:09 AM ET, una actualización publicada por CrowdStrike llevó inadvertidamente a la desconexión de aproximadamente 8.5 millones de PCs de la red. Si bien el error no se originó en Microsoft, rápidamente se convirtió en un problema significativo para el gigante tecnológico.
Impacto en Microsoft y sus clientes
Este incidente afectó particularmente a lo que Microsoft identifica como sus “clientes pri0”, que incluyen grandes organizaciones con infraestructura crítica que dependen en gran medida de un servicio ininterrumpido. Las empresas con operaciones esenciales se encontraron luchando para abordar las repercusiones de esta interrupción inesperada.
La respuesta: Colaboración y comunicación
A la luz de las graves repercusiones de la interrupción, Microsoft se vio obligada a mantener una comunicación constante con los ingenieros de CrowdStrike. La urgencia de la situación requirió colaboración a través de múltiples plataformas, incluyendo el contacto con competidores en la nube como Amazon y Google.
Las secuelas
A medida que se asienta la polvareda de este evento inesperado, tanto CrowdStrike como Microsoft enfrentan el desafío de restaurar las operaciones normales mientras evalúan las causas y las implicaciones de un fallo tan generalizado.
Conclusiones clave
- El incidente destaca la vulnerabilidad de los sistemas interconectados, donde las actualizaciones de terceros pueden interrumpir las operaciones a gran escala.
- Una comunicación efectiva y colaboración entre empresas son esenciales durante interrupciones críticas.
- Entender la clasificación de incidentes como sev0 es vital para reconocer la urgencia requerida en la gestión de incidentes tecnológicos.
Conclusión
Aunque la actualización de CrowdStrike fue el catalizador de la interrupción, el incidente sirve como una oportunidad de aprendizaje para ambas empresas, enfatizando la importancia de pruebas robustas y protocolos de comunicación para evitar situaciones similares en el futuro.
Dejar un comentario
Todos los comentarios se revisan antes de su publicación.
Este sitio está protegido por hCaptcha y se aplican la Política de privacidad de hCaptcha y los Términos del servicio.