Blue Screen of Death

Comment Microsoft a résolu la panne majeure de CrowdStrike

Microsoft engineers monitoring CrowdStrike outage response.

Microsoft fait face à un incident majeur : l'incident de CrowdStrike expliqué

Dans un retournement de situation choquant tôt vendredi matin, CrowdStrike s'est retrouvé inondé de rapports de plantage alors que les ingénieurs de Microsoft réalisaient la gravité de la situation. Des millions de machines Windows connaissaient ce que l'on appelle le tristement célèbre Écran bleu de la mort (BSOD), perturbant des serveurs et des PC critiques à l'échelle mondiale.

Comprendre la gravité de l'incident

Microsoft a rapidement classé l'incident comme ayant une "gravité zéro", désigné en interne par sev0. Cette classification est la plus urgente pour les incidents impactant les produits ou services de Microsoft. Les incidents sev0 sont extrêmement rares, ce qui entraîne une notification des ingénieurs de garde et une action immédiate pour remédier au problème, souvent au milieu de la nuit.

Le rôle de CrowdStrike

La complexité de la situation a été davantage accentuée par l'implication de CrowdStrike, une entreprise de cybersécurité tierce. Le 19 juillet à 00h09 HE, une mise à jour publiée par CrowdStrike a involontairement conduit à la déconnexion d'environ 8,5 millions de PC du réseau. Bien que l'erreur ne soit pas issue de Microsoft lui-même, elle est rapidement devenue un problème majeur pour le géant technologique.

Impact sur Microsoft et ses clients

cet incident a particulièrement touché ce que Microsoft identifie comme ses "clients pri0", qui incluent de grandes organisations dont l'infrastructure critique dépend fortement d'un service ininterrompu. Les entreprises dont les opérations sont essentielles ont été laissées dans le désarroi pour faire face aux répercussions de cette panne inattendue.

La réponse : collaboration et communication

Au vu des graves répercussions de la panne, Microsoft a été contraint de maintenir une communication constante avec les ingénieurs de CrowdStrike. L'urgence de la situation nécessitait une collaboration sur plusieurs plateformes, y compris des contacts avec des rivaux du cloud comme Amazon et Google.

Les conséquences

Alors que la poussière retombe sur cet événement inattendu, tant CrowdStrike que Microsoft sont confrontés au défi de restaurer des opérations normales tout en évaluant les causes et les implications d'un échec aussi répandu.

Points clés à retenir

  • L'incident met en lumière la vulnérabilité des systèmes interconnectés, où les mises à jour tierces peuvent perturber les opérations à grande échelle.
  • Une communication efficace et une collaboration inter-entreprises sont essentielles lors des pannes critiques.
  • Comprendre la classification des incidents comme sev0 est vital pour reconnaître l'urgence requise dans la gestion des incidents technologiques.

Conclusion

Bien que la mise à jour de CrowdStrike ait été le catalyseur de la panne, l'incident permet aux deux entreprises d'apprendre une leçon sur l'importance de protocoles de test robustes et de communication pour éviter des situations similaires à l'avenir.

En lire plus

Joseph Lombardi, Team Canada analyst, drone spying controversy
Joseph Lombardi, Team Canada analyst, drone spying controversy

Laisser un commentaire

Tous les commentaires sont modérés avant d'être publiés.

Ce site est protégé par hCaptcha, et la Politique de confidentialité et les Conditions de service de hCaptcha s’appliquent.