Blue Screen of Death

Come Microsoft ha risolto il grave outage di CrowdStrike

Microsoft engineers monitoring CrowdStrike outage response.

Microsoft affronta un incidente importante: spiegato il blackout di CrowdStrike

In un sorprendente colpo di scena nella mattinata di venerdì, CrowdStrike si è trovata sommersa da rapporti di crash mentre gli ingegneri di Microsoft si rendevano conto della gravità della situazione. Milioni di macchine Windows stavano subendo quello che è noto come il famigerato Blue Screen of Death (BSOD), interrompendo server critici e PC in tutto il mondo.

Comprendere la gravità dell'incidente

Microsoft ha prontamente classificato l'incidente come "gravità zero", internamente denominato sev0. Questa designazione è la classificazione più urgente per gli incidenti che colpiscono i prodotti o i servizi Microsoft. Gli incidenti sev0 sono estremamente rari, richiedendo la notifica degli ingegneri di guardia e un'azione immediata per affrontare il problema, spesso nel cuore della notte.

Il ruolo di CrowdStrike

La complessità della situazione è stata ulteriormente aumentata dal coinvolgimento di CrowdStrike, una società di cybersecurity di terze parti. Il 19 luglio alle 12:09 AM ET, un aggiornamento rilasciato da CrowdStrike ha involontariamente portato alla disconnessione di circa 8,5 milioni di PC dalla rete. Sebbene l'errore non sia originato da Microsoft stessa, è rapidamente diventato un problema significativo per il gigante tecnologico.

Impatto su Microsoft e i suoi clienti

Questo incidente ha colpito particolarmente ciò che Microsoft identifica come i suoi "clienti pri0", che includono grandi organizzazioni con infrastrutture critiche che si affidano pesantemente a un servizio ininterrotto. Le aziende con operazioni essenziali si sono trovate a dover affrontare le conseguenze di questo blackout inaspettato.

La risposta: collaborazione e comunicazione

Alla luce delle gravi ripercussioni del blackout, Microsoft è stata costretta a mantenere una comunicazione costante con gli ingegneri di CrowdStrike. L'urgenza della situazione ha reso necessaria la collaborazione su più piattaforme, incluso il contatto con rivali cloud come Amazon e Google.

Le conseguenze

Con il passare del tempo dopo questo evento inatteso, sia CrowdStrike che Microsoft si trovano di fronte alla sfida di ripristinare le normali operazioni mentre valutano le cause e le implicazioni di un fallimento così diffuso.

In sintesi

  • L'incidente sottolinea la vulnerabilità dei sistemi interconnessi, dove gli aggiornamenti di terze parti possono interrompere le operazioni su larga scala.
  • Una comunicazione efficace e una collaborazione tra aziende sono essenziali durante le interruzioni critiche.
  • Comprendere la classificazione degli incidenti come sev0 è fondamentale per riconoscere l'urgenza necessaria nella gestione degli incidenti tecnologici.

Conclusione

Anche se l'aggiornamento di CrowdStrike è stato il catalizzatore per il blackout, l'incidente rappresenta un'opportunità di apprendimento per entrambe le aziende, sottolineando l'importanza di protocolli di test e comunicazione solidi per evitare situazioni simili in futuro.

Scopri di più

Joseph Lombardi, Team Canada analyst, drone spying controversy
Joseph Lombardi, Team Canada analyst, drone spying controversy

Commenta

Nota che i commenti devono essere approvati prima di essere pubblicati.

Questo sito è protetto da hCaptcha e applica le Norme sulla privacy e i Termini di servizio di hCaptcha.