Microsoft engineers monitoring CrowdStrike outage response.

Come Microsoft ha risolto il grave outage di CrowdStrike

25 luglio 2024

Microsoft affronta un incidente importante: spiegato il blackout di CrowdStrike

In un sorprendente colpo di scena nella mattinata di venerdì, CrowdStrike si è trovata sommersa da rapporti di crash mentre gli ingegneri di Microsoft si rendevano conto della gravità della situazione. Milioni di macchine Windows stavano subendo quello che è noto come il famigerato Blue Screen of Death (BSOD), interrompendo server critici e PC in tutto il mondo.

Comprendere la gravità dell'incidente

Microsoft ha prontamente classificato l'incidente come "gravità zero", internamente denominato sev0. Questa designazione è la classificazione più urgente per gli incidenti che colpiscono i prodotti o i servizi Microsoft. Gli incidenti sev0 sono estremamente rari, richiedendo la notifica degli ingegneri di guardia e un'azione immediata per affrontare il problema, spesso nel cuore della notte.

Il ruolo di CrowdStrike

La complessità della situazione è stata ulteriormente aumentata dal coinvolgimento di CrowdStrike, una società di cybersecurity di terze parti. Il 19 luglio alle 12:09 AM ET, un aggiornamento rilasciato da CrowdStrike ha involontariamente portato alla disconnessione di circa 8,5 milioni di PC dalla rete. Sebbene l'errore non sia originato da Microsoft stessa, è rapidamente diventato un problema significativo per il gigante tecnologico.

Impatto su Microsoft e i suoi clienti

Questo incidente ha colpito particolarmente ciò che Microsoft identifica come i suoi "clienti pri0", che includono grandi organizzazioni con infrastrutture critiche che si affidano pesantemente a un servizio ininterrotto. Le aziende con operazioni essenziali si sono trovate a dover affrontare le conseguenze di questo blackout inaspettato.

La risposta: collaborazione e comunicazione

Alla luce delle gravi ripercussioni del blackout, Microsoft è stata costretta a mantenere una comunicazione costante con gli ingegneri di CrowdStrike. L'urgenza della situazione ha reso necessaria la collaborazione su più piattaforme, incluso il contatto con rivali cloud come Amazon e Google.

Le conseguenze

Con il passare del tempo dopo questo evento inatteso, sia CrowdStrike che Microsoft si trovano di fronte alla sfida di ripristinare le normali operazioni mentre valutano le cause e le implicazioni di un fallimento così diffuso.

In sintesi

L'incidente sottolinea la vulnerabilità dei sistemi interconnessi, dove gli aggiornamenti di terze parti possono interrompere le operazioni su larga scala.
Una comunicazione efficace e una collaborazione tra aziende sono essenziali durante le interruzioni critiche.
Comprendere la classificazione degli incidenti come sev0 è fondamentale per riconoscere l'urgenza necessaria nella gestione degli incidenti tecnologici.

Conclusione

Anche se l'aggiornamento di CrowdStrike è stato il catalizzatore per il blackout, l'incidente rappresenta un'opportunità di apprendimento per entrambe le aziende, sottolineando l'importanza di protocolli di test e comunicazione solidi per evitare situazioni simili in futuro.

Torna al blog

Il tuo carrello è vuoto

Il tuo carrello

Totale stimato

Come Microsoft ha risolto il grave outage di CrowdStrike

Microsoft affronta un incidente importante: spiegato il blackout di CrowdStrike

Comprendere la gravità dell'incidente

Il ruolo di CrowdStrike

Impatto su Microsoft e i suoi clienti

La risposta: collaborazione e comunicazione

Le conseguenze

In sintesi

Conclusione

Lascia un commento

Paese/Area geografica

Lingua

Paese/Area geografica

Lingua

Microsoft affronta un incidente importante: spiegato il blackout di CrowdStrike

Comprendere la gravità dell'incidente

Il ruolo di CrowdStrike

Impatto su Microsoft e i suoi clienti

La risposta: collaborazione e comunicazione

Le conseguenze

In sintesi

Conclusione

Lascia un commento

Subscribe to our emails