Blue Screen of Death

Microsoft'in CrowdStrike'ın Büyük Arızasını Nasıl Çözdüğü

Microsoft engineers monitoring CrowdStrike outage response.

Microsoft Büyük Bir Olayla Karşı Karşıya: CrowdStrike Kesintisi Açıklaması

Cuma sabahı yaşanan bir olayda, CrowdStrike, mühendislerin durumun ciddiyetini fark etmesiyle birlikte çöküş raporlarıyla inundasyona uğradı. Milyonlarca Windows makinesi, kritik sunucuları ve PC'leri dünya genelinde rahatsız eden meşhur Mavi Ekran Hatası (BSOD) yaşıyordu.

Olayın Ciddiyetini Anlamak

Microsoft, olayı hemen “sıfır ciddiyet” olarak sınıflandırdı, içsel olarak sev0 olarak adlandırıldı. Bu atama, Microsoft ürünlerini veya hizmetlerini etkileyen olaylar için en acil sınıflandırmadır. Sev0 olayları son derece nadirdir ve acil olarak çağrılan mühendislerin bilgilendirilmesini ve genellikle gece yarısı müdahale edilmesini gerektirir.

CrowdStrike’ın Rolü

Durumun karmaşıklığı, üçüncü taraf siber güvenlik firması CrowdStrike’ın dahil olmasıyla daha da arttı. 19 Temmuz'da saat 12:09 AM ET’de, CrowdStrike tarafından yayınlanan bir güncelleme, yaklaşık 8,5 milyon bilgisayarın ağdan bağlantısının kesilmesine neden oldu. Hata Microsoft’tan kaynaklanmasa da, bu durum teknoloji devi için büyük bir sorun haline geldi.

Microsoft ve Müşterileri Üzerindeki Etkisi

Bu olay, Microsoft’un “pri0 müşterileri” olarak adlandırdığı, sürekli hizmete büyük ölçüde bağımlı kritik altyapıya sahip büyük organizasyonları özellikle etkiledi. Önemli operasyonlara sahip şirketler, bu beklenmedik kesintinin sonuçlarını ele almak için çırpınmak zorunda kaldı.

Cevap: İşbirliği ve İletişim

Kesintinin ciddi sonuçları ışığında, Microsoft, CrowdStrike mühendisleriyle sürekli iletişim kurmak zorunda kaldı. Durumun aciliyeti, Amazon ve Google gibi bulut rakiplerine ulaşım da dahil olmak üzere birçok platformda işbirliğini gerektirdi.

Sonrası

Bu beklenmedik olayın ardından, hem CrowdStrike hem de Microsoft normal operasyonları geri kazandırma ve böyle geniş bir başarısızlığın nedenleri ile sonuçlarını değerlendirme zorluğuyla karşı karşıya.

Önemli Noktalar

  • Olay, üçüncü taraf güncellemelerinin büyük ölçekte operasyonları kesintiye uğratabildiği birbirine bağlı sistemlerin kırılganlığını vurgulamaktadır.
  • Acil kesintiler sırasında etkili iletişim ve şirketler arası işbirliği hayati öneme sahiptir.
  • Sev0 gibi olayların sınıflandırmasını anlamak, teknoloji olayı yönetiminde gereken aciliyeti tanımak için önemlidir.

Sonuç

CrowdStrike’ın güncellemesi kesintinin tetikleyicisi olsa da, bu olay her iki firma için de benzer durumların önüne geçmek için sağlam test ve iletişim protokollerinin önemini vurgulayan bir öğrenme fırsatı sunmaktadır.

Sonraki gönderi

Joseph Lombardi, Team Canada analyst, drone spying controversy
Joseph Lombardi, Team Canada analyst, drone spying controversy

Yorum yazın

Tüm yorumlar yayınlanmadan önce incelenir.

Bu site hCaptcha ile korunuyor. Ayrıca bu site için hCaptcha Gizlilik Politikası ve Hizmet Şartları geçerlidir.