Blue Screen of Death

Wie Microsoft den großen Ausfall von CrowdStrike behebt

Microsoft engineers monitoring CrowdStrike outage response.

Microsoft steht vor einem großen Vorfall: Die CrowdStrike-Ausfallursache erklärt

In einer schockierenden Wendung der Ereignisse am frühen Freitagmorgen sah sich CrowdStrike mit einer Flut von Crash-Berichten konfrontiert, als Ingenieure bei Microsoft das Ausmaß der Situation erkannten. Millionen von Windows-Maschinen erlebten das, was als berüchtigter Blue Screen of Death (BSOD) bekannt ist, und störten kritische Server und PCs weltweit.

Das Ausmaß des Vorfalls verstehen

Microsoft kategorisierte den Vorfall sofort als „Schweregrad null“, intern als sev0 bezeichnet. Diese Bezeichnung ist die dringendste Klassifizierung für Vorfälle, die Microsoft-Produkte oder -Dienste betreffen. Sev0-Vorfälle sind äußerst selten und führen zur Benachrichtigung der Bereitschaftstechniker und sofortigen Maßnahmen zur Behebung des Problems, oft mitten in der Nacht.

Die Rolle von CrowdStrike

Die Komplexität der Situation wurde durch die Beteiligung von CrowdStrike, einer Drittanbieter-Cybersecurity-Firma, weiter erhöht. Am 19. Juli um 0:09 Uhr ET führte ein von CrowdStrike veröffentlichtes Update versehentlich zur Trennung von etwa 8,5 Millionen PCs vom Netzwerk. Während der Fehler nicht von Microsoft selbst ausging, entwickelte er sich schnell zu einem erheblichen Problem für den Technologieriesen.

Auswirkungen auf Microsoft und seine Kunden

Dieser Vorfall betraf insbesondere das, was Microsoft als „pri0-Kunden“ identifiziert, zu denen große Organisationen mit kritischer Infrastruktur gehören, die stark auf einen unterbrechungsfreien Service angewiesen sind. Unternehmen mit essentiellen Operationen standen unter Druck, die Folgen dieses unerwarteten Ausfalls zu bewältigen.

Die Antwort: Zusammenarbeit und Kommunikation

Angesichts der schwerwiegenden Konsequenzen des Ausfalls sah sich Microsoft gezwungen, eine ständige Kommunikation mit den CrowdStrike-Ingenieuren aufrechtzuerhalten. Die Dringlichkeit der Situation erforderte eine Zusammenarbeit über mehrere Plattformen hinweg, einschließlich der Kontaktaufnahme mit Cloud-Rivalen wie Amazon und Google.

Die Folgen

Während sich der Staub über dieses unerwartete Ereignis legt, sehen sich sowohl CrowdStrike als auch Microsoft der Herausforderung gegenüber, den normalen Betrieb wiederherzustellen und gleichzeitig die Ursachen und Auswirkungen eines so weitreichenden Fehlers zu bewerten.

Wichtige Erkenntnisse

  • Der Vorfall hebt die Verwundbarkeit vernetzter Systeme hervor, bei denen Drittanbieter-Updates zu massiven Störungen führen können.
  • Eine effektive Kommunikation und eine Zusammenarbeit zwischen Unternehmen sind während kritischer Ausfälle unerlässlich.
  • Das Verständnis der Klassifizierung von Vorfällen wie sev0 ist entscheidend, um die Dringlichkeit in der Verwaltung von Technologievorfällen zu erkennen.

Fazit

Obwohl das Update von CrowdStrike der Katalysator für den Ausfall war, dient der Vorfall als Lerngelegenheit für beide Unternehmen und betont die Bedeutung robuster Test- und Kommunikationsprotokolle, um ähnliche Situationen in der Zukunft zu vermeiden.

Weiterlesen

Joseph Lombardi, Team Canada analyst, drone spying controversy
Joseph Lombardi, Team Canada analyst, drone spying controversy

Hinterlasse einen Kommentar

Alle Kommentare werden vor der Veröffentlichung geprüft.

Diese Website ist durch hCaptcha geschützt und es gelten die allgemeinen Geschäftsbedingungen und Datenschutzbestimmungen von hCaptcha.