Kategorien
News

Azure Nutzer erhalten für den Ausfall am 29. Februar eine Gutschrift über 33%

Microsoft hat eine detaillierte Analyse veröffentlicht, in der beschrieben wird was genau zu dem weit verbreiteten Ausfall des Azure Cloud-Service am 29. Februar geführt hat.

Wie von Seiten Microsoft bekannt wurde, erhalten alle Azure Nutzer zudem eine Gutschrift über 33% rückwirkend für den ganzen Monat, egal ob sie von dem Ausfall betroffen waren oder nicht.

Der weitreichende Azure Ausfall begann am 28. Februar ca. gegen 21.00 Uhr ET (Eastern Time). Dadurch waren Kunden in Europa, Nordamerika und anderen Regionen durch eine Reihe von aufeinanderfolgenden Problemen im Laufe der folgenden zwei Tagen betroffen. Nutzer berichteten, dass sie nicht in der Lage waren, auf das Azure-Dashboard zuzugreifen, das im Prinzip das einzige Mittel ist, um Statusinformationen über die einzelnen Azure Services zu erhalten. Die Probleme wurden am Morgen (ET) des 1. März weitestgehend behoben.

Der Schaltjahr-Bug verursachte zunächst einen ersten Ausfall, der wiederum zu einem weiteren Ausfall führte. Bill Laing, Chef des Server und Cloud Teams bei Microsoft erläutert den Beginn des Ausfalls so:

“The leap day bug immediately triggered at 4:00PM PST, February 28th (00:00 UST February 29th) when GAs (guest agents) in new VMs tried to generate certificates. Storage clusters were not affected because they don’t run with a GA, but normal application deployment, scale-out and service healing would have resulted in new VM creation. At the same time many clusters were also in the midst of the rollout of a new version of the FC (fabric controller), HA (host agent) and GA.”

Microsoft werde, laut Laing, natürlich aus dem Ausfall lernen und neue Testmethoden einführen, Verbesserungen in der Verfügbarkeit des Dashboard-Service vornehmen sowie weitere Kommunikationskanäle einrichten, um über Ausfälle schneller zu informieren.


Bildquelle: http://blog.otto-office.com