Comment Azure gère sa communication de crise en cas de panne

Spread the love
Comment Azure gère sa communication de crise en cas de panne

Les pannes peuvent être particulièrement préjudiciables pour les services de Cloud computing. Microsoft ne le sait que trop bien et a élaboré depuis de nombreux mois un plan sophistiqué pour éviter ce genre de désagrément sur son service maison Azure. Microsoft utilise de moins en moins sa page d’état Azure pour informer les utilisateurs des pannes de son service Cloud.

En mars dernier, lorsque l’une des régions les plus actives de Microsoft, l’Est des États-Unis, a été touchée pendant des heures, il n’y avait rien sur la page d’état – et très peu de protestations sur Twitter. Il s’avère que ce calme relatif est voulu. Microsoft s’efforce depuis quelques temps d’amener ses utilisateurs d’Azure à faire état de pannes éventuelles du service Cloud sur ses personnalisées de Service Health, plutôt que sur la plateforme Azure Status, destiné au grand public.

Le compte Azure Support sur Twitter tente de guider les utilisateurs pour qu’ils consultent ces pages et/ou pour qu’ils envoient un message à ce compte lorsqu’ils ont besoin des informations les plus récentes sur une panne. Dans un billet de blog publié cette semaine, Sami Kubba, un des principaux responsables du programme supervisant le processus de communication d’Azure en cas de panne, a décrit la situation de Microsoft et ses objectifs en matière de communication de crise en cas de panne.

publicité

Eviter un déluge de plaintes sur la toile

Pour ce dernier, l’objectif de Microsoft est de notifier tous les abonnements Azure concernés dans les 15 minutes suivant une panne. Microsoft utilise des êtres humains, plus des notifications automatiques pour ce faire. Et de relever que les notifications automatiques via Service Health étaient responsables de plus de la moitié des communications de Microsoft concernant les pannes au cours du dernier trimestre.

“Nous en sommes également aux premières étapes de l’extension de notre utilisation des opérations basées sur l’IA pour identifier automatiquement les services concernés et, après atténuation, envoyer des communications de résolution (pour les scénarios pris en charge) le plus rapidement possible”, ajoute le responsable. Microsoft utilise actuellement la page publique Azure Status uniquement pour communiquer les pannes “généralisées”, c’est-à-dire celles qui affectent plusieurs régions et/ou plusieurs services, reconnait ce dernier.

Microsoft s’efforce de rendre ce même type de système de notification des pannes cohérent pour ses autres produits de Cloud computing, notamment Microsoft 365 et Power Platform, relève-t-il. D’ores et déjà, les clients de ces services peuvent voir le compte M365 Status sur Twitter, ce qui permet de diriger les utilisateurs vers leurs portails et de leur envoyer des messages en cas de problème.

Source : ZDNet.com

Leave a Reply