Facebook : une mauvaise configuration à l’origine de la panne

Spread the love
Facebook : une mauvaise configuration à l'origine de la panne

Facebook a attribué sa panne de lundi à un changement de configuration défectueux qui a affecté ses plateformes de réseaux sociaux et ses systèmes internes.

Facebook, ainsi que WhatsApp et Instagram, ont subi une panne mondiale le lundi 4 octobre, qui a commencé en fin d’après midi et s’est prolongée pendant la soirée.

publicité

Les services du géant des réseaux sociaux étaient de nouveau en ligne aux alentours de 23h.

Dans un post de blog, le vice-président de l’infrastructure de Facebook, Santosh Janardhan, a déclaré que la panne avait été causée par un problème technique affectant le système de routage Border Gateway Protocol (BCP). Celui-ci a eu “un effet cascade sur la façon dont nos datacenters communiquent et a entraîné l’arrêt de nos services”.

La panne de lundi a également affecté les outils internes de Facebook, ce qui a rendu le diagnostic et la résolution du problème plus difficiles, a déclaré Janardhan. Selon le New York Times, la panne a rendu les cartes d’accès des ingénieurs inutilisables, ce qui signifie que le personnel ne pouvait pas entrer dans les bâtiments où se trouvaient les serveurs concernés.

“Nos équipes d’ingénieurs ont appris que des changements de configuration sur les routeurs qui coordonnent le trafic réseau entre nos datacenters ont causé des problèmes qui ont interrompu cette communication”, a déclaré Janardhan.

“Nos services sont maintenant de nouveau en ligne et nous travaillons activement à leur retour complet à un fonctionnement normal. Nous tenons à préciser qu’à l’heure actuelle, nous pensons que la cause première de cette panne était un mauvais changement de configuration.”

Le protocole BGP a été conçu à l’origine pour interconnecter les fournisseurs de services Internet du monde entier. Il constitue désormais l’épine dorsale d’internet en matière de routage.

Facebook utilise également BGP comme base pour le routage de ses datacenters. Dans un billet de blog publié en mai 2021, les équipes de Facebook ont expliqué que la conception du routage visait à permettre à l’entreprise de “construire rapidement notre réseau et d’assurer une haute disponibilité de nos services, tout en gardant la conception elle-même évolutive”.

Cependant, les chercheurs notent également que BGP “nécessite un code en lien étroit avec la topologie du datacenter, la configuration, le logiciel de commutation et le pipeline opérationnel à l’échelle du centre de données.” Ironiquement, la configuration de routage du centre de données de Facebook a été conçue spécifiquement pour minimiser l’impact des pannes.

Selon Facebook, aucune donnée utilisateur n’a été compromise lors de la panne de lundi.

Source : “ZDNet.com”

Leave a Reply