Passer au contenu

Google s’explique après la panne web géante de jeudi

Un problème sur Google Cloud a causé une panne géante sur des produits de la firme, mais aussi sur les sites d’autres entreprises qui dépendent des infrastructures de Google.

Le bon fonctionnement du web dépend d’une poignée d’acteurs, dont Google fait partie. Et, jeudi, vers 20h (heure de Paris), un problème au niveau de Google Cloud a causé une panne géante sur des produits et services de Google, mais aussi sur d’autres services et applications populaires qui dépendent des infrastructures de la firme. Dans son rapport d’incident, la firme explique qu’à cause de ce problème, les produits Google Cloud, Google Workspace et Google Security Operations ont renvoyé des erreurs 503 (Service temporairement indisponible ou en maintenance) aux demandes externes des API.

“Nous sommes profondément désolés de l’impact de cette panne. Les clients de Google Cloud et leurs utilisateurs confient leurs activités à Google, et nous ferons mieux. Nous nous excusons pour l’impact que cela a eu non seulement sur les entreprises de nos clients et leurs utilisateurs, mais aussi sur la confiance dans nos systèmes. Nous nous engageons à apporter des améliorations afin d’éviter à l’avenir des pannes de ce type”, écrit la firme dans son rapport.

Dans un mini-rapport publié le 12 juin, Google évoquait les résultats de son enquête préliminaire, qui évoquait une mise à jour automatisée et invalide dans son système de gestion des API, qui a causé le rejet des demandes d’API. Et, dans le rapport complet publié le 13 juin, la firme est encore plus précise. Les détails techniques sont disponibles dans la “source” à la fin de cet article. Mais, en substance, le bug a été provoqué par “des champs vides involontaires” insérés dans des métadonnées qui ont été distribuées à l’échelle mondiale en quelques heures.

Un problème qui a duré des heures

Google indique dans son rapport qu’en 10 minutes, ses ingénieurs ont identifié la cause de cette panne géante. Et un “bouton rouge” pour remédier au problème était prêt en 25 minutes. “Dans les 40 minutes qui ont suivi l’incident, le déploiement du bouton rouge a été achevé et nous avons commencé à observer un rétablissement dans toutes les régions, en commençant par les plus petites”, a indiqué Google.

Cependant, la firme admet que le retour à la normale a été plus difficile dans les régions les plus importantes. Par exemple, il a fallu attendre 2 heures et 40 minutes pour complètement régler le problème sur la région “us-central-1”. En tout cas, Google indique avoir pris de nouvelles mesures pour que cet incident ne se reproduise plus.
Parmi les clients de Google Cloud affecté, il y a Cloudflare, une entreprise américaine dont dépendent de très nombreux acteurs du web pour assurer la sécurité et les performances de leurs sites. Dans un communiqué, celui-ci a indiqué : “Cette panne a duré 2 heures et 28 minutes, et a eu un impact global sur tous les clients de Cloudflare utilisant les services concernés.”

  • Jeudi, une panne géante a affecté des produits Google, mais aussi des sites qui dépendent de Google Cloud
  • Google a déjà présenté ses excuses dans un rapport d’incident, qui explique aussi les origines de ce bug
  • Cloudflare, dont le bon fonctionnement du web dépend, faisait partie des clients Google Cloud affectés

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Opera One - Navigateur web boosté à l’IA
Opera One - Navigateur web boosté à l’IA
Par : Opera