(note de service) A propos de la panne de Presse-citron hier

Hier fut une journée éprouvante, que tout éditeur de site ou webmaster redoute de vivre un jour : vous l’avez certainement constaté, Presse-citron a été inaccessible pendant douze heures, de 7 heures à 19 heures, soit les meilleures heures en terme de trafic. Le site avait déjà connu quelques problèmes de jeunesse (ou de croissance,

Hier fut une journée éprouvante, que tout éditeur de site ou webmaster redoute de vivre un jour : vous l’avez certainement constaté, Presse-citron a été inaccessible pendant douze heures, de 7 heures à 19 heures, soit les meilleures heures en terme de trafic.

panne voiture

Le site avait déjà connu quelques problèmes de jeunesse (ou de croissance, c’est pareil) il y a deux ou trois ans quand le trafic grimpait régulièrement et dépassait les capacités du serveur, mais tout était rentré dans l’ordre avec un nouveau serveur dédié et suffisamment puissant, géré par un prestataire expérimenté, sérieux et avec lequel nous entretenons une relation de confiance : Cognix Systems.

L’origine de la panne d’hier a été longue a identifier car le soupçon d’un hack de WordPress (ou d’un plugin ayant servi de porte d’entrée), puis l’éventualité d’une attaque (pas impossible dans l’ambiance un peu bizarre de cyber-tension qui règne actuellement, quelque soit l’origine) sont venus brouiller les pistes. Finalement il n’en n’a rien été de tout cela, et c’est bien une bonne vieille panne matérielle à l’ancienne qui a planté le site pendant ces heures interminables : une défaillance d’un des composants de la carte raid, et des soucis avec le CPU que les techniciens de l’infogérance ont mis un peu de temp a identifier, car en nominal (sans Presse-citron) le serveur semblait stable et le premier check hardware ne donnait aucune defaillance. Le traffic de presse citron générait le problème, et nous ne pouvions constater que les symptômes : plantage du serveur en quelques minutes.

Le site a été provisoirement déplacé sur un autre serveur, un peu moins performant, le temps d’installer et monter une nouvelle machine dédiée, ce qui sera fait dans les prochains jours.

En attendant, le site est donc un peu lent, mais tout devrait revenir à la normale d’ici quelques jours, quand le site aura été migré sur son nouveau serveur.

Je vous devais ces quelques explications en remerciement de votre patience et de votre fidélité. Pour la petite histoire, on dirait qu’une partie du trafic perdu dans la journée a été rattrapé entre 19 heures et minuit, puisque malgré une panne aux heures les plus fréquentées, nous n’avons perdu qu’un peu plus de 50% de visiteurs sur toute la journée d’hier 🙂

(image : ‘Given up hope – Fickr CC)


Nos dernières vidéos

25 commentaires

  1. Je compatis c’est l’horreur ce genre de chose, comme si la boutique prenait feu. J’ai eu un jour une panne de cluster, 3 serveurs en rade pendant 24h et c’est la panique.

    Juste pour info, peux tu nous dire sur quel(s) serveur(s) tes sites tournent ? Je ne demande pas le prix, mais la puissance hardware si cela ne te dérange pas.

    Cordialement

  2. Pour éviter ça on a inventé la réplication et l’ip-failover… Aujourd’hui ça ne coute pas cher d’avoir 1 serveur un plus en cas de panne du serveur de prod…

  3. Serveur Virtual = Virtualisation = Découpage d’un serveur physique en plusieurs « serveurs virtuel ». En gros avec un serveur physique tu découpe tes ressources machines en plusieurs serveurs virtuel comme si c’était des « vrais serveurs ».

    Vulgairement, une évolution d’un hébergement mutualisé… Donc même avec la définition son commentaire n’a pas vraiment de sens, il est toujours préférable d’avoir une architecture dédié quand on atteint un certain niveau de besoin.

  4. Mmmhhhh surement un coup des Anonymous ! 😀

    Non mais je compati, j’ai fait planté le wordpress de mon boulot aujourd’hui après une MAJ d’un plug-in…

    Le grop flip ce genre de truc, même si on a pas vraiment beaucoup de visites.

  5. Sauf que là Steuf tu parles du niveau le plus basique de la virtualisation (= découpage d’un serveur physique en plusieurs « serveurs virtuels »).

    Elle (la virtu) peut aller beaucoup plus loin ! En l’occurrence ici re-déployer le site entier sur une autre machine en quelques minutes, puis isoler/traiter le problème sur la machine d’origine, pour ensuite faire le trajet inverse…Beaucoup moins évident avec un dédié 🙂

  6. @Jeb, ou même déplacer la machine sur un serveur distant tout en laissant les data sur la même baie de disque, du coup 0 downtime.

    La virtualisation c’est magique, c’est l’abstraction quasi-totale du hardware, ce n’est pas juste de la mutualisation.

  7. Pour info, depuis la panne d’hier je n’arrive plus à atteindre la home de PS. Invariablement je suis renvoyé sur http://www.presse-citron.net/index.html qui me dit: « Vous vous êtes perdu! ».
    Il semblerait que ce soit dû à Firefox (10.0 et avant ça 9.qqchose) qui n’apprécierait pas certaines déclaration de cache sur la page en question mais en attendant, je ne sais pas faire pour retrouver la home de PS.
    Je suis seul dans ce cas ou d’autres subissent la même chose?

  8. Effectivement dans ce genre de cas la virtualisation aurait pu débloquer la situation bine plus rapidement … Après pour les questions de puissance tout est modulable en fonction de tes hosts.

  9. @Jeb Oui je parlais de la version simplifiée 😉 Perso je suis pour avoir la main sur l’ensemble de mes machines de façon physique et de faire de la réplication etc.

  10. Bon courage à vous, merci pour tout ce que vous faites, super blog !
    ( Désolé du commentaire lèche botte, mais je suis régulièrement presse citron depuis voilà pas mal de temps maintenant ;P )

  11. C’est le moment de faire un fail-over comme dit précédemment.
    c’est sur que tout géré sur un seul dédié est assez risqué, il faut mieux en avoir plusieurs ^^

    Une autre solution à la mode, c’est le cloud 😀

  12. C’est horrible comme situation, surtout quand on ignore d’où vient la panne.
    Bon courage à Presse-Citron c’est un excellent site que je prends plaisir à parcourir

  13. Pingback: (note de service) A propos de la panne de Presse-citron hier | VADS Secrétaire indépendante | Scoop.it

  14. Je suis d’accord avec Jeb, pour un hebergement optimum, deux serveurs virtuels en fail over sur deux serveurs physiques différents apportent une sécurité indeniable. De plus l’aventage des serveurs virtuels est qu’on peut les faire evoluer sans interruption de service.

  15. Pingback: Comment installer Wordpress en français | Wordpress Tuto Video

Répondre