Le 15 mars quand nous avons pris conscience du problème, nous étions censés être capables de faire face à 3 ou 4 fois la charge de pointe, nous avons donc adopté une vision raisonnablement détendue du dimanche.
Mais ceci était une erreur. Les demandes de renseignements adressées à vos magasins ont explosé jusqu’à 20 fois !
Ce week-end nous avons pu traiter avec succès de nombreuses transactions.
Heureusement, “l’internet” a un peu ralenti l’accès à nos serveurs en raison d’une surcharge générale.
Néanmoins, plus de trafic ne signifie pas forcément plus de transactions (c’est-à-dire des actions dont vous et nous bénéficions). En moyenne, le doublement du nombre de transactions alourdit la charge des systèmes d’environ 3,5 fois.
En tant que machinistes dans la salle des machines, nous avons redémarré des serveurs 24 heures sur 24, nous les avons renouvelés et renforcés, et nous avons été surpris par les goulots d’étranglement qui se manifestaient constamment (ligne trop petite, mémoire RAM épuisée, disques durs pleins, trop de connexions à tel ou tel service, blocages des serveurs de messagerie dus à un trafic important, budget épuisé chez tel ou tel fournisseur de services…), erreurs intéressantes qui ne se produisent que sous une forte charge.
Dans le jours suivants, nous voulions rendre l’ensemble du système “élastique”, c’est-à-dire de pouvoir mettre en marche des ressources suffisantes à sécurité intégrée (puissance de calcul, mémoire, capacité du réseau) en fonction des besoins. Malheureusement, cela ne peut pas être réalisé simplement par “plus d’ordinateurs”, les demandes entrantes doivent être distribuées, les sessions doivent être gérées et les caches partagés (stockage intermédiaire) doivent être efficaces et rapides. Vos systèmes de gestion (PCG) doivent également avoir un accès rapide aux données.
Cet objectif est désormais achevé. Bien que nous (et nos collègues du centre de traitement des données) puissions contrôler la charge juste après le week-end, nous avons fait quelques erreurs ici et là en raison du grand nombre de correspondances, ce qui a entraîné des annulations de commandes sporadiques, des problèmes de connexion du PCG ou des images manquantes. Merci de votre patience ! Actuellement, le système fonctionne de manière très stable depuis quelques semaines, quelle que soit la charge totale. Nous avons vu près de 2000 transactions par heure avec des boutiques très rapides.
Nous sommes maintenant en train d’organiser les nouvelles idées qui ont émergé pendant cette période intensive – pas seulement les idées de la salle des machines, mais surtout les demandes de vos utilisateurs pour une meilleure gestion des nouveaux clients et des tournées. Les premières fonctionnalités, comme les listes d’attente spécifiques à chaque tournée, sont en cours et ont été mises en ligne après Pâques.