Virus im Maschinenraum

Ökobox-Online Maschinenraum

Es hat nicht lange gedauert, nach der allgemeinen Bewusstwerdung des Problems am 15. März, bis die ersten Last-Warnungen auf unseren Handies ankamen. Aber hatten wir nicht erst die Kapazitäten erhöht? Wir sollten locker mit der drei- bis vierfachen Spitzenlast klarkommen, also haben wir einigermassen gelassen auf den Sonntag geschaut. 

Aber das war ein Trugschluss. Die Anfragen auf Eure Shops explodierten bis auf das 20-fache!

Transaktion während Corona
Traffic
Transaktionen

Obwohl das Bestellen an diesem Wochenende wirklich keinen Spass machen konnte, haben wir sehr viele Transaktionen erfolgreich abwickeln können. Zum Glück hat „das Internet“ den Zugang zu unseren Servern wegen allgemeiner Überlastung auch etwas gebremst. 

Mehr Traffic bedeutet aber nicht automatisch mehr Transaktionen (also Aktionen, von denen wir und Ihr auch was haben).  Um eine Transaktion zu erreichen, braucht es im Schnitt 400 Abrufe von Objekten (Webseiten, Bildern, Wert am 1.3.20). Wenn sich viele Interessenten oder Neukunden tummeln, die sich erstmal im Angebot schlau machen oder auch umfassender einkaufen, kann es auch mal deutlich mehr sein (z.B. 750 am 18.3.20). Oder anders ausgedrückt: Eine Verdoppelung der Transaktionen bedingt etwa 3.5x soviel Belastung der Systeme.

Als Maschinisten im Maschinenraum haben wir rund um die Uhr Server neu gestartet, ausgetauscht, erweitert und uns über sich ständig neu manifestierende Flaschenhälse gewundert (Leitung zu klein, RAM-Speicher geht aus, Festplatten voll, zu viele Verbindungen zu diesem oder jenem Service, Blockade von Mailservern wegen hohem Traffic, Budget bei diesem und jenem Dienstleister aufgebraucht, interessante Fehler die nur bei hoher Last auftauchen…).

In den Folgetagen haben wir dann viele von den „man müsste das mal so umbauen..“-Ideen, die eigentlich stressarm für das ganze Jahr geplant waren, umgesetzt. Die Grundidee war dabei stets, das Gesamtsystem „elastisch“ zu machen, also je nach Bedarf genügend ausfalltolerante Ressourcen (also Rechenpower, Speicher oder Netzwerk-Kapzität) einzuschalten zu können. Das geht leider nicht einfach durch „mehr Computer“,  die eingehenden Anfragen müssen verteilt, die Sitzungen verwaltet und die gemeinsam verwendeten Caches (Zwischenspeicher) sollen effizient und schnell sein. Auch Eure Backend-Systeme (also der PCG) soll schnellen Zugriff auf die Daten haben. 

Dieses Ziel haben nun erreicht. Zwar bekamen wir (und auch die Kollegen vom Rechenzentrum) die Last bereits gleich nach dem Wochenende in den Griff, bei der Vielzahl der hektischen Umbauten sind uns dabei aber hier und da Fehler unterlaufen, was sich z.B. in sporadischen Bestellabbrüchen, Verbindungsproblemen des PCG oder fehlenden Bildern auswirkte. Danke an dieser Stelle für Eure Geduld! Aktuell läuft das System schon fast zwei Wochen unabhängig von der Gesamtlast sehr stabil. Wir haben am letzten Wochenende fast 2000 Transaktionen pro Stunde gesehen, bei sehr schnellen Shops. 

Auch das allgemeine Besuchsmuster hat sich geändert – die einstigen Spitzenzeiten Abends und insbesondere am Sonntag Abend sind weniger ausgeprägt – es ist eigentlich -ausser von 2 bis 6 Uhr- immer ordentlich was los. Selbst am Samstag, was eigentlich immer der Wartungstag war, weil so wenig los war.

CO2? In der Eile war die Nutzung der Computer etwas ineffizient – so sind wir von einem Wert von 0.3ct/Bestellung zeitweise auf über 0,6ct gerutscht. Jetzt, mit dem „elastischen“ System sieht es so aus als wenn wir den Wert auf 0,25ct/Bestellung drücken können. 

Jetzt sind wir dabei, die in dieser intensiven Zeit entstandenen neuen Ideen zu ordnen – nicht nur Ideen aus dem Maschinenraum, sondern insbesondere auch Wünsche von Euch Anwendern zum besseren Management von Neukunden und Touren sowie dem „onboarding“ im Allgemeinen. Erste Funktionen wie tourspezifische Wartelisten gehen und gingen nach Ostern live.

3 Gedanken zu „Virus im Maschinenraum“

  1. Das ist ein guter Text! Den könnte man ja sogar in Auszügen unsren Kunden drucken! Wnne das auch kaum jemand versteht, denn wer kennt sich in dem Maschinenraum schon aus, dann versteht man doch sofort, dass diese Arbeit kompliziert ist, und für unsere Anwendungen jedes einzelnen wichtig ist. Das kommt gut rüber! Zudem, der runde Anzeiger ÖKOBOX S Online, der is ja genial!

Kommentare sind geschlossen.