fbpx

Wie geht das mit dem Kostenmanagement in der Cloud? Erfahrungen von Pit Kleyersburg mit der Cloud Migration bei kaiserkraft/TAKKT

by Yara El-Sabagh

Exklusiv im #ConfareBlog:
Wie geht das mit dem Kostenmanagement in der Cloud? Erfahrungen von Pit Kleyersburg mit der Cloud Migration bei kaiserkraft/TAKKT

Auf dem wichtigsten IT-Management Treffpunkt der Schweiz, dem Confare Swiss #CIOSUMMIT, hat Pit Kleyersburg, Lead Expert – DevOps bei kaiserkraft/TAKKT über die erfolgreiche Cloud Migration des Traditionsunternehmens berichtet, die man gemeinsam den Cloud Profis der Netlution durchgeführt hat. Er hat dabei sehr offen über Herausforderungen und Risiken, vor allem aber auch über Chancen und Möglichkeiten berichtet.

Für den Confare Blog haben wir nachgefragt: Wie genau geht das denn mit dem Kostenmanagement in der Cloud? Wie verhindert man, dass man Services bezahlt, die man gar nicht mehr braucht? Wie verändert sich die Kostenstruktur der IT. Im Interview plaudert Pit aus dem Nähkästchen.

Next Stop: Confare #CIOSUMMIT Wien – mit mehr als 700 IT-Profis der wichtigste und größte IT-Management Treffpunkt Österreichs. Hier treffen Sie auch die Experten von Nextlution persönlich. Höhepunkt der Veranstaltung ist die Kür der IT-Manager*innen des Jahres – einreichen und nominieren kann man jetzt für den Confare #CIOAWARD hier.

Welche Vorteile siehst Du in der Nutzung von Cloud-Services im Vergleich zur herkömmlichen IT-Infrastruktur in Bezug auf die Gesamtkosten?

Der größte Vorteil, den ich sehe, ist, dass man mit der gleichen Anzahl an Mitarbeitern in der gleichen Zeit mehr wertschaffende Arbeit erbringen kann, wenn man die Services der Cloud effektiv nutzt. Verglichen mit klassischer Infrastruktur kaufe ich mir bei einem Cloud-Anbieter bei Nutzung eines Services nicht nur die eigentliche Ressource, an der ich interessiert bin, ein – beispielsweise eine Datenbank –, sondern auch die vom Cloud-Anbieter entwickelten Automatisierungen, die den Betrieb immens vereinfachen: automatisches Failover, automatische Backups, reduzierter Aufwand für Point-In-Time-Recoveries, et cetera. Ebenso müssen die Hardware und die Rechenzentren in keiner Form verwaltet werden.

Ebenfalls ein großer Vorteil ist, dass man neue Cloud-Services ohne Laufzeit- oder Kostenbindung erproben kann. Das reduziert das Risiko von unnötigen Investitionen in Technologien, die sich nach kurzer Testphase als ineffektiv oder unrentabel herausstellen könnten.

Schließlich ermöglichen Serverless-Angebote der Cloud mit feingranularer Skalierung entsprechend der Last eine exakte nutzungsbasierte Abrechnung, sodass sehr wenig bis keine unnötigen Kosten für ungenutzte Ressourcen entstehen.

Wie geht Ihr mit den Herausforderungen bei der Budgetierung von Cloud-Ausgaben um, insbesondere mit Blick auf die Skalierbarkeit und die Verwaltung der Kosten?Kostenmanagement

Aktuell schätzen wir unsere monatlichen Kosten auf Basis unserer historischen Kosten, kombiniert mit Nutzungsdaten unserer Webshops sowie unserer Umsatzprognose. Diese simple Methode hat uns über mehrere Jahre gut begleitet. Dennoch planen wir für zukünftige Budgets unsere monatlichen Kosten noch stärker in den direkten Vergleich mit unserem Umsatz zu setzen, in Form der Cost-Revenue-Ratio, kurz CRR.

Unser Ziel ist es, an einen Punkt zu kommen, an dem wir einen Teil des Budgets für unsere Cloud-Ausgaben nicht mehr in absoluten Werten festlegen, sondern stattdessen als relativen Anteil des Umsatzes. Hintergrund ist, dass die Skalierung einiger Komponenten unseres Cloud-Plattform Hand-in-Hand mit Umsatzwachstum geht: je mehr Leute unsere Webshops verwenden, desto höher der Umsatz, aber natürlich auch die Last und somit die Kosten. Diese umsatzgebundenen Schwankungen der Kosten möchten wir durch die CRR abbilden.

Wie bei den absoluten Kosten ist es natürlich essenziell, die relativen Kosten im Blick zu behalten und korrigierende Maßnahmen einzuleiten, wenn die CRR sich an ein festgelegtes Limit annähert oder es überschreitet.

Wie hat sich die Personalauslastung in der IT seit der Einführung der Cloud entwickelt? Gibt es eine Verlagerung von Aufgaben und Ressourcen?

Der Vorstoß in die Cloud für kaiserkraft war im Kontext unserer Webshops. Hier erledigen aktuell zwei Mitarbeiter die Arbeit, die bei klassischer Infrastruktur vermutlich eine Teamstärke von vier bis sechs Personen erfordern würde. Historisch hatte das Webshop-Team Unterstützung von dem zentralen Infrastrukturteam von kaiserkraft, sowie einem lokalen Dienstleister. Nach dem Umzug in die Cloud ist das Team vollständig eigenverantwortlich geworden.

Erreicht haben wir das sowohl durch effektive Nutzung der Cloud-Services, aber klar auch durch das Einführen der DevOps-Methode. Unsere zwei DevOps-Mitarbeiter sind direkt im Team mit den Entwicklern der Webshops, sodass das Know-How stark geteilt wird und keine teamübergreifenden Synchronisationen notwendig sind oder Abhängigkeiten existieren.

Die gleiche Entwicklung haben wir auch in anderen Teams verfolgt und unterstützt. Beispielsweise ist unser Data-Warehouse-Team mit ihren Systemen in die Cloud umgezogen und hat dabei die gleichen Vorteile erlebt: sie können ihre Systeme jetzt flexibler verwalten, weil sie selbst zuständig sind, sie erledigen es mit nur zwei Mitarbeitern, weil die Cloud-Services viel Arbeit abnehmen und das zentrale Infrastrukturteam muss nicht mehr bei jeder Aktivität unterstützen und hat damit seine Arbeitslast reduziert.

Diese Dezentralisierung der Aufgaben hat nicht nur Vorteile: zu beachten ist, dass die Teams fast unweigerlich anders arbeiten und unterschiedliche Lösungen für gleiche Probleme finden. Das kann sowohl positiv sein, zum Beispiel wenn eine bessere Lösung entsteht, es kann aber auch negativ sein, weil unnötig mehrfach Aufwand für das Lösen gleicher Probleme aufgewendet wird. Dem wirken wir durch eine Konzernübergreifende DevOps Community entgegen, in der wir allen relevanten Kollegen die Plattform bieten, sich über ihre Probleme und Lösungen auszutauschen und Synergien zu identifizieren, als auch um Guardrails und Best Practices vorzugeben.

Livin IT

Welche Rolle spielen Cloud-Kosten-Management-Tools und -Strategien, um die Ausgaben zu kontrollieren und zu optimieren?

Die richtigen Tools und Strategien spielen klar eine große Rolle. Hat man keine Tools und somit keine detaillierte Einsicht darauf, welche Services und Ressourcen in der Cloud Kosten generieren, kann man die anfallenden Kosten natürlich nur entsprechend schwer oder sogar gar nicht optimieren. Wenn man die notwendigen Kostendaten hat, aber keine Strategie für den richtigen Umgang mit diesen Daten, dann wird es einem ebenfalls schwerfallen, Optimierungen zu finden.

In Bezug auf Tools ist ein sehr großer Vorteil, dass alle großen Cloud-Anbieter bereits Tools innerhalb ihrer Cloud-Plattform anbieten, mit denen die anfallenden Kosten analysiert werden können. Auch schlagen diese Tools meist Optimierungen vor, wie Kosten eingespart werden können.

Dennoch sollte man sich darüber hinaus mit dem Thema Kostenoptimierung weiter beschäftigen und eine Strategie entwickeln, wie man mit Kosten umgehen möchte. Hat man eine solche Strategie, vereinfacht das den Umgang mit der Kostenkontrolle und -optimierung erheblich und stellt zugleich auch sicher, dass man keine Optimierungspunkte übersieht.

Habt Ihr eine Strategie für das Management von ungenutzten oder verschwendeten Cloud-Ressourcen entwickelt, um Kosten zu minimieren?

Ja. Ein Schritt unserer Strategie ist, dass wir uns beispielsweise unsere serverbasierten Ressourcen anschauen und prüfen, ob die gewählten Ressourcen effektiv genutzt werden oder ob sie überdimensioniert sind. Sollten sie überdimensioniert sein, verkleinern wir die entsprechenden Server und reduzieren damit die anfallenden Kosten; ein Prozess, der als “Rightsizing” bezeichnet wird.

Das Erkennen von ungenutzten Ressourcen kann deutlich schwerer sein. Bei serverbasierten Ressourcen kann man es eventuell noch über die Auslastung des Servers erkennen, bei vielen anderen Ressourcen jedoch kann es schwer sein, zu erkennen, ob sie genutzt werden. Unser größter Hebel, um diesem Problem entgegenzuwirken, ist, dass wir alle unsere Ressourcen über “Infrastructure-As-Code” automatisiert anlegen und verwalten, statt sie manuell bei den Cloud-Anbietern anzulegen.

Das ermöglicht es uns, regelmäßig als Teil unserer Kostenoptimierungen die im Infrastructure-As-Code definierten Ressourcen gegen zu prüfen und sehr schnell komplett überflüssige Komponenten zu erkennen. Unsere Annahme, die sich über die Jahre positiv bestätigt hat, ist, dass wir selten innerhalb einer Komponente Ressourcen haben, die wir nicht mehr brauchen, es jedoch vorkommen kann, dass eine ganze Komponente mit all ihren Ressourcen nicht mehr benötigt wird. Das Löschen all dieser Ressourcen ist dann sehr einfach: wir entfernen einfach alles zu der Komponente aus unseren Infrastructure-As-Code Definitionen, was schließlich zu der Löschung der eigentlichen Ressourcen führt.

Außerdem führen wir auch regelmäßig Kostenanalysen mit den Cloud-Anbietern selbst durch und erweitern unsere Strategien mit dem, was wir in diesen Analysen von den Cloud-Anbietern lernen.

Linkedin Confare Titelbild Logos 2022 dunkel

Welche Rolle spielt das Kostenbewusstsein und die Schulung bei der effektiven Verwaltung der Cloud-Ausgaben?

Wir sind sehr darauf fokussiert, mit unserer Cloud-Nutzung so kosteneffektiv wie möglich zu sein. Das Bewusstsein für die Kosten spielt für uns also eine große Rolle, da Unachtsamkeit schnell dafür sorgen kann, dass die anfallenden Kosten die geplanten Kosten übersteigen.

Um dieses Kostenbewusstsein zu schaffen, machen wir allen Mitarbeitern, die Cloud-Ressourcen verwalten, im Rahmen ihres Onboardings die Wichtigkeit der Kosten deutlich und bringen ihnen die Tools und Strategien zur Optimierung der Kosten bei.

Außerdem setzen wir bei den Cloud-Anbietern Budgets und automatische Warnungen auf, die die relevanten Mitarbeiter und uns zeitnah informieren, wenn wir uns einem Limit nähern bzw. ein Limit überschritten haben sollten.

CIOSUMMIT Wien 2024

Welche Risiken und Herausforderungen sind mit der Verwaltung von Kosten in einer multiplen Cloud-Umgebung verbunden? Wie geht Ihr damit um?

Eine oft auftretende Herausforderung ist es, die Gesamtkosten korrekt auf die Workloads aufzuteilen, welche die Kosten erzeugt haben. Meist ist das notwendig, um die Kosten an das richtige Team weiter zu verrechnen, aber auch um zu verstehen, welche Workloads für Kostenoptimierungen zuerst geprüft werden sollten.

Wir haben zwei Lösungswege, die sich für uns bewährt haben. Den ersten Weg, den wir bevorzugen, ist eine Trennung der Workloads an der zentralsten sinnvollen Stelle durchzuführen. Bei der Amazon-Cloud AWS reden wir hier von “Accounts”, bei der Microsoft-Cloud Azure von “Subscriptions”. Diese Art von Trennung wird direkt in der Rechnungslegung der Cloud-Anbieter unterstützt und damit im Normalfall in Abrechnungen ohne weiteres Zutun separat aufgelistet.

Die zweite Option, sofern die erste für einen gegebenen Anwendungszweck nicht sinnvoll bzw. zu tiefgreifend sein sollte, ist es, die Ressourcen der Workloads mit entsprechenden “Tags”, d.h. Markierungen zu versehen. Die Cloud-Anbieter ermöglichen es, dass man für solche Tags konfiguriert, dass sie in der Erstellung der Rechnung oder einem separaten Export entsprechend ihrer assoziierten Kosten aufgeschlüsselt werden.

Sollten die Workloads bei mehr als einem Cloud-Anbieter liegen, kann das Verwalten von Kosten eine spezielle Herausforderung sein. Entweder muss man den Überblick über mehrere Kostentools behalten, oder die Kosten in einem Tool zentralisieren. Mit beiden Optionen ist entsprechender Umsetzungs- und Lernaufwand verbunden.

Gender-Hinweis:

Zur besseren Lesbarkeit dieses Blogartikels verwenden wir das generische Maskulinum. Die in diesem Blogartikel verwendeten Personenbezeichnungen beziehen sich – sofern nicht anders kenntlich gemacht – auf alle Geschlechter.

Für Sie ausgewählt

Leave a Comment