Akkodis ist ein globales Beratungsunternehmen für Digital Engineering, das Technologie und Talente zusammenbringt, um Transformation zu beschleunigen, Innovation voranzutreiben und eine intelligentere Zukunft zu gestalten. Mit mehr als 50.000 Expert:innen in über 30 Ländern verbinden wir Branchen und Technologien miteinander - von AI und Data Analytics bis zu Cloud, Edge, Automatisierung und Cybersecurity.
Stellenbeschreibung
In dieser Rolle bist du verantwortlich für den stabilen und effizienten Betrieb einer modernen, KVM‑basierten Infrastruktur. Du arbeitest an der Schnittstelle zwischen Linux‑Systemengineering, Virtualisierung, Kubernetes‑Operations und imagebasierten Plattform-Architekturen.
Zu deinen Kernaufgaben gehören:
* Sicherstellen des zuverlässigen Betriebs der KVM‑ und Linux‑Umgebungen
* Analyse und Behebung komplexer Performance‑ und Infrastrukturprobleme
* Eigenständige Bearbeitung und Steuerung von Major Incidents (P1‑Situationen)
* Troubleshooting von Kubernetes‑Runtime‑Problemen im produktiven Umfeld
* Arbeiten mit immutable bzw. imagebasierten Betriebssystemen sowie Ableitung von Update‑ und Lifecycle‑Prozessen
* Kontinuierliche Verbesserung von Monitoring, Runbooks und operativen Abläufen
* Enge Zusammenarbeit mit anderen Teams, um Ursachen zu identifizieren und nachhaltige Lösungen umzusetzen
* Aktive Mitwirkung an der Optimierung von Prozessen, Monitoring‑Konzepten und Runbooks
Profil
* Fundierte Kenntnisse in KVM und Virtualisierung
* Sicherer Umgang mit Linux‑Interna wie CPU‑ und Speicherverwaltung, I/O, systemd und Netzwerken
* Erfahrung im Debugging und Performance‑Tuning, z B NUMA, CPU‑Pinning sowie Storage‑ und Netzwerk‑Latenzen
* Fähigkeit, Virtualisierungsprobleme innerhalb von VMs sicher zu identifizieren und zu analysieren
* Praxis im operativen Kubernetes‑Umfeld und in der Behebung typischer Laufzeit‑ und Node‑Probleme (CrashLoopBackOff, NotReady‑Zustände, fehlerhafte Service‑Routings)
* Verständnis für immutable bzw. imagebasierte Betriebssysteme sowie deren Vorteile in Bezug auf Drift‑Reduktion und vereinfachte Betriebsabläufe
* Sicheres Beherrschen von Root‑Cause‑Analysen
* Gezielter Einsatz von Logs und Metriken zur Fehleranalyse
* Erfahrung im Umgang mit produktiven Störungen und kritischen Situationen, inkl. P1‑Incidents
* Strukturierte, lösungsorientierte und teamfähige Arbeitsweise
* Hohe Ownership‑Mentalität und Bereitschaft, Verantwortung zu übernehmen
* Möglichkeit, die Position vollständig remote innerhalb Deutschlands auszuüben
Das Angebot
* Es besteht die Möglichkeit zum Teil im Homeoffice /remote zu arbeiten und somit von den Vorteilen hybrider Arbeit zu profitieren (flexibles Arbeiten)
* Teamspirit und Diversität
* Work-Life-Balance
* Attraktive Vergütung
* Sozialleistungen
* Vielseitige Weiterbildungsmöglichkeiten
* Team- und Sportevents
* Globales Netzwerk
* Attraktives Mitarbeiterempfehlungsprogramm
Die Benefits können je nach Position und Standort variieren. Eine Übersicht über unsere Benefits befindet sich auf unserer Webseite unterhalb Karriere und Benefits.