Aufgaben
* Gestaltung, Aufbau und Betrieb skalierbarer Cloud-, On-Prem- und Hybrid-Infrastrukturen auf Basis von IaC-Tools wie Terraform, Terragrunt oder Ansible
* Automatisierung des gesamten Kubernetes-Lifecycles - von Provisionierung und Upgrades bis hin zu stabilen, sicheren Cluster-Deployments
* Entwicklung und Optimierung von CI/CD-Pipelines für Infrastruktur- und Applikationsartefakte sowie Umsetzung von GitOps-Workflows mit FluxCD
* Sicherstellung einer vollständigen Observability über Metriken, Logs, Tracing, Dashboards und Alerting, inklusive Analyse von Incidents und Systemverhalten
* Einführung und Betrieb von DevSecOps-Praktiken wie Vulnerability Scanning, Geheimnis-Management, Policy Enforcement und Plattform-Hardening
* Durchführung von Reliability-Initiativen wie High-Availability-Konzepten, Chaos-/Fault-Testing, Kapazitätsanalysen und Performance-Optimierung
* Enge Zusammenarbeit mit Engineering-Teams bei Architektur, Fehleranalysen und Designentscheidungen, um verteilte Systeme stabil und zuverlässig zu betreiben
* Einsatz moderner AI-Coding-Assistenten (Copilot, Cursor, Claude Code) im IaC-Kontext und Aufbau von AI-gestützten Guardrails zur Prävention fehlerhafter Konfigurationen
Profil
* Mehrjährige Erfahrung im DevOps-, Platform- oder Site-Reliability-Engineering-Umfeld
* Tiefe praktische Kenntnisse in der Arbeit mit Kubernetes (idealerweise produktiv + CKA-Niveau oder gleichwertige Erfahrung)
* Sehr gutes Verständnis von Infrastructure as Code, bevorzugt mit Terraform, Terragrunt, Ansible oder Crossplane
* Routine im Aufbau und Betrieb moderner CI/CD-Pipelines (z.?B. GitLab CI, GitHub Actions, Jenkins)
* Vertraut mit GitOps-Methoden wie FluxCD oder ArgoCD
* Solide Kenntnisse in Observability-Stacks wie Prometheus, Grafana, SigNoz oder ELK
* Erfahrung mit DevSecOps-Ansätzen: Vulnerability Scanning, Secret-Management, Policy-Frameworks.
* Sehr gute Englischkenntnisse; Deutsch ist ein Plus
* Optional von Vorteil: Erfahrung mit Bare-Metal-/Hybrid-Kubernetes, Scripting (Bash/Python), Chaos Engineering, Performance-Optimierung oder Nutzung von AI-Tools im Infrastrukturkontext
* Bereitschaft zur Teilnahme an Sicherheitsüberprüfungen (SÜG) je nach Projektumfeld
Benefits
* Arbeiten Sie an einer Plattform, die es Entwicklerteams ermöglicht, Ideen schneller, sicherer und effizienter in Produktion zu bringen
* Nutzen Sie ein zukunftsorientiertes Technologieumfeld mit Tools wie Terraform, Kubernetes, FluxCD und SigNoz und gestalten Sie technische Standards aktiv mit
* Kombinieren Sie Homeoffice - inklusive hochwertiger technischer Ausstattung für produktives Arbeiten
* Vertiefen Sie Ihre technischen Fähigkeiten, evaluieren Sie neue Technologien und wirken Sie aktiv an der Weiterentwicklung der Engineering-Kultur mit.
* 30 Tage Urlaub