Du hast ein abgeschlossenes Studium oder eine Ausbildung in Informatik oder einem verwandten Fachgebiet. Du hast bereits erste Erfahrungen mit Kubernetes und Virtualisierung sammeln können. Du verfügst über solide Kenntnisse in der Softwareentwicklung mit Golang, Python oder einer vergleichbaren Systemsprache. Du arbeitest selbstständig und zeigst Biss, wenn es darum geht, dich in neue Technologien einzuarbeiten. Du bringst deinen Team-Buff in jede Mission ein und levelst mit Begeisterung Erfahrungspunkte im täglichen operativen Betrieb und dessen Automatisierung. EinleitungstextSchwarz Digits schafft das technologische Fundament für digitale Entscheidungsfreiheit in Europa. Als IT- und Digitalsparte der Schwarz Gruppe entwickeln und verantworten wir einerseits die IT-Infrastrukturen für die Handelssparten Lidl und Kaufland sowie die Schwarz Produktion und PreZero. Gleichzeitig agieren wir als unabhängiger Anbieter am externen Markt, um Unternehmen in ganz Europa bei ihrer digitalen Transformation zu unterstützen. Unsere Kernleistungen bündeln wir in den Bereichen Cloud, Cyber Security, Data & AI, Communication und Workspace. Trage auch du zur digitalen Entscheidungsfreiheit in Europa bei.Bei uns arbeitest du an der Schnittstelle zwischen Agilität und Sicherheit: Du profitierst von den schnellen Entscheidungswegen, genießt echte Gestaltungsspielräume in deinen Projekten und baust dabei auf das stabile Fundament der Schwarz Gruppe. Deine AufgabenDu betreibst und optimierst unsere hochkomplexen Plattformen (Kubernetes, KubeVirt, Cilium, Ceph, Talos) sowie die zugrundeliegende Infrastruktur mit dem Fokus auf End-to-End-Stabilität, Skalierbarkeit und Kosten. Du entwickelst und pflegst unsere Monitoring- und Logging-Systeme (Metrics, Logs, Traces), um jederzeit tiefgreifende Einblicke in den Systemzustand zu gewährleisten und proaktiv Engpässe zu erkennen. Du implementierst konsequentes Synthetic Monitoring und Tracetests, um die End-to-End-Funktionalität kritischer Services kontinuierlich zu validieren. Du definierst und überwachst klare Service Level Objectives (SLOs) und reduzierst 'Toil' konsequent durch Code. Runbooks sind für dich nur die letzte Verteidigungslinie. Du dokumentierst deine Arbeit nachvollziehbar, denn das beste System ist wertlos ohne ein gutes Markdown.