Was erwartet dich? Du bist hauptsächlich für die Weiterentwicklung der Infrastruktur unserer Produkte verantwortlich und integrierst neue Produkte/Webdienste in unsere Kubernetes- und Cloud-Infrastruktur Du sorgst für den stabilen und sicheren Betrieb unserer Produktplattform und führst tiefgreifende Analysen sowie Optimierungen unserer containerisierten und Kubernetes-basierten Anwendungsinfrastruktur durch Du lebst Automatisierung und nutzt Tools wie Terraform, Gitlab CI/CD und ArgoCD, um unsere gesamte Infrastruktur deklarativ und reproduzierbar zu provisionieren und zu verwalten Du analysierst und behebst komplexe Probleme in einer verteilten Systemlandschaft und arbeitest kontinuierlich an der Verbesserung unserer Plattform Du entwickelst und pflegst unsere Monitoring-, Logging- und Alerting-Lösungen, um proaktiv Engpässe und Fehlerquellen zu identifizieren Was bieten wir dir? Hybrides Arbeitsmodell Flexible Arbeitszeiten durch Vertrauensarbeitszeit An einigen Standorten eine bezuschusste Kantine und verschiedene kostenfreie Getränke Moderne Büroflächen mit sehr guter Verkehrsanbindung Diverse Mitarbeiterrabatte für Aktivitäten und Produkte Mitarbeiterevents wie Sommer- und Winterfeiern, sowie Workshops Zahlreiche Weiterbildungs- und Entwicklungsmöglichkeiten Verschiedene Gesundheitsangebote, wie Sport- und Gesundheitskurse Was solltest du mitbringen? Du hast mehrjährige Erfahrung als Site Reliability Engineer oder in einer verwandten Rolle (Linux System Administrator:in, Platform Engineer, DevOps Engineer, Full Stack Developer) in einem Linux- und Kubernetes-Umfeld Du verfügst über sehr gute Kenntnisse und mehrjährige Erfahrung in der Verwendung des Linux-Betriebssystems, Container-Technologien und speziell in Kubernetes Du hast Erfahrung mit Infrastructure as Code (vorzugsweise Terraform), CI/CD-Pipelines (z. B. GitLab CI/CD oder GitHub Actions) und in der Nutzung von Helm Charts Du kannst sicher in mindestens einer Programmier- oder Skriptsprache (z. B. Go, Python, Bash) entwickeln, um Automatisierungs- und Monitoring-Aufgaben zu lösen Du hast Erfahrung mit dem Betrieb und der Fehlersuche in hochverfügbaren und verteilten Produktionsumgebungen, einschließlich Überwachung, Alarmierung und Protokollanalyse verteilter Anwendungen Du arbeitest proaktiv, lösungsorientiert und selbstständig und kannst komplexe technische Probleme systematisch analysieren und nachhaltig beheben