Systemreliabilitätsingenieur
Wir suchen einen erfahrenen Systemreliabilitätsingenieur, der für die Sicherstellung der IT-Sicherheit unserer Systeme verantwortlich ist. Als Teil unseres Teams werden Sie komplexe Servicearchitekturen entwerfen, implementieren und weiterentwickeln sowie Verantwortung für den sicheren, stabilen und zukunftsorientierten Betrieb unserer Datenzentren, Cloud-Dienste und Application-Services tragen.
Aufgaben:
* Verantwortung für komplexe Servicearchitekturen – von Design über Dokumentation bis zum gesamten Lebenszyklus
* Sicherstellung der IT-Sicherheit durch Einhaltung und Weiterentwicklung von Sicherheitsrichtlinien in Architektur und Betrieb
* Eigenverantwortliche Umsetzung komplexer Änderungen an Designs und Architekturen – mit Blick für technische und organisatorische Zusammenhänge
* Aufbau, Automatisierung und Betrieb von Plattformen und Services – insbesondere einer Middleware-as-a-Service mit Apache Kafka
* Beratung und Unterstützung von Nutzerinnen bei der Integration und Weiterentwicklung ihrer Anwendungen
* Automatisierung wiederkehrender Aufgaben zur Steigerung von Effizienz und Zuverlässigkeit
* Enge Zusammenarbeit mit anderen Teams, um die Systemstabilität und -verfügbarkeit kontinuierlich zu verbessern
Voraussetzungen:
1. Abgeschlossenes Studium der Informatik oder vergleichbares Studium mit IT-Schwerpunkt
2. Fundierte Kenntnisse in der Administration von Linux-Systemen
3. Erfahrung mit Automatisierungs-Werkzeugen wie Puppet oder Ansible
4. Praxis im Betrieb von Datenzentren oder Cloud-Diensten (z.B. Proxy, DNS, VPN, IAM, Monitoring, Microsoft Services, Backup Tools)
5. Idealweise Erfahrungen im Projekt- und/oder Produktmanagement
6. Idealweise Erfahrung mit Middleware-as-a-Service, insbesondere Apache Kafka
7. Kenntnisse in Monitoring-Tools (z.B. Prometheus, Grafana) und Logging-Stacks (z.B. EFK)
8. Programmierkenntnisse (z.B. Python) und Erfahrung im Aufbau von CI/CD-Pipelines
9. Vertrautheit mit Container-, Orchestrierungs- und Cloud-Lösungen (z.B. Docker, Kubernetes)
10. Bereitschaft zur Übernahme von Verantwortung für kritische Infrastruktur
11. Verhandlungssicheres Deutsch und gute Englisch-Kenntnisse
12. Medizinische Tauglichkeit, Bereitschaft zur Rufbereitschaft bzw. Wechsel-Schichtdienst sowie Führerschein Klasse B
13. Bereitschaft zur erweiterten Sicherheitsüberprüfung nach dem Sicherheitsüberprüfungs-Gesetz (SÜG)
14. Hands-on-Mentalität mit dem Anspruch, Probleme nicht nur zu erkennen, sondern aktiv und eigenverantwortlich zu lösen
15. Proaktive Denkweise – Sie warten nicht auf Aufgaben, sondern erkennen Handlungsbedarf und treiben Lösungen selbstständig voran
16. Teamgeist und Kommunikationsstärke – Sie bringen sich aktiv ein, teilen Wissen, geben Impulse und nehmen Feedback auf