Als Head of Site Reliability Engineering (SRE) spielst du bei uns eine zentrale Rolle bei der Sicherstellung der Stabilität und Performance unserer IT-Landschaft. Du übernimmst Verantwortung für das Mobile- & Online-Banking der Commerzbank und arbeitest eng mit Entwicklungs- sowie Infrastrukturteams zusammen, um eine sichere und zuverlässige Plattform für unsere Kunden zu gewährleisten. Gleichzeitig hast du die Möglichkeit, in einem international agierenden Umfeld zu arbeiten. Unser Unternehmen setzt auf agile Arbeitsmethoden und ein innovatives Mindset, in dem deine Ideen und dein Engagement gefragt sind.
1. Fachliche Teamführung: Entwicklung und Umsetzung der SRE-Strategie zur Sicherstellung der Systemzuverlässigkeit und -verfügbarkeit
2. Technische Expertise: Leitung von Initiativen zur Optimierung von Java-basierten Anwendungen, DevOps-Prozessen, Monitoring und Logging
3. Incident Management: Moderation von Task Forces und Post-Mortem-Analysen zur Identifikation und Behebung von Problemen
4. Koordination: Steuerung und Priorisierung von Issue-Fixing-Prozessen in Zusammenarbeit mit interdisziplinären Teams
5. Wissensaufbau: Pflegen einer umfassenden Dokumentation für Observability-Konfigurationen, Automatisierungsprozesse und Cloud-Infrastruktur-Standards
6. Teamführung: Aufbau und Weiterentwicklung eines leistungsstarken SRE-Teams
7. Bachelor oder Master in Informatik, Software Engineering oder vergleichbarem Abschluss
8. Mehrjährige Berufserfahrung, idealerweise mit Schwerpunkt auf Site Reliability Engineering
9. Profundes Verständnis von System Architektur und Cloud-Infrastruktur
10. Ausgeprägte kommunikative und Moderationsfähigkeiten für das Management von Task Forces und (Post-Mortem-)Analysen
11. Starke koordinative Fähigkeiten im Delivery Management
12. Starke Fähigkeiten im Troubleshooting mit Schwerpunkt auf Performance-Tuning und Incident-Management
13. Erfahrung in Scripting und Automatisierung, um wiederkehrende Prozesse zu optimieren
14. Erfahrung im Alert Design & SLO-Management
15. Verhandlungsstärke und ausgeprägte Überzeugungsfähigkeit, Teams zu motivieren und zu entwickeln
16. Proaktive, lösungsorientierte Denkweise mit einem Fokus auf kontinuierliche Verbesserung
17. Analytische Fähigkeiten bei der Problemlösung
Technische Schwerpunkte:
18. Dynatrace Monitoring & Observability
19. Java und Spring
20. Openshift oder Kubernetes
21. Cloud- und Netzwerk-Infrastruktur
22. Unix / Linux