Jobs
Meine Anzeigen
Jobs per E-Mail
Anmelden
Stellenangebote Job Tipps Unternehmen
Suchen

Service operations lead (platform / sre) (m/w/d)

Hessen
Westhouse Group
Inserat online seit: 31 März
Beschreibung

Westhouse ist eines der führenden internationalen Recruitment Unternehmen für die Vermittlung von hochqualifizierten Fachexperten in Bereichen wie IT Life Cycle, SAP, Engineering, Kaufmännischem und Fachberatung.

Für unseren Kunden suchen wir aktuell eine/n Service Operations Lead (Platform / SRE) (m/w/d) - Remote + Frankfurt.

Ihre Aufgaben

1. Übernahme der Tier-3-Betriebsverantwortung für Compute- und Betriebssystem-Services in der lokalen Produktionsumgebung (DE)
2. Bearbeitung komplexer Incidents, tiefgehendes Troubleshooting und Durchführung von Root-Cause-Analysen; Umsetzung dauerhafter Lösungen und präventiver Maßnahmen
3. Sicherstellung der Betriebsbereitschaft von Compute/OS für Releases und Änderungen: Monitoring/Alerting-Abdeckung, Performance-Baselines, Härtung, Patch-Strategie, Rollback- und Recovery-Verfahren, Runbooks
4. Durchführung und kontinuierliche Verbesserung standardisierter Betriebsprozesse durch Automatisierung (Reduktion manueller Tätigkeiten, Verbesserung von MTTR und Stabilität)
5. Technische Koordination mit Kubernetes-, Daten-, Netzwerk- und Storage-Spezialisten zur Lösung domänenübergreifender Produktionsprobleme
6. Sicherstellung der Betriebsbereitschaft für Deployments
7. Validierung von Deployment-Artefakten aus Betriebssicht
8. Definition und Durchsetzung von Qualitätssicherungsmaßnahmen (z. B. erforderliche Dokumentation von Betriebsprozessen, erfolgreiche Testnachweise) zur Sicherstellung hoher Service- und Produktqualität
9. Sicherstellung von Rollback-Strategien und operativem Monitoring (Observability) für Produktionsdeployments
10. Überwachung von Systemzustand, Performance-Kennzahlen und Serviceverfügbarkeit in Multi-Tenant-Umgebungen
11. Identifikation, Analyse und Behebung von Incidents zur Minimierung von Serviceunterbrechungen
12. Initiierung von Root-Cause-Analysen sowie Umsetzung korrektiver und präventiver Maßnahmen
13. Automatisierung kritischer Standardbetriebsprozesse zur Reduktion manueller Aufwände und Steigerung der Servicezuverlässigkeit
14. Analyse operativer Probleme und Automatisierung entsprechender Lösungsprozesse
15. Validierung aller automatisierten Abläufe gemäß etabliertem Softwareentwicklungsprozess (inkl. Staging, Testing und Review)
16. Umsetzung von Monitoring- und Logging-Strategien zur Unterstützung von Audit- und Compliance-Anforderungen
17. Durchführung regelmäßiger Sicherheitsscans sowie Behebung identifizierter Schwachstellen

Interessiert?

Mandy Granz

Tel.:
Fax.:
Email:

Share posting

Ihre Qualifikationen

18. ES MUSS ZU JEDEM SKILL MINDESTENS EINE REFERENZ GENANNT WERDEN KÖNNEN!!
19. 5–10+ Jahre Erfahrung in IT-Betrieb, Service Delivery oder Plattformbetrieb mit nachgewiesener Führungsverantwortung in geschäftskritischen Umgebungen
20. Nachweisbare Erfahrung in der Implementierung und Leitung von Incident-, Problem-, Change- und Release-Governance im Produktivbetrieb
21. Expertise im IT Service Management (ITSM): Jira Service Management (JSM), Jira, Confluence
22. Erfahrung mit zentralen Betriebsprozessen (Incident Management, Change Management, Problem Management, IT Service Management) sowie mit SRE-Konzepten
23. Erfahrung in der Gewinnung operativer Erkenntnisse aus Monitoring und Observability, einschließlich Management und Tracking von SLI/SLA/SLO
24. Praktische Erfahrung in der strukturierten Dokumentation von Prozessen sowie in der Etablierung klarer Runbooks und Playbooks
25. Praktische Erfahrung im Bereich Observability mit Monitoring- und Logging-Tools (z. B. Prometheus, Grafana, Datadog, Mimir, Loki)
26. Kenntnisse von Enterprise-DevOps-Toolchains sind von Vorteil (GitLab, JFrog Artifactory, Backstage, Harness)
27. Expertise in modernen Plattform-Operations (Kubernetes/Container, Automatisierung, Observability), ausreichend, um Spezialisten fachlich zu steuern
28. Kenntnisse von Plattform-Delivery-Konzepten: GitOps und Infrastructure as Code (IaC) (Terraform/OpenTofu, ArgoCD, Helm) zur Sicherstellung von Deployment- und Readiness-Standards

Bewerben
E-Mail Alert anlegen
Alert aktiviert
Speichern
Speichern
Mehr Stellenangebote
Ähnliche Angebote
Jobs Hessen
Jobs Harz
Jobs Sachsen-Anhalt
Home > Stellenangebote > Service Operations Lead (Platform / SRE) (m/w/d)

Jobijoba

  • Job-Ratgeber
  • Bewertungen Unternehmen

Stellenangebote finden

  • Stellenangebote nach Jobtitel
  • Stellenangebote nach Berufsfeld
  • Stellenangebote nach Firma
  • Stellenangebote nach Ort
  • Stellenangebote nach Stichworten

Kontakt / Partner

  • Kontakt
  • Veröffentlichen Sie Ihre Angebote auf Jobijoba

Impressum - Allgemeine Geschäftsbedingungen - Datenschutzerklärung - Meine Cookies verwalten - Barrierefreiheit: Nicht konform

© 2026 Jobijoba - Alle Rechte vorbehalten

Bewerben
E-Mail Alert anlegen
Alert aktiviert
Speichern
Speichern