Als Site Reliability Engineer bist du verantwortlich für die Gewährleistung der Verfügbarkeit und des Betriebsourfeins unserer Cloud-Infrastruktur.
Aufgaben
* Sicherstellen, dass unsere Services 24/7 verfügbar sind und unseren Kunden eine hohe Dienstqualität bieten.
* Analyse, Behebung und Prävention möglicher Störungen innerhalb unserer Entwicklungs- und Produktionsumgebung.
Anforderungen
* Mindestens eine Cloud Platform (bevorzugt GCP) verwenden.
* Kubernetes und dazugehörigem Tooling sicher beherrschen.
* Erfahrung mit einem Infrastructure-as-Code Tool (bevorzugt terraform) haben.
* Gängige Monitoring- und Logging Tools (z.B. Prometheus, Grafana, Datadog) einsetzen.
* Microservices und event-getriebene Architekturen kennen.
* Netzwerke / DNS / IT-Security verstehen.
* Praktische Erfahrung mit mindestens einer Programmiersprache (bevorzugt Golang) besitzen.
Vorteile
* Die Möglichkeit, innovative Projekte zu entwickeln und erfolgreich umzusetzen.
* Arbeiten an Lösungen, die Menschenleben verbessern.