Sicherstellung der InfrastrukturAls Site Reliability Engineer bist Du für die Verwaltung unserer Cloud-Infrastruktur verantwortlich. Dies umfasst die Sicherstellung, dass unsere Services 24/7 verfügbar sind und die Analyse, Behebung & Prävention möglicher Störungen innerhalb unserer Entwicklungs- und Produktionsumgebung.TätigkeitenVerwaltung unserer Cloud-InfrastrukturSicherstellen, dass unsere Services 24/7 verfügbar sindAnalyse, Behebung & Prävention möglicher Störungen innerhalb unserer Entwicklungs- und ProduktionsumgebungKonfiguration und Absicherung von NetzwerkenImplementierung von Logging-, Monitoring- und Alerting-LösungenWartung und Optimierung unserer CI/CD-Pipelines zur Automatisierung von Build-, Test- und Deployment-ProzessenImplementierung von Tools zur Automatisierung von Prozessen und Unterstützung unserer EntwicklerPlanung und Durchführung von Tests zur Überprüfung der Leistungsfähigkeit und Skalierbarkeit unserer Services unter hoher LastImplementierung von System-TestsAnforderungenExpertise mit mindestens einer Cloud Platform (bevorzugt GCP)Sicherer Umgang mit Kubernetes und dazugehörigem ToolingErfahrung mit mindestens einem Infrastructure-as-Code Tool (bevorzugt terraform)Erfahrung mit gängigen Monitoring- und Logging Tools (z.B. Prometheus, Grafana, Datadog)Erfahrung mit Microservices und Event-getriebenen ArchitekturenNetzwerke / DNS / IT-SecurityPraktische Erfahrung mit mindestens einer Programmiersprache (bevorzugt Golang)BewerbungsprozessNach dem ersten Gespräch laden wir Dich zu weiteren Terminen ein, damit Du das Team kennst und uns besser verstehst.