Inserat online seit: Veröffentlicht vor 10 Std.
Aufgaben der Stelle
F uuml;r die Abteilung KI Plattform suchen wir zum n auml;chstm ouml;glichen Termin f uuml;r den Standort M uuml;nster oder Hannover zwei MLOps Engineer f uuml;r CI / CD amp; Inference Services (m/w/d) Hannover oder M uuml;nster Vollzeit Unser Team stellt die zentrale KI- und Data Analytics Plattform der Finanz Informatik f uuml;r interne und externe Kunden wie Sparkassen und Verbundpartner bereit.
Erfahren Sie mehr über diese Stelle, indem Sie die nachstehenden Informationen lesen, und bewerben Sie sich, um berücksichtigt zu werden.
In deiner Rolle als MLOps Engineer gestaltest du aktiv die technische Basis f uuml;r skalierbare, sichere und performante KI-L ouml;sungen
- von der automatisierten Bereitstellung uuml;ber Inferenzinfrastruktur bis hin zum Modellbetrieb.
Du entwickelst gemeinsam mit Experten aus AI Engineering, System Engineering und Softwareentwicklung moderne Werkzeuge und Prozesse f uuml;r datengetriebenes Banking f uuml;r uuml;ber 50 Millionen Kunden.
Mit unserer Plattform setzen wir auf moderne Technologien wie Kubernetes, ArgoCD, Helm, GitHub Actions, Nvidia Triton, Huggingface TGI/TEI, arbeiten mit Partnern wie Nvidia oder Mistral AI eng zusammen
- und suchen Kollegen, die entweder im Bereich CI/CD amp; Plattformautomatisierung oder im Bereich LLM-Infrastruktur amp; Inferenzservices ihre Expertise mit einbringen und weiter ausbauen.
Uuml;bernimm eigenst auml;ndig Aufgaben, die f uuml;r die Weiterentwicklung der KI und Data Analytics Plattform wesentlich sind.
Dabei wirkst du aktiv in einem dynamischen und aufgeweckten Team an der Implementierung von State-of-the-Art Systemtechnologien im Finanzsektor mit.
Als einer der gr ouml; szlig;ten Banken-IT-Dienstleister und Digitalisierungspartner Europas sind wir der Treiber der Digitalisierung innerhalb der Sparkassen-Finanzgruppe.
Mit uuml;ber 5.000 Mitarbeiter:innen an 3 Standorten machen wir digitales Banking von heute leistungsf auml;hig und entwickeln smarte Finanz-Services von morgen.
Dabei bieten wir Ihnen ein breites Aufgabenspektrum, in dem Sie Ihre individuelle St auml;rke hervorragend einbringen k ouml;nnen.
Ob App-Entwicklung, Netzwerktechnologien und Serverbetrieb oder Beratung, Schulung und Support
- bei uns finden Sie Ihre Berufung! Als Spezialist:in oder auch als Generalist:in.
Alles mit besten Karrierechancen, viel Raum f uuml;r pers ouml;nliche Entfaltung und zahlreichen Benefits.
Aufgaben Koordination der Automatisierung der Build-, Test- und Deployment-Prozesse f uuml;r unsere Container-Anwendungen mit Jenkins, GitHub Actions oder GitLab CI, sowie Integration neuer Use Cases in die Plattform-Pipelines.
Orchestrierung von Containeranwendungen mit Helm und ArgoCD in Kubernetes-Clustern, sowie Verantwortlichkeit f uuml;r sichere, reproduzierbare Deployments.
Entwicklung von APIs f uuml;r die interne Plattformlogik im Python- Ouml;kosystem
- z.B.
zur Steuerung von Modellbereitstellungen, Statusabfragen oder Konfigurationsmanagement.
Steuerung der Spark-Anwendungen, welche in Kubernetes mit dem Spark Operator betrieben werden
- idealerweise mit Fokus auf verteilte Inferenz oder Preprocessing gro szlig;er Datenmengen.
Bereitstellung von unimodalen (z.B.
LLM, OCR, SST/TTS) und multimodalen KI-Modellen mittels Nvidia Triton, NIM oder Alternativen wie Huggingface TGI, TEI oder vLLM.
Steuerung der fachbereichs uuml;bergreifenden Zusammenarbeit, sowie aktive Einbringung der Erfahrung bei Architekturentscheidungen und Beratung zur Weiterentwicklung der Plattformdienste.
Diskurs mit globalen Herstellern f uuml;r die zukunftsorientierte Weiterentwicklung der Plattformarchitektur. xniyctf
Profil Abgeschlossenes Informatik
- oder vergleichbares Studium oder Berufsausbildung sowie mindestens 6 Jahre fachbezogene Berufserfahrung Umfangreiche Erfahrung in der Automatisierung von CI/CD-Pipelines (Jenkins, GitHub Actions, GitLab CI und Helm und ArgoCD f uuml;r Kubernetes-basierte Deployments) Kenntnisse in der Entwicklung von REST-APIs in Python (z.B.
mit FastAPI oder Flask) Optional, aber wertvoll: Erfahrung mit LLM-Inferenz, z.B.
via Nvidia Triton, NIM, vLLM oder Huggingface TGI/TEI Begeisterung f uuml;r moderne KI-Infrastruktur, Plattformbetrieb und technische Skalierung Teamgeist, Eigeninitiative und die Lust, komplexe Systeme f uuml;r echte Anwendungen nutzbar zu machen Bereitschaft f uuml;r Nacht- und Wochenendeins auml;tze sowie Teilnahme an der Rufbereitschaft Klingt interessant? Wir freuen uns auf die Bewerbung unter Angabe der Kennziffer 703/A! Bewerben Maren Lukas Recruiterin Standort M uuml;nster Nevinghoff 25 M uuml;nster