Als AI Application Engineer (m/w/d) entwirfst und entwickelst du KI-gestützte Anwendungen und Produktfunktionen für Unternehmenskunden. Zu deinen Aufgaben gehören:
1. Konzeption und Entwicklung von KI-Anwendungen wie Enterprise-Assistenten, Copiloten, semantischen Suchplattformen und Automatisierungssystemen
2. Entwicklung von LLM-basierten Lösungen (inkl. RAG) sowie End-to-End-KI-Produkten unter Integration von APIs, Unternehmensdaten und Backend-Services
3. Aufbau skalierbarer KI-Microservices, APIs sowie Vektorsuche-, Embedding- und Retrieval-Systeme
4. Schnelles Prototyping von KI-Features und deren Weiterentwicklung zu produktiven Systemen
5. Enge Zusammenarbeit mit Produktmanagern, Designern, KI-Ingenieuren und Kunden zur Entwicklung wirkungsvoller Lösungen
6. Deployment von KI-Systemen in Cloud- und Produktionsumgebungen unter Nutzung moderner DevOps-Praktiken
7. Sicherstellung von Zuverlässigkeit, Skalierbarkeit und Observability durch CI/CD, Monitoring und containerisierte Deployments
8. Regelmäßige und systematische (externe und interne) Weiterbildungsmöglichkeiten in den Bereichen Generative AI, LLM-Entwicklung, Cloud-Architektur und Data Science
9. Arbeit in einer offenen, flachen Umgebung, innerhalb eines breiten Reply-Netzwerks zum Wissensaustausch
10. Preisgekrönte Büroräume in der Münchner Innenstadt mit Zugang zur Stammstrecke
11. Fahrkarte für öffentliche Verkehrsmittel mit Deutschlandticket
12. Beteiligung an deinen sportlichen Aktivitäten über den EGYM Wellpass und weitere Benefits der Reply Gruppe
13. Flexible Arbeitsumgebung zwischen Kunden, Reply-Büro und Remote-Arbeit
14. Abgeschlossenes Studium in Informatik, Software Engineering, Data Science oder einem vergleichbaren technischen Bereich
15. Sehr gute Programmierkenntnisse in Python und modernen Backend-Frameworks sowie Erfahrung mit KI-, Machine-Learning- und generativen KI-Anwendungen
16. Erfahrung in der Entwicklung skalierbarer Backend-Systeme, APIs und Microservices sowie Kenntnisse in RAG, Vektordatenbanken und Retrieval-Technologien
17. Praxis in Containerisierung und DevOps (z. B. Docker, CI/CD, Kubernetes) sowie Deployment von KI-Services in Cloud-Umgebungen (AWS, Azure, GCP)
18. Erfahrung mit relevanten Frameworks (z. B. LangChain, LlamaIndex, Hugging Face)
19. Kenntnisse in Monitoring, Observability sowie Evaluation und Optimierung von LLM-Systemen
20. Sehr gute Deutsch- und Englischkenntnisse für Workshops und Kommunikation
Machine Learning Reply bietet maßgeschneiderte End-to-End-Lösungen im Data-Science-Bereich an, die den gesamten Projektlebenszyklus abdecken – von der initialen Strategieberatung über die Datenarchitektur und Infrastrukturthemen bis hin zur Datenverarbeitung und Qualitätssicherung unter Verwendung von Machine-Learning-Algorithmen. Machine Learning Reply verfügt über umfassende Expertise im Bereich der Datenwissenschaft in allen Schlüsselindustrien der deutschen HDAX-Unternehmen. Machine Learning Reply befähigt seine Kunden, neue datenbasierte Geschäftsmodelle erfolgreich einzuführen sowie bereits bestehende Prozesse und Produkte zu optimieren – mit einem Schwerpunkt auf Open-Source- und Cloud-Technologien. Mit dem Machine Learning Incubator bietet das Unternehmen ein Programm zur Ausbildung der nächsten Generation von Entscheidungsträgern, Data Scientists und Entwicklern an.