Aufgaben:
Für unserer Kunden sind wir auf der Suche nach einem AI Engineer (m/w/d)
Das Projekt findet remote mit einer Auslastung von 50 - 100% statt.
Ihre Aufgaben:
- Durchführung einer initialen Analyse der fachlichen und technischen Anforderungen basierend auf den Vorgaben und Informationen der internen Stakeholder sowie der Kundenvertreter.
- Konzeption und Implementierung von Generative-AI-, NLP- und Agentic-AI-Lösungen in skalierbaren Architekturen.
- Entwicklung von Generative-AI- und NLP-Systemen zur effektiven Adressierung von Kundenherausforderungen in Bezug auf Performance, Latenz, Kosten, Skalierbarkeit und Komplexität.
- Analyse und Lösung komplexer technischer Fragestellungen im Bereich Generative AI und NLP.
- Planung und Implementierung robuster, skalierbarer und performanter ML-Pipelines unter Berücksichtigung aktueller MLOps- und LLM-Ops-Best Practices auf Infrastrukturen wie Azure, AWS oder GCP.
- Design und Implementierung von Retrieval-augmented Chatbots und Agentensystemen.
- Durchführung von Fine-Tuning von Sprachmodellen zur Effizienzsteigerung von NLP-Pipelines oder für domänenspezifische Sprache.
- Weiterentwicklung interner Kundenprodukte sowie Ausbau des Serviceportfolios.
- Erstellung technischer Marketing- und Thought-Leadership-Inhalte zur Unterstützung des Serviceportfolios.
- Präsentation technischer Lösungsvorschläge.
- Erstellung einer technischen Dokumentation.
Anforderungen:
MUST:
- Fundierte Kenntnisse und mindestens fünf Jahre praktische Erfahrung im Bereich Machine Learning und Deep Learning, insbesondere im Kontext von Transformern, Large Language Models und Generativer KI
- Erfahrung im Einsatz gängiger Tools und Methoden für NLP-Use-Cases, beispielsweise LLM-APIs wie OpenAI Responses API, Bedrock oder Azure AI Foundry, Frameworks wie Instructor, LangChain oder LangGraph, Hugging Face Transformers und Tokenizers, Vektordatenbanken, Model Deployment, Inferenzserver, MCP/A2A sowie in der Erstellung von Datensätzen
- Erfahrung im produktiven Einsatz von Agent-Frameworks wie LangGraph, SmolAgents, OpenAI Agent SDK, CrewAI oder PydanticAI sowie Kenntnisse typischer LLM-basierter Workflows wie Conversational AI, RAG, Information Extraction, Tool Calling und LLM-basierter Evaluation
- Erste Erfahrung in einer Rolle als Technical Lead oder technischer Projektleiter
- Kenntnisse und idealerweise praktische Erfahrung mit modernen Ansätzen wie Agentic RAG, GraphRAG, Multi-Agent-Workflows, Text-to-SQL und Code Retrieval
- Kenntnisse in PEFT-Verfahren wie QLoRA, Instruction Fine-Tuning, Inference-Time-Optimierung, Post-Training und Embeddings sowie ein solides Grundlagenwissen in Frameworks wie PyTorch
- Fähigkeit, sauberen, performanten und erweiterbaren Code zu schreiben und KI-Systeme erfolgreich in den Produktivbetrieb zu überführen
- Erfahrung mit Cloud-basierten Deployments und MLOps-Workflows auf Plattformen wie Azure, GCP oder AWS
- Kommunikationsstärke: souveränes Auftreten, sehr gute Deutschkenntnisse mindestens auf B2-Niveau sowie exzellente Englischkenntnisse auf C1-Niveau oder höher, einschließlich der Fähigkeit, komplexe Inhalte zielgruppengerecht für technische und fachliche Stakeholder aufzubereiten
Zusätzliche Informationen:
Konnten wir Ihr Interesse wecken? Dann freuen wir uns auf die Zusendung Ihres aussagekräftigen Expertenprofils unter Angabe Ihrer Stundensatzvorstellung.