Aufgaben:
Für unserer Kunden sind wir auf der Suche nach einem AI Engineer (m/w/d)
Das Projekt findet remote mit einer Auslastung von 50 - 100% statt.
Ihre Aufgaben:
- Analyse der Kundenanforderungen und Use Cases zur Identifikation von Optimierungspotenzialen in Performance, Latenz, Kosten, Erweiterbarkeit und Komplexität.
- Erstellung von Konzepten für Generative-AI- und NLP-Systeme, die auf die spezifischen Anforderungen der Kunden abgestimmt sind.
- Entwicklung und Implementierung von robusten, erweiterbaren und performanten ML-Pipelines unter Berücksichtigung aktueller MLOps- oder LLM-Ops-Best-Practices.
- Implementierung von Use Cases wie Wissensmanagement mit Retrieval-augmented Chatbots, Agentensystemen oder Fine-Tuning von Sprachmodellen zur Effizienzsteigerung von NLP-Pipelines oder domänenspezifischer Sprache.
- Fachliche Unterstützung bei der Entwicklung von Produkten und Leistungsportfolios.
- Erstellung einer technischen Dokumentation.
Anforderungen:
MUST:
- Fundierte Kenntnisse sowie mindestens zwei Jahre praktische Erfahrung im Bereich Machine Learning und Deep Learning, insbesondere im Kontext von Transformern, Large Language Models (LLMs) und Generativer KI
- Erfahrung im Einsatz gängiger Tools und Methoden für NLP-Use-Cases, z. B. LLM-APIs wie OpenAI Responses API, Amazon Bedrock oder Azure AI Foundry, Frameworks wie Instructor, LangChain oder LangGraph, Hugging Face Transformers und Tokenizers, Vektordatenbanken, Model Deployment, Inferenzserver, MCP/A2A sowie in der Erstellung und Aufbereitung von Datensätzen
- Erfahrung im produktiven Einsatz von Agent-Frameworks wie LangGraph, SmolAgents, OpenAI Agent SDK, CrewAI oder PydanticAI sowie Kenntnisse typischer LLM-basierter Workflows wie Conversational AI, RAG, Information Extraction, Tool Calling und LLM basierter Evaluation
- Kenntnisse und idealerweise praktische Erfahrung mit modernen Ansätzen wie Agentic RAG, GraphRAG, Multi-Agent-Workflows, Text-to-SQL und Code Retrieval
- Erste Erfahrungen mit Cloud-Deployments und MLOps, z. B. auf Azure, Google Cloud Platform (GCP) oder AWS
- Sehr gute Deutschkenntnisse (mindestens B2) sowie Englischkenntnisse auf C1 Niveau; Fähigkeit, komplexe Inhalte zielgruppengerecht für Business- und Tech-Stakeholder aufzubereiten
Zusätzliche Informationen:
Konnten wir Ihr Interesse wecken? Dann freuen wir uns auf die Zusendung Ihres aussagekräftigen Expertenprofils unter Angabe Ihrer Stundensatzvorstellung.