Deine Aufgabenschwerpunkte
* Entwicklung und Produktivsetzung von LLM-basierten Anwendungen für klinische Use Cases (Voice Ambient Dokumentation, Befundprüfung, Voice Agent)
* Betrieb und Skalierung unserer LLM-Inferenz-Infrastruktur (vLLM, Quantisierung, Prefix Caching, Multi-GPU-Serving)
* Konzeption und Umsetzung von Data Pipelines, inkl. DSGVO-konformer synthetischer Datengenerierung und PII-Verarbeitung
* Aufbau und Pflege von GraphRAG-Architekturen sowie Evaluierungs- und Monitoring-Pipelines (Langfuse, eigene Eval-Suiten)
* GitOps-basierte Automatisierung von Build-, Deploy- und Rollout-Prozessen (ArgoCD, Helm/Kustomize)
* Integration von Security- und Compliance-Anforderungen (DSGVO, NIS2, Betriebsrats-Dokumentation, SBOM-Pflege)
* Optimierung bestehender Systeme hinsichtlich Latenz, GPU-Auslastung und Genauigkeit
* Weiterentwicklung unserer internen AI-Plattform und Tools (Backend in Rust, Frontend in Svelte 5)
* Code- und Model-Reviews, Pair Programming, gemeinsame Architekturentscheidungen
Dein Profil
* Programmierung: Sehr gute Kenntnisse in Python; Rust und/oder TypeScript/Svelte sind ein klarer Pluspunkt — wir bauen kritische Komponenten zunehmend in Rust
* KI-Frameworks: Sicherer Umgang mit PyTorch, transformers, vLLM oder vergleichbaren Inferenz-Stacks
* MLOps in der Praxis: Erfahrung mit Kubernetes, GitOps (ArgoCD o. ä.), Container-Builds, Helm/Kustomize
* Datenbanken & Storage: PostgreSQL (idealerweise mit Patroni/StackGres oder vergleichbaren HA-Setups), Vektor-Datenbanken (Qdrant von Vorteil); Erfahrung mit Knowledge Graphs und hybrider Suche willkommen
* KI-Technologien: Praktische Erfahrung mit LLM-Inferenz, LoRA-Fine-Tuning, GraphRAG/RAG, Long-Context-Strategien und Prompt-Engineering
* Fine-Tuning/Posttraining: Vertrautheit mit SFT, DPO/GRPO oder vergleichbaren Verfahren von Vorteil
* Software-Engineering: TDD, automatisierte Tests, Code-Reviews, Clean-Code-Prinzipien — wir liefern Produktionssysteme, keine Notebooks
* Methodik (optional, aber gern gesehen): Mehrjährige Erfahrung in agilen Teams (Scrum/Kanban), eigenverantwortliches Arbeiten in einem kleinen Team mit hoher technischer Verantwortung
* Kommunikation: Sicheres Deutsch und Englisch, Fähigkeit zur Vermittlung komplexer Themen an klinische und nicht-technische Stakeholder
* Compliance-Bewusstsein: Verständnis für DSGVO, NIS2 und Security-Best-Practices im Healthcare-Kontext
* Infrastruktur (optional, aber gern gesehen): Erfahrung mit On-Premises-Kubernetes, Immutable-OS-Konzepten, GPU-Operator, Confidential Computing oder verteilten Storage-Lösungen (z. B. Longhorn, TopoLVM)
Wir bieten Dir die Vorteile eines Marktführers
* Die Sicherheit eines Konzerns und die Flexibilität eines internationalen, modernen Unternehmens
* Ein kompetentes Team mit flachen Hierarchien und hoher Kollegialität
* Hochinnovative und spannende Projekte in vielfältigen KI-Anwendungsfeldern
* Zahlreiche Mitarbeitervorteile für bekannte Marken (Corporate Benefits)
* Betriebliche Altersvorsorge
* Fort- und Weiterbildungsmöglichkeiten über die MEDIAN Akademie
Wir haben Dein Interesse geweckt?
Dann freuen wir uns auf Deine Online-Bewerbung über unser Jobportal.
Deine Fragen beantwortet gern Herr Martin Regulin, HR Manager Schwerpunkt Recruiting, unter Telefon 0151/19509663.
MEDIAN Unternehmenszentrale Berlin
Franklinstraße 28-29 ⋅ 10587 Berlin ⋅ [Website-Link gelöscht]
Wir schätzen Vielfalt und fördern Chancengleichheit, unabhängig von Alter, Herkunft, Geschlecht, Behinderung oder Religion. Bei uns zählt der Mensch mit seiner Persönlichkeit und seinen Kompetenzen.
Wir haben Ihr Interesse geweckt?
Dann freuen wir uns auf Ihre Online-Bewerbung.Wir schätzen Vielfalt und fördern Chancengleichheit, unabhängig von Alter, Herkunft, Geschlecht, Behinderung oder Religion. Bei uns zählt der Mensch mit seiner Persönlichkeit und seinen Kompetenzen.