Aufgaben:
Aktuell sind wir auf der Suche nach einem Data Scientist in Vollzeit.
Ihre Aufgabe;
+ Evaluieren und Vergleichen verschiedener Open-Source-Basismodelle für den jeweiligen Anwendungsfall
+ Fine-Tuning von Large Language Models mit Methoden wie LoRA und QLoRA
+ Aufbereiten, Kuratieren und Validieren von Trainingsdaten
+ Evaluieren von Modellperformance anhand geeigneter Metriken und Benchmarks
+ Experimentieren mit verschiedenen Trainingsstrategien und Hyperparametern
+ Arbeiten auf Cloud-Infrastruktur mit GPU-Ressourcen
+ Dokumentieren von Experimenten und Ergebnissen für Reproduzierbarkeit
Anforderungen:
must:
+ Studium mit Schwerpunkt Informatik, Machine Learning, Mathematik, Computational Linguistics oder vergleichbarer Hintergrund
+ Praktische Erfahrung im Training oder Fine-Tuning von neuronalen Netzen, idealerweise mit Transformer-Architekturen
+ Sicherer Umgang mit Python und dem PyTorch-Ökosystem
+ Überblick über die aktuelle Open-Source-LLM-Landschaft (z. B. Llama, Mistral, Gemma)
+ Vertrautheit mit Cloud-Umgebungen (idealerweise GCP) und Remote-Arbeit auf GPUVMs
+ Verständnis von Evaluationsmetriken für NLP-Tasks
+ Eigenständige, experimentierfreudige Arbeitsweise
+ Identifikation mit der Grundidee des öffentlich-rechtlichen Rundfunks
nice:
+ Erfahrung mit Hugging Face Transformers und PEFT
Zusätzliche Informationen:
Konnten wir Ihr Interesse wecken? Dann freuen wir uns auf die Zusendung Ihres aussagekräftigen Expertenprofils unter Angabe Ihrer Stundensatzvorstellung.