Was dich erwartet
Als zentrale Figur im Data-Bereich gestaltest du die Infrastruktur, auf der unsere Legal-AI-Agenten basieren. Hunderttausende historische Rechtsfälle werden unter deiner Verantwortung in hochwertige, analysierbare Trainingsdaten überführt – die Grundlage für leistungsstarke, skalierbare Modelle.
* Ausbau unserer Databricks-/Delta-Lakehouse-Infrastruktur (AWS), Entwicklung von DSGVO-konformen Datenmodellen, Data Contracts und nachvollziehbarer Lineage
* Aufbau und Betrieb robuster ELT-Pipelines mit PySpark, dbt und Airflow – inklusive automatisierter Qualitätssicherung, Datenversionierung und Testabdeckung
* Konzeption und Leitung eines skalierbaren Annotationsprozesses: inklusive Tooling, Guidelines und QA für ein 20-köpfiges Paralegal-Team
* Aufbau transparenter, datengetriebener Dashboards (z. B. mit Tableau) zur Erkennung von Bias, Datenlücken und Modellrisiken – adressiert an C-Level und Fachteams
* Entwicklung von Goldstandards, adversarial Testsets und Metriken für Faithfulness, Zitationsgenauigkeit und Alignment – zur systematischen Evaluierung unserer KI-Agenten
* Verantwortung für den RLHF-Datenloop: von der Kuratierung menschlichen Feedbacks über Reward-Modelle bis zur Überwachung von Alignment-Metriken
* Führung, Mentoring und Weiterentwicklung des Data-Teams sowie enge Abstimmung mit AI Engineers, insbesondere bei der Integration von RAG-Workflows und LLM-Evaluation
Was du mitbringst
* Abgeschlossenes Master- oder Promotionsstudium in Data Science, Statistik, Informatik o. ä.
* Mindestens 7 Jahre Erfahrung mit großskaligen Data-Plattformen, idealerweise auf Basis von Databricks/Delta Lake
* Fleißende Englischkenntnisse
* Nachgewiesene Expertise im Aufbau von Annotation-Workflows mit mindestens 10 FTE und Integration in ML-Prozesse
* Tiefes technisches Verständnis von Python, SQL, PySpark und modernen ETL-Standards; sicher im Umgang mit statistischen Tests und experimentellem Design
* Kenntnisse in Vektordatenbanken (z. B. Weaviate, pgvector), LLM-Evaluation und Human-in-the-Loop-Prozessen
* Routine im Umgang mit AWS (S3, Glue, IAM, Lambda) sowie Infrastructure as Code (z. B. Terraform oder Pulumi)
* Sehr gutes Verständnis für Datenschutz, Datensicherheit und regulatorische Rahmenbedingungen (DSGVO)
* Wünschenswert: Erfahrung mit juristischen Textkorpora sowie gute Deutschkenntnisse
Was wir versprechen
Arbeitsumgebung & Flexibilität
* Office-First Company mit der Möglichkeit, 1 Tag pro Woche mobil zu arbeiten
* Modernes, klimatisiertes Büro mit viel Tageslicht
* Zentrale Lage zwischen Gleisdreieck & Potsdamer Platz mit sehr guter Anbindung
* Große Dachterrasse mit atemberaubendem Blick über Berlin
Benefits
* Freie Getränke, frisches Obst und Müsli
* 100 % Übernahme eines Deutschlandtickets für deine Mobilität
* Dein Hund ist ein Teamplayer? Perfekt! Wir freuen uns über tierische Unterstützung im Büro.
* Corporate Benefits Account mit attraktiven Angeboten & Rabatten für viele Marken
* Firmenevents und Teamevents, weil uns Zusammenhalt wichtig ist
* Betriebliche Altersvorsorge mit 20 % Arbeitgeberanteil – wir denken mit dir an die Zukunft
* Spiel & Spaß nach Feierabend: Nintendo Switch, PS5, Dart & Tischkicker warten auf dich
Unternehmenskultur & Zusammenarbeit
* Agiles und modernes Mindset – offene Kommunikation – jede Stimme zählt
* Spannende Aufgabengebiete: praxistaugliches juristisches Wissen
* Wir bieten spannende Aufgaben und praxistaugliches juristisches Wissen – du kannst unsere Reise aktiv mitgestalten.
* Feedback ist bei uns keine Floskel, sondern ein echter Gamechanger: Wir setzen auf gemeinsames Wachstum.
Schneller Bewerbungsprozess:
* Schnelle Rückmeldung
* Ca. 20-minütiges Telefonat mit Recruitingteam /HR
* Ca. 60-minütiges Kennenlernen der Vorgesetzten und des Teams vor Ort
* ca. 30- minütiges Kennenlernen des Managements
* Danach erhältst du dein Angebot