Westhouse ist eines der führenden internationalen Recruitment Unternehmen für die Vermittlung von hochqualifizierten Fachexperten in Bereichen wie IT Life Cycle, SAP, Engineering, Kaufmännischem und Fachberatung.
Für unseren Kunden suchen wir aktuell eine/n Data Scientist – Knime (m/w/d) - Remote, Frankfurt am Main.
Ihre Aufgaben
1. Beratung und Durchführung der Architekturkonzeption für ein einheitliches, skalierbares und sicheres Data-Lakehouse auf Basis von Azure Databricks unter Berücksichtigung von Performance-, Sicherheits-, Governance- und Betriebsanforderungen
2. Erarbeitung und Umsetzung einer Zielarchitektur für ein cloudbasiertes Data Lakehouse einschließlich logischer und physischer Architektur, Schichtenmodell (z. B. Bronze/Silver/Gold), Mandantenfähigkeit und Erweiterbarkeit
3. Durchführung des technischen Aufbaus und der Konfiguration der Data-Lakehouse-Plattform in Azure Databricks, einschließlich Workspace-Strukturen, Zugriffsmodellen, Unity Catalog, Identitäts- und Berechtigungskonzepten (Azure Active Directory)
4. Konzeption und Umsetzung der Nutzung zentraler Speichersysteme (Azure Data Lake Storage Gen2 und AWS S3) als persistente Datenebene für strukturierte, semi-strukturierte und unstrukturierte Da-ten
5. Beratung und Durchführung der Migration der bestehenden KNIME Analytics Platform und des KNIME Business Hub in die Zielarchitektur, einschließlich Analyse der bestehenden Workflows, Abhängigkeiten und Betriebsmodelle
6. Erarbeitung und Umsetzung eines Migrationskonzepts für KNIME-basierte Datenverarbeitungspro-zesse unter Berücksichtigung von Datenintegrität, Nachvollziehbarkeit, Performance und Betriebsstabilität
7. Durchführung der technischen Anpassung und Transformation bestehender Analyse- und Datenverarbeitungslogiken zur Integration in das Data-Lakehouse-Konzept (z. B. Ablösung oder Neustrukturierung von KNIME-Workflows)
8. Erarbeitung und Standardisierung von Workflow-, Pipeline- und Komponenten-Templates zur einheitlichen Entwicklung, Wartung und Erweiterung von Datenverarbeitungsprozessen (z. B. ETL/ELT, Batch- und Streaming-Verarbeitung)
9. Durchführung der Automatisierung von Entwicklungs-, Test- und Bereitstellungsprozessen (z. B. CI/CD) für Datenpipelines, Konfigurationsartefakte und Plattformkomponenten
10. Konzeption und Umsetzung von Betriebs-, Monitoring- und Fehlerbehandlungsmechanismen für die Data-Lakehouse-Plattform und die migrierten Analyseprozesse
11. Erarbeitung von Dokumentationen, Architektur- und Betriebskonzepten zur nachhaltigen Nutzung, Erweiterung und Wartung der Plattform
12. Durchführung von Workshops und Wissenstransfermaßnahmen zur Vermittlung der Zielarchitektur, Migrationsansätze, Standards und Best Practices im Kontext Data Lakehouse und KNIME-Migration
Interessiert?
Sven Schäfer
Tel.:
Fax.:
Email:
Stellenanzeige teilen
Ihre Qualifikationen
13. (MUSS) 5 Jahre Erfahrung im Umgang mit Databricks (Workspace, Notebooks, MLflow, Delta Lake, Datenvirtuali-sierung und Data-Sharing-Konzepten)
14. (MUSS) 5 Jahre Erfahrung mit typische Senior-Data-Scientist-Aufgaben im Customer-Analytics-Um-feld (z. B. Entwicklung und Operationalisierung von ML-Modellen, Feature Engineering, Modellvalidierung und -überwachung, Aufbau produktionsreifer ML-Pipe-lines, Migration analytischer Workloads von KNIME nach Azure Databricks, Anwendung der Medallion-Architektur sowie Einsatz von MLflow/MLOps)
15. (MUSS) Erfahrung in der Architektur und Umsetzung produktiver KI-Lösungen auf Databricks Azure aus 5 Projekten
16. (MUSS) 5 Jahre Erfahrung in den im Technologiekatalog geforderten Bereichen eines Senior Data Scientist (z. B. Spark/PySpark, Azure Databricks/Delta Lake, MLflow/MLOps, Feature Engineering (Feature Store, PySpark, Dataframes, ETL-Prozesse, Datenmodellierung)
17. (SOLL) Besitz des ML Engineer Badge von Databricks
18. (SOLL) 5 Jahre Erfahrung in der Implementierung von Data- und ML-Governance auf Basis von Azure Databricks, einschließlich Nutzung der MLflow Model Re-gistry mit Freigabe-/Approval-Workflows, Monitoring sowie Er-kennung und Management von Modell-Drift und Bias.
19. (SOLL) Deutsch in Wort und Schrift – Level B2 / C1 / C2 etc. oder äquivalent.