Wir laden Sie ein, unserem Team beizutreten. Lead Data Scientist/Machine Learning EngineerAufgaben:Leitung der ML-Richtung und Roadmap; den Übergang von Ideen zu stabiler Produktion und Skalierung sicherstellen; messbare Auswirkungen auf Gewinn und Verlust nachweisen.Verantwortungsbereiche: Prioritäten der ML-Initiative, Architekturprinzipien, Metriken/Validierungsstandard; Betriebsübersicht: Datensatz-/Funktionsstandards, SRM-Steuerung, Rollout-/Rollback-Richtlinien; Zuverlässigkeit/Beobachtbar
Wir laden Sie ein, unserem Team beizutreten. Lead Data Scientist/Machine Learning Engineer
Aufgaben:Leitung der ML-Richtung und Roadmap; den Übergang von Ideen zu stabiler Produktion und Skalierung sicherstellen; messbare Auswirkungen auf Gewinn und Verlust nachweisen.
Verantwortungsbereiche:
- Prioritäten der ML-Initiative, Architekturprinzipien, Metriken/Validierungsstandard;
- Betriebsübersicht: Datensatz-/Funktionsstandards, SRM-Steuerung, Rollout-/Rollback-Richtlinien;
- Zuverlässigkeit/Beobachtbarkeit von Diensten (SLO/SLI, Alarmierung, kostenbewusste Inferenz), einschließlich Edge-Szenarien;
- Technische Führung: Einstellung/Mentoring, Überprüfung, Forschung und Wissenskultur;
- Datenverwaltung: PII, Zugriff, Herkunft, Modellkarten/Dokumentation;
- Experimentelle Plattform: Ereignisse, Schichtung, Inkrementalität;
- Preis-/Promomodelle mit Elastizitäten, Kannibalisierung, Regal-/Lagergrenzen; Missionspersonalisierung;
- Synchronisierung von ML-Zielen mit Budget/Plan, transparente Wirkungsberichterstattung;
Erwartete Ergebnisse (OKR-Beispiele):
- NDCG@K > 2 v.p. in der Personalisierung (A/B, statistische Signifikanz)
- Wartungswachstum aufgrund eines relevanten Promo-Mix innerhalb der Kontrollkorridore.
Anforderungen:
- 5+ Jahre in ML/DS, 2+ Jahre als Lead/Tech Lead;
- Nachgewiesene Erfahrung im Aufbau und der Einführung von On-Prem-ML-Diensten mit Filial-/Regionsreplikation;
- Fälle in CV/Recsys/TS mit nachgewiesener geschäftlicher Auswirkung; Produktions-Python/SQL; MLOps-Praktiken, Tests, Überwachung;
- Ereignisse (Streaming) und Batch, Modellüberwachung (Drifts/Stabilität/Verschlechterungen), Versuchsplanung, Geschäftskommunikation.
Wird von Vorteil sein:
- Multimodale Funktionen/LLM-Signale für Kaltstart; inventarbewusste Recsys; Werbeoptimierung;
- Funktionsverträge/Herkunfts-/Metadatenverwaltung; Inferenzkostenoptimierung (ONNX/TensorRT/Quantisierung);
- Edge-Inferenz in Hall/SCO, Betrugsbekämpfung.
Technischer Stack (on-prem):
Rollen/Modelle
- CV: Python, PyTorch, OpenCV, Albumentations, YOLOv8–v10 oder Detectron2, TrOCR oder Tesseract.
- Recsys: NVIDIA Merlin/Transformers4Rec, implizit (ALS), LightFM, TS Neuordnung/Prognose: LightGBM, CatBoost, XGBoost, N-BEATS, N-HiTS, TFT
- Vektoren: FAISS, pgvector, Milvus | Qdrant. Pandas/Polars für die lokale Verarbeitung.
NLP/LLM-Plattform
- NLP-Kern: Hugging Face Transformers, Datasets, Tokenizers, SentencePiece, spaCy|Stanza (UK), Sacremoses.
- LLM-Portion: vLLM|Hugging Face TGI; TensorRT-LLM|llama.cpp/gguf (nach Ressourcenprofil).
- RAG: OpenSearch (BM25) plus Re-Ranker, Chunking und Ingest, Hybridsuche mit FAISS|pgvector oder Milvus|Qdrant.
- Bewertung: ROUGE, BLEU, METEOR, BERTScore, MTEB, Recall@K, MRR, NDCG. Sicherheit/PII: Microsoft Presidio.
MLOps/Bereitstellung/Experimente
- MLflow (Tracking/Registrierung/Bereitstellung)
- Bereitstellung: NVIDIA Triton | KServe | Seldon-Kern | Ray Serve
- Feature Store: Feast (selbst gehostet)
Daten- und Verarbeitungsplattform
- Streaming: Kafka | Redpanda
- Berechnen: Spark| Flink
- Orchestrierung: Airflow | Dagster
- Transformationen: dbt Core
- SQL/Storefronts: PostgreSQL, ClickHouse
Datenspeicherung und Architektur
- Lakehouse: Apache Iceberg | Delta Lake
- Formate: Parquet, ORC
- Objektspeicher: MinIO | CEPH
Beobachtbarkeit/Qualität
- Service-Beobachtbarkeit: Prometheus, Grafana, Loki
- ML-Beobachtbarkeit: Evidently, whylogs
- Abstammung/Verzeichnis: OpenLineage, OpenMetadata oder DataHub
Infrastruktur und Sicherheit
- Containerisierung/Cluster: Docker, Kubernetes | OpenShift
- Sicherheit: Policy-as-Code, Vault Secret Management | Sealed Secrets
Auftrittsvertrag oder im Staat (Reservierung möglich);
bezahlter Jahresurlaub von 24 Kalendertagen, bezahlter Krankenurlaub;regelmäßige Lohnauszahlung ohne Verzögerungen und in den vereinbarten Mengen, regelmäßige Gehaltsüberprüfung;Möglichkeit beruflicher und beruflicher Laufbahn Entwicklung;Schulungen.
Ansprechpartner: Kateryna, Tel.0984567857 (t.me/KaterynaB_HR)