Zapraszamy do dołączenia do naszego zespołu Główny analityk danych/Inżynier uczenia maszynowegoObowiązki:kierowanie kierunkiem i planem ML; zapewnić przejście od pomysłów do stabilnej produkcji i skalowania; wykazać wymierny wpływ na zyski i straty.Obszary odpowiedzialności: Priorytety inicjatywy ML, zasady architektoniczne, metryki/standard walidacji; Zarys operacyjny: standardy zbiorów danych/funkcji, kontrola SRM, zasady wdrażania/wycofywania; Niezawodność/obserwowalność usług (SLO/SLI, alert
Zapraszamy do dołączenia do naszego zespołu Główny analityk danych/Inżynier uczenia maszynowego
Obowiązki:kierowanie kierunkiem i planem ML; zapewnić przejście od pomysłów do stabilnej produkcji i skalowania; wykazać wymierny wpływ na zyski i straty.
Obszary odpowiedzialności:
- Priorytety inicjatywy ML, zasady architektoniczne, metryki/standard walidacji;
- Zarys operacyjny: standardy zbiorów danych/funkcji, kontrola SRM, zasady wdrażania/wycofywania;
- Niezawodność/obserwowalność usług (SLO/SLI, alerty, wnioskowanie uwzględniające koszty), w tym scenariusze brzegowe;
- Przywództwo techniczne: zatrudnianie/mentoring, przegląd, badania i kultura wiedzy;
- Zarządzanie danymi: informacje umożliwiające identyfikację, dostęp, pochodzenie, mapy/dokumentacja modeli;
- Platforma eksperymentalna: zdarzenia, stratyfikacja, przyrost;
- Modele cenowe/promocyjne z elastycznością, kanibalizmem, limitami półek/zapasów; personalizacja misji;
- Synchronizacja celów ML z budżetem/planem, przejrzyste raportowanie wpływu;
Oczekiwane rezultaty (przykłady OKR):
- NDCG@K > 2 v.p. w zakresie personalizacji (A/B, istotność statystyczna)
- Wzrost w zakresie utrzymania dzięki odpowiedniemu zestawowi promocji w korytarzach kontrolnych.
Wymagania:
- 5 lat w ML/DS, ponad 2 lata jako lider/technologia;
- Udokumentowane doświadczenie w budowaniu i wprowadzaniu do produkcji lokalnych usług ML z replikacją sklepu/regionu;
- Przypadki w CV/Recsys/TS o udowodnionym efekcie biznesowym; produkcja-Python/SQL; Praktyki MLOps, testowanie, monitorowanie;
- Zdarzenia (streaming) i wsadowe, monitorowanie modeli (dryfty/stabilność/degradacje), projektowanie eksperymentów, komunikacja biznesowa.
Będzie dodatkowym atutem:
- Funkcje multimodalne/sygnały LLM do zimnego rozruchu; recsy uwzględniające stan zapasów; optymalizacja promocji;
- Zarządzanie umowami dotyczącymi funkcji/pochodzeniem/metadanymi; optymalizacja kosztów wnioskowania (ONNX/TensorRT/kwantyzacja);
- Wnioskowanie brzegowe w hali/SCO, ochrona przed oszustwami.
Stos techniczny (on-prem):
Role/modele
- CV: Python, PyTorch, OpenCV, Albumentations, YOLOv8–v10 lub Detectron2, TrOCR lub Tesseract.
- Recsys: NVIDIA Merlin/Transformers4Rec, implicit (ALS), LightFM, zmiana kolejności/prognoza TS: LightGBM, CatBoost, XGBoost, N-BEATS, N-HiTS, TFT
- Wektory: FAISS, pgvector, Milvus | Qdrant. Pandy/Polary do lokalnego przetwarzania.
Platforma NLP/LLM
- Rdzeń NLP: Hugging Face Transformers, Datasets, Tokenizers, SentencePiece, spaCy|Stanza (UK), Sacremoses.
- LLM serwująca: vLLM|Przytulająca twarz TGI; TensorRT-LLM|llama.cpp/gguf (według profilu zasobów).
- RAG: OpenSearch (BM25) plus zmiana rankingu, dzielenie i pozyskiwanie, wyszukiwanie hybrydowe za pomocą FAISS|pgvector lub Milvus|Qdrant.
- Ocena: ROUGE, BLEU, METEOR, BERTScore, MTEB, Recall@K, MRR, NDCG. Bezpieczeństwo/PII: Microsoft Presidio.
MLOps/Udostępnianie/eksperymenty
- MLflow (śledzenie/rejestrowanie/Udostępnianie)
- Udostępnianie: NVIDIA Triton | KServ | Rdzeń Seldona | Ray Serve
- Sklep z funkcjami: Uczta (samodzielny hosting)
Platforma danych i przetwarzania
- Streaming: Kafka | Redpanda
- Obliczenia: Spark| Flink
- Orkiestracja: przepływ powietrza | Dagster
- Transformacje: dbt Core
- SQL/Storefronts: PostgreSQL, ClickHouse
Przechowywanie i architektura danych
- Lakehouse: Apache Iceberg | Delta Lake
- Formaty: parkiet, ORC
- Przechowywanie obiektów: MinIO | CEPH
Obserwowalność/jakość
- Obserwowalność usługi: Prometheus, Grafana, Loki
- Obserwowalność ML: Ewidentnie, dlaczego logi
- Linia/katalog: OpenLineage, OpenMetadata lub DataHub
Infrastruktura i bezpieczeństwo
- Konteneryzacja/klaster: Docker, Kubernetes | OpenShift
- Bezpieczeństwo: zasady jako kod, zarządzanie tajemnicą Vault | Sealed Secrets
kontrakt na koncert lub w stanie (możliwa rezerwacja);
płatny coroczny urlop w wymiarze 24 dni kalendarzowych, płatne zwolnienie lekarskie;regularna wypłata wynagrodzenia bez opóźnień i w ustalonych wysokościach, regularna kontrola wynagrodzenia;możliwość pracy zawodowej i kariery rozwój;szkolenia.
Osoba kontaktowa: Kateryna, tel.0984567857 (t.me/KaterynaB_HR)