Приглашаем вас присоединиться к нашей команде. Ведущий специалист по данным/инженер по машинному обучениюОбязанности:руководство направлением и дорожной картой машинного обучения; обеспечить переход от идей к стабильному производству и масштабированию; продемонстрировать измеримое влияние на прибыль и убытки.Области ответственности: Приоритеты инициатив ML, архитектурные принципы, метрики/стандарты проверки; Операционная схема: стандарты наборов данных/функций, контроль SRM, политики развертыван
Приглашаем вас присоединиться к нашей команде. Ведущий специалист по данным/инженер по машинному обучению
Обязанности:руководство направлением и дорожной картой машинного обучения; обеспечить переход от идей к стабильному производству и масштабированию; продемонстрировать измеримое влияние на прибыль и убытки.
Области ответственности:
- Приоритеты инициатив ML, архитектурные принципы, метрики/стандарты проверки;
- Операционная схема: стандарты наборов данных/функций, контроль SRM, политики развертывания/отката;
- Надежность/наблюдаемость услуг (SLO/SLI, оповещения, анализ затрат), включая пограничные сценарии;
- Техническое лидерство: найм/наставничество, проверка, исследования и культура знаний;
- Управление данными: персональные данные, доступ, происхождение, карты моделей/документация;
- Экспериментальная платформа: события, стратификация, инкрементальность;
- Модели ценообразования/промоакции с эластичностью, каннибализацией, ограничениями на полках/запасах; персонализация миссии;
- Синхронизация целей МО с бюджетом/планом, прозрачная отчетность о влиянии;
Ожидаемые результаты (примеры OKR):
- NDCG@K > 2 в.п. в персонализации (A/B, статистическая значимость)
- Рост обслуживания за счет соответствующего промо-микса в коридорах управления.
Требования:
- 5+ лет в ML/DS, 2+ года в качестве ведущего/технического руководителя;
- Подтвержденный опыт создания и внедрения в производство локальных сервисов ML с репликацией в магазине/регионе;
- Кейсы в CV/Recsys/TS с доказанным бизнес-эффектом; производство — Python/SQL; Практика MLOps, тестирование, мониторинг;
- События (потоковые) и пакетные, мониторинг моделей (дрейфы/стабильность/деградации), планирование экспериментов, бизнес-коммуникации.
Будет плюсом:
- Мультимодальные функции/LLM-сигналы для холодного запуска; resys с учетом запасов; оптимизация продвижения;
- Контракты функций/происхождение/управление метаданными; оптимизация затрат на вывод (ONNX/TensorRT/квантование);
- Edge Inference в зале/SCO, защита от мошенничества.
Технический стек (локально):
Роли/модели
- Резюме: Python, PyTorch, OpenCV, Albumementations, YOLOv8–v10 или Detectron2, TrOCR или Tesseract.
- Recsys: NVIDIA Merlin/Transformers4Rec, неявное (ALS), LightFM, переупорядочение/прогноз TS: LightGBM, CatBoost, XGBoost, N-BEATS, N-HiTS, TFT.
- Векторы: FAISS, pgvector, Milvus | Кдрант. Pandas/Polars для локальной обработки.
Платформа NLP/LLM
- Ядро NLP: Hugging Face Transformers, Datasets, Tokenizers, SentencePiece, spaCy|Stanza (uk), Sacremoses.
- Обслуживание LLM: vLLM|Hugging Face TGI; TensorRT-LLM|llama.cpp/gguf (по профилю ресурса).
- RAG: OpenSearch (BM25) плюс повторное ранжирование, фрагментирование и поглощение, гибридный поиск с FAISS|pgvector или Milvus|Qdrant.
- Оценка: ROUGE, BLEU, METEOR, BERTScore, MTEB, Recall@K, MRR, NDКГ. Безопасность/личные данные: Microsoft Presidio.
MLOps/Обслуживание/эксперименты
- MLflow (Отслеживание/Реестр/Обслуживание)
- Обслуживание: NVIDIA Triton | КСерве | Селдон Ядро | Ray Serve
- Магазин функций: Feast (самостоятельный хостинг)
Платформа обработки данных и обработки
- Потоковая передача: Kafka | Redpanda
- Вычислить: Spark| Flink
- Оркестровка: Airflow | Dagster
- Преобразования: dbt Core
- SQL/Витрины: PostgreSQL, ClickHouse
Хранение данных и архитектура
- Lakehouse: Apache Iceberg | Delta Lake
- Форматы: Parquet, ORC
- Объектное хранилище: MinIO | CEPH
Наблюдаемость/качество
- Наблюдаемость сервисов: Prometheus, Grafana, Loki
- Наблюдаемость ML: Очевидно, журналы причин
- Lineage/каталог: OpenLineage, OpenMetadata или DataHub
Инфраструктура и безопасность
- Контейнеризация/кластер: Докер, Кубернетес | OpenShift
- Безопасность: политика как код, управление секретами хранилища | Seled Secrets
контракт или по штату (возможна бронь);
оплачиваемый ежегодный отпуск продолжительностью 24 календарных дня, оплачиваемый больничный;регулярная выплата заработной платы без задержек и в оговоренных объемах, регулярный пересмотр заработной платы;возможность профессионального и карьерного роста развитие;курсы повышения квалификации.
Контактное лицо: Екатерина, тел.0984567857 (t.me/KaterynaB_HR)