Мы ищем Senior ML Engineer для создания инфраструктуры машинного обучения для системы скоринга удержания пользователей. Это greenfield-проект: вы будете первым ML-инженером в команде и построите платформу с нуля — от обработки данных и feature engineering до production-инференса и мониторинга.
Ваша задача — создать надежную ML-инфраструктуру: воспроизводимые данные и признаки, стабильный процесс обучения моделей, batch и near-real-time инференс, а также систему мониторинга и автоматического переобучения.
Инфраструктура данных и признаков
Разработка и поддержка time-based feature pipelines (rolling windows, накопительные и decay-метрики)
Обеспечение полного соответствия признаков между обучением и инференсом
Возможность воспроизводить датасеты для любой даты скоринга
Production-внедрение моделей
Вывод в production моделей для табличных данных (CatBoost / XGBoost)
Упаковка обучения и инференса в модульные сервисы (batch → real-time)
Версионирование данных, признаков и моделей
Мониторинг и надежность
Мониторинг качества данных и дрейфа распределений
Отслеживание деградации моделей
Настройка алертов и процедур быстрого восстановления
Архитектура
Проектирование простой и экономичной инфраструктуры в облаке
Использование Docker-first подхода
Kubernetes — там, где это действительно необходимо
Минимизация vendor lock-in
Рабочий batch-pipeline скоринга end-to-end
Feature pipeline с окнами 7/14/30/60 дней
Воспроизводимые запуски обучения (MLflow или аналог)
Настроенный мониторинг качества данных
Краткая документация по эксплуатации системы
Языки: Python (экспертный уровень), SQL
ML: CatBoost / XGBoost, работа с табличными данными
Serving: FastAPI, Docker, Kubernetes
MLOps: MLflow, Airflow / Prefect / Dagster
Cloud: AWS или аналогичные решения
CI/CD: GitHub Actions / GitLab CI
Будет плюсом: dbt
От 3 лет опыта в ML Engineering / MLOps
Опыт вывода ML-моделей в production
Работа с транзакционными или событийными табличными данными
Понимание time-based feature engineering и data leakage
Уверенная работа с Docker и масштабированием сервисов
Инженерный подход: тестируемый, модульный production-код
Опыт в высоконагруженных продуктовых системах
Знание ClickHouse / Kafka / Spark
Опыт внедрения explainability (например, SHAP)
Возможность с нуля построить ML-платформу и влиять на архитектуру
Реальное влияние на ключевые продуктовые метрики
Работа в команде, создающей новый AI-продукт
Конкурентную заработную плату
Профессиональный рост и технологически сложные задачи