Мы — команда, разрабатывающая аналитическую платформу. Одна из задач команды – объединить аналитику, обучение моделей и их внедрение в продукт для различных команд Авиасейлс на базе дата платформы. Наша цель – создать универсальную структуру, которая позволит эффективно интегрировать разные модели.
Что нужно делать
- проектирование и сопровождение дата пайплайнов необходимых для работы МЛ платформы;
- разработка и поддержка офлайн (batch) сервисов обучения и инференса ML-моделей;
- деплоить модели в продакшн, обеспечивать их стабильность работы и масштабируемость, разрабатывать систему мониторинга;
- анализировать качество моделей;
- сотрудничать с разными командами разработки и аналитики для интеграции моделей в прод.
Чего ждём от тебя
- опыт работы в Data Engineering/ML не менее 3 лет;
- уверенное владение SQL, Python. Понимание Lakehouse концепций;
- опыт работы с построением моделей (линейные/деревянные модели, ансамбли) для разных задач (регрессия, классификация, кластеризация, временные ряды и так далее);
- навыки работы с контейнерами (Docker, Kubernetes), CI/CD(Jenkins), мониторингом (Prometheus, Grafana);
- желание и способность работать в команде, обмениваться знаниями и опытом.
Будет плюсом:
- опыт с Apache Airflow, DBT, Apache Spark, Trino, Kafka, ClickHouse, S3, MLFlow;
- умение анализировать качество моделей с использованием различных классических и кастомных метрик;
- опыт работы с большими объемами данных и оптимизацией производительности моделей.
Как мы работаем
- в любой точке мира: не привязываемся к локации, платим в долларах, любим путешествовать;
- без бюрократии: удобные процессы здорового человека, горизонтальные и открытые коммуникации, быстрое обсуждение идей и принятие решений;
- компенсируем: ДМС, психотерапию или иностранные языки, занятия спортом и больничный;
- на райском острове: можно работать на Пхукете с видом на океан.