О позиции
Ищем ML Engineer / Data Engineer для участия в проектах, связанных с обработкой данных, построением ML-решений и развитием data-инфраструктуры.
Роль предполагает работу на стороне заказчика в формате outstaff. Конкретные задачи могут зависеть от проекта: от подготовки и обработки данных до разработки ML-моделей, пайплайнов, интеграций и решений для аналитики или автоматизации бизнес-процессов.
Позиция подойдет специалисту, который уверенно работает с Python, данными, ML-инструментами и понимает, как доводить техническое решение до рабочего состояния в продуктовой или проектной среде.
Задачи
- Собирать, обрабатывать и подготавливать данные для аналитических и ML-задач.
- Разрабатывать и поддерживать ETL / ELT-пайплайны.
- Работать с источниками данных, API, базами данных и хранилищами.
- Проводить анализ качества данных, находить и исправлять проблемы в данных.
- Разрабатывать, обучать и тестировать ML-модели.
- Участвовать в построении решений на базе классического ML, NLP, LLM или рекомендательных алгоритмов.
- Интегрировать ML-модели и data-сервисы в существующие продукты и процессы.
- Оптимизировать пайплайны обработки данных и ML-процессы.
- Готовить техническую документацию по реализованным решениям.
- Взаимодействовать с командами разработки, аналитики, продукта и бизнеса.
Требования
- Опыт работы ML Engineer, Data Engineer, Data Scientist или Python Developer с фокусом на данные.
- Уверенное знание Python.
- Опыт работы с библиотеками для обработки данных: Pandas, NumPy, Polars или аналогами.
- Опыт работы с SQL и реляционными базами данных.
- Понимание принципов построения ETL / ELT-процессов.
- Опыт работы с ML-библиотеками: scikit-learn, PyTorch, TensorFlow, XGBoost, CatBoost или аналогами.
- Понимание полного цикла работы с ML-задачами: сбор данных, подготовка датасета, обучение, валидация, тестирование, внедрение.
- Опыт работы с Git.
- Умение разбираться в существующем коде и технической документации.
- Способность самостоятельно декомпозировать задачи и предлагать технические решения.
Будет плюсом
- Опыт работы с облачными платформами: AWS, GCP, Azure.
- Опыт работы с Docker.
- Опыт работы с Airflow, Prefect, Dagster или другими оркестраторами.
- Опыт работы с Kafka, RabbitMQ или другими брокерами сообщений.
- Опыт работы с DWH, Data Lake, BigQuery, ClickHouse, Snowflake или аналогами.
- Опыт вывода ML-моделей в production.
- Опыт работы с MLOps-инструментами.
- Опыт работы с LLM, RAG, embeddings, vector databases.
- Опыт разработки API на FastAPI, Flask или аналогах.
- Английский язык на уровне, достаточном для чтения документации и участия в рабочих коммуникациях.
Мы предлагаем
- Гибкий график, полная удаленка;
- Официальное трудоустройство в аккредитованной IT-компании;
- Возможность оформления по СМЗ/ИП;
- Классная команда и дружная атмосфера;
Присоединяйся к Аспирити! :)