Разрабатывать, обучать и внедрять DL-модели для задач: генерация, классификация, сегментация, семантическая схожесть и другие.
Исследовать и применять LLM для создания агентных пайплайнов, решающих сложные задачи для пользователей.
Проектировать и реализовывать полный ML-пайплайн: от данных до бизнес-метрик.
Оптимизировать и ускорять инференс DL-моделей для production.
Проводить эксперименты на мощном железе, включая кластеры с GPU H100.
Требования
Опыт работы в ML/DL от пяти лет.
Глубокие теоретические знания в ML, DL и особенно в NLP.
Практический опыт с PyTorch и Hugging Face.
Способность самостоятельно формализовать, спроектировать и реализовать ML-пайплайн: от сбора и подготовки данных до выбора архитектуры, обучения, валидации и внедрения.
Умение корректно оценивать качество моделей, подбирать и интерпретировать метрики.
Готовность работать в research-ориентированной среде, генерировать и проверять гипотезы.
Будет плюсом
Понимание или опыт работы с архитектурами Encoder, Decoder, Encoder-Decoder.
Знание методов ускорения DL-моделей (квантование, дистилляция, оптимизация инференса).
Опыт с PyTorch, Hugging Face Transformers, PyTorch Lightning, TensorRT-LLM или аналогичными фреймворками.
Опыт работы с большими языковыми моделями (LLM) и построением агентных пайплайнов.
Готовность участвовать в командных обсуждениях, делиться идеями и предлагать нестандартные решения.