Привет! Я Лёша, руководитель команды Alice AI VLM Reasoning.

Мы учим мультимодальные модели рассуждать: понимать документы, графики, таблицы и интерфейсы, аккуратно распознавать текст (OCR), а также доводим поведение модели до продуктового качества через RLHF. Если вы хотите драйвить мультимодальный reasoning и RL-алайнмент, работать со сложнейшими задачами на стыке текста, картинок и видео и видеть, как ваши ресёрч-прорывы превращаются в продукт Яндекса для миллионов, — ждём вас в команде.

Какие задачи вас ждут

Развивать RL и RLHF для VLM
Вам предстоит переосмыслить методы алайнмента на стыке визуальной и текстовой модальностей: как наградить модель за правильный визуальный reasoning, как отучить её галлюцинировать при описании изображения и как превратить продуктовые требования сервисов Яндекса в функцию награды. Вы будете находить ответы на эти вопросы и внедрять решения в RLHF-пайплайн — так, чтобы поведение модели было предсказуемым, полезным и безопасным.

Развивать reasoning и работу с документами (OCR)
Требуется выйти за пределы простых подписей к фото. Вы будете учить модель рассуждать над сложным визуальным контекстом: разбирать документы, таблицы, графики и интерфейсы, аккуратно распознавать текст (OCR) и безупречно следовать многошаговым инструкциям. Для этого предстоит собирать reasoning-данные и активно экспериментировать с UG-данными и AI-фидбэком.

Разгонять large-scale-обучение до предельных скоростей
RL-loop для мультимодальных моделей — это один из самых сложных инженерных вызовов в современном ML. Вам предстоит ускорять генерацию на лету, профилировать узкие места и добиваться того, чтобы эксперименты крутились кратно быстрее, а GPU не простаивали ни секунды.

Мы ждём, что вы

Отлично знаете классические ML, NLP и CV

Понимаете, как устроены современные LLM или VLM, решали с их помощью прикладные задачи или имеете релевантный исследовательский опыт

Имеете опыт работы с RL или RLHF, post-training или мультимодальным reasoning — или готовы быстро погрузиться в эти направления

Следите за трендами в области LLM и VLM, умеете с ходу отличать хайп от рабочих практик и готовы быстро реализовывать новые идеи

Будет плюсом, если вы

Работали с reasoning-задачами, post-training или RLHF/alignment

Имеете опыт работы с OCR и document understanding: распознавание текста, структуры документов, таблиц и графиков

Обучали большие модели или large-scale ML-системы

Понимаете ограничения современных VLM и следите за трендами в multimodal reasoning

Бенефиты работы в Яндексе

Здоровье
Расширенная медицинская страховка начинает работать с первого месяца в Яндексе. В неё входят:

Базовые услуги
Плановая помощь и неотложная за рубежом, страхование от несчастных случаев для любителей активного отдыха и лечение критических заболеваний.
Ментальное здоровье
Врачи в клиниках по ДМС, онлайн-консультации с психологами. А также психотерапия в офисах, где есть кабинет психотерапевта.
Ежегодные чекапы
Мы за превентивную заботу о здоровье, поэтому по ДМС можно проходить чекапы и регулярно вакцинироваться.
Больничный
30 дней в году оплачиваются — вы получите полную зарплату, как будто не болели.
Стоматология
Плановые процедуры, профессиональная чистка и экстренная помощь за рубежом.
Коррекция зрения
После года работы ДМС покрывает коррекцию зрения и хирургическое лечение косоглазия.
Терапевты в офисах
Если почувствовали себя неважно, можно обратиться в кабинет врача-терапевта, такие есть во всех крупных офисах Яндекса.
Ведение беременности и роды
Оплачиваем ведение беременности и роды для сотрудниц и жён сотрудников, которые с нами более двух лет.
Страховка для родственников по системе 80/20: мы оплачиваем 80% стоимости ДМС для детей и супругов, вы — остальные 20%. В страховку входит всё то же самое, что и у вас.
Больше о бенефитах

Все интересные вам вакансии в одном профиле

Войти и откликнуться

Посмотреть ещё

FinDev

1 июл.

ML Engineer

ЗП не указана, ≈ 249 033 ₽

Cyprus, Poland, Spain, Portugal

Senior

Яндекс

1 июл.