Привет! Я Лёша, руководитель команды Alice AI VLM Reasoning.
Мы учим мультимодальные модели рассуждать: понимать документы, графики, таблицы и интерфейсы, аккуратно распознавать текст (OCR), а также доводим поведение модели до продуктового качества через RLHF. Если вы хотите драйвить мультимодальный reasoning и RL-алайнмент, работать со сложнейшими задачами на стыке текста, картинок и видео и видеть, как ваши ресёрч-прорывы превращаются в продукт Яндекса для миллионов, — ждём вас в команде.
Какие задачи вас ждут
- Развивать RL и RLHF для VLM
Вам предстоит переосмыслить методы алайнмента на стыке визуальной и текстовой модальностей: как наградить модель за правильный визуальный reasoning, как отучить её галлюцинировать при описании изображения и как превратить продуктовые требования сервисов Яндекса в функцию награды. Вы будете находить ответы на эти вопросы и внедрять решения в RLHF-пайплайн — так, чтобы поведение модели было предсказуемым, полезным и безопасным.
- Развивать reasoning и работу с документами (OCR)
Требуется выйти за пределы простых подписей к фото. Вы будете учить модель рассуждать над сложным визуальным контекстом: разбирать документы, таблицы, графики и интерфейсы, аккуратно распознавать текст (OCR) и безупречно следовать многошаговым инструкциям. Для этого предстоит собирать reasoning-данные и активно экспериментировать с UG-данными и AI-фидбэком.
- Разгонять large-scale-обучение до предельных скоростей
RL-loop для мультимодальных моделей — это один из самых сложных инженерных вызовов в современном ML. Вам предстоит ускорять генерацию на лету, профилировать узкие места и добиваться того, чтобы эксперименты крутились кратно быстрее, а GPU не простаивали ни секунды.
Мы ждём, что вы
- Отлично знаете классические ML, NLP и CV
- Понимаете, как устроены современные LLM или VLM, решали с их помощью прикладные задачи или имеете релевантный исследовательский опыт
- Имеете опыт работы с RL или RLHF, post-training или мультимодальным reasoning — или готовы быстро погрузиться в эти направления
- Следите за трендами в области LLM и VLM, умеете с ходу отличать хайп от рабочих практик и готовы быстро реализовывать новые идеи
Будет плюсом, если вы
- Работали с reasoning-задачами, post-training или RLHF/alignment
- Имеете опыт работы с OCR и document understanding: распознавание текста, структуры документов, таблиц и графиков
- Обучали большие модели или large-scale ML-системы
- Понимаете ограничения современных VLM и следите за трендами в multimodal reasoning
Бенефиты работы в Яндексе
- Здоровье
Расширенная медицинская страховка начинает работать с первого месяца в Яндексе. В неё входят:
- Базовые услуги
Плановая помощь и неотложная за рубежом, страхование от несчастных случаев для любителей активного отдыха и лечение критических заболеваний.
- Ментальное здоровье
Врачи в клиниках по ДМС, онлайн-консультации с психологами. А также психотерапия в офисах, где есть кабинет психотерапевта.
- Ежегодные чекапы
Мы за превентивную заботу о здоровье, поэтому по ДМС можно проходить чекапы и регулярно вакцинироваться.
- Больничный
30 дней в году оплачиваются — вы получите полную зарплату, как будто не болели.
- Стоматология
Плановые процедуры, профессиональная чистка и экстренная помощь за рубежом.
- Коррекция зрения
После года работы ДМС покрывает коррекцию зрения и хирургическое лечение косоглазия.
- Терапевты в офисах
Если почувствовали себя неважно, можно обратиться в кабинет врача-терапевта, такие есть во всех крупных офисах Яндекса.
- Ведение беременности и роды
Оплачиваем ведение беременности и роды для сотрудниц и жён сотрудников, которые с нами более двух лет.
- Страховка для родственников по системе 80/20: мы оплачиваем 80% стоимости ДМС для детей и супругов, вы — остальные 20%. В страховку входит всё то же самое, что и у вас.
- Больше о бенефитах
Все интересные вам вакансии в одном профиле
Войти и откликнуться
Посмотреть ещё