от 300 000 до 600 000 ₽•Удалённо•Удалённо•Middle, Senior
Зарплата
Нет данных по зарплате
Мэтчер
AI-анализ соответствия резюме к вакансии
Сопроводительное
AI-генерация письма на основе резюме
Адаптировать резюме под эту вакансию с AI
Привет! Это GigaChat Reasoning — команда, которая даёт модели суперсилу размышлять. Мы придумываем среды, тренируем через online RL, ускоряем обучение и доводим решения до продакшна.
Улучшение GigaChat Reasoning: полный цикл обучения от холодного старта до вывода модели продакшн. Добавление новых доменов, создание датасетов и функций оценки ответов.
Развитие агентских навыков и tool calling с помощью Online RL: создание сред для обучения LLM, обучение и тестирование моделей.
Улучшение продукта Deep Research.
Вам предстоит
Улучшать качество работы GigaChat Reasoning на русском и английском языках.
Тестировать новые Loss-функции и подходы к обучению.
Помогать выводить в прод всё, что мы обучим.
Постоянно держаться up-to-date со свежими статьями.
Требования
Опыт в online RL и хорошие теоретические знания.
Уверенное владение Python, PyTorch.
Знание базовых алгоритмов и математики.
Знания в DL, опыт обучения простых и больших моделей.
Опыт обучения моделей для продакшена.
Понимание текущего состояния эволюции больших LLM'ов.
Будет плюсом наличие публикаций.
Условия
Удалённо по России.
Возможность оформления в IT-аккредитованную компанию.
Годовая премия по итогам работы до 6 окладов.
Регулярный пересмотр зарплат.
Корпоративный спортзал и зоны отдыха.
Более 400 программ СберУниверситета для роста.
Программа адаптации и помощь руководителя на старте.
Крупнейшее DS&AI community — более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы.
Расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа.