Мы - команда GigaChat Pretrain Data, готовим pretrain данные для GigaChat и GigaChat Vision. Pretrain данные - это фундамент, с которого начинается путь современной LLM модели и то, от чего наиболее зависит ее итоговое качество. Сырых данных более 40Пб и основная задача заключается в том, чтобы из этого хаоса сделать датасет, на котором будет обучена лучшая LLM в России.
Будет плюсом:
Прокачиваем hard и soft skills на корпоративной
платформе Сбера и в корпоративном университете, участвуем в профильных
конференциях, митапах и хакатонах
У нас развитая культура карьерной мобильности.
Можно расти вертикально
или горизонтально в своей команде или попробовать себя в других проектах группы компаний Сбера.
Для начинающих специалистов — корпоративные образовательные программы, которые помогут на старте карьеры
Работаем с современным стеком технологий, гибкими методологиями Agile/
«СБЕРБАНК-ТЕХНОЛОГИИ» работает под брендом SberTech