Стажёр-студент Data Scientist (GenAI / B2B)
70 000 — 80 000₽
до вычета налогов
02 июля 2026 • г Санкт-Петербург • ПАО Сбербанк • Информационные технологии:Дата-сайентист
Можно без опыта
Мы — команда разработки решений на базе машинного обучения и генеративного искусственного интеллекта в Корпоративно-инвестиционном бизнесе (КИБ) Сбера.
Наша цель — создавать продукты, которые помогают крупнейшим компаниям России и малому бизнесу эффективнее управлять финансами, автоматизировать рутину и принимать инвестиционные решения.
Сейчас мы ищем талантливых студентов, готовых погрузиться в разработку реальных AI-решений для сложного B2B-сегмента.
Обязанности
- Проводить анализ корпоративных данных совместно с аналитиками КИБ, участвовать в разметке датасетов и проверять гипотезы о поведении бизнес-клиентов
- Участвовать в процессах кросс-валидации, A/B-тестирования и мониторинга качества ML-моделей в промышленной эксплуатации
- Разрабатывать и поддерживать пайплайны генерации контента и обработки документов на основе больших языковых моделей (LLM): от извлечения сущностей из финансовой отчетности до суммаризации деловых переписок
- Исследовать и тестировать новые алгоритмы и архитектуры нейросетей для задач автоматизации банковских процессов юридических лиц
- Создавать прототипы интеллектуальных систем (например, агентов для поддержки клиентских менеджеров или скоринговых моделей), используя современный MLOps-стек.
Требования
- Обучаетесь на 3–4 курсе бакалавриата или 1–2 курсе магистратуры технического направления
- Уверенно владеете Python, пишете чистый код, понимаете принципы объектно-ориентированного программирования (ООП) и SOLID
- Имеете практический навык проведения разведочного анализа данных (EDA) и визуализации результатов
- Понимаете математические основы классического машинного обучения (регрессия, классификация, кластеризация, метрики качества)
- Владеете инструментами предобработки табличных данных (pandas, numpy)
- Знакомы с экосистемой LLM: имеете опыт работы с фреймворками LangChain/LlamaIndex и библиотекой vLLM для инференса
- Решали учебные или пет-проекты с помощью генеративных моделей (чат-боты, RAG-системы, работа с эмбеддингами).
Будет плюсом:
- Опыт работы с распределёнными вычислениями (Apache Spark, PySpark) для обработки больших данных
- Практический опыт создания AI-агентов, использующих внешние инструменты (tool calling) для выполнения действий
- Опыт использования API семейства моделей GigaChat или других российских фундаментальных моделей
- Навык написания SQL-запросов для самостоятельной выгрузки данных из хранилищ
- Базовое знание Docker для контейнеризации своих приложений.
Условия
- Оплачиваемая стажировка сроком 3 месяца с возможностью последующего трудоустройства в штат
- Офисный формат (40 часов в неделю), позволяющий полностью погрузиться в задачи команды, гибкий график
- Работа в офисе IT-хаба Сбера по адресу: Санкт-Петербург, ул. Уральская, д. 1 (10 минут пешком от ст. метро «Василеостровская» или «Спортивная»)
- Реальные задачи под руководством опытных менторов — вы будете работать над продуктами, которыми пользуются тысячи предпринимателей
- Доступ к мощным вычислительным ресурсам (GPU-кластеры) и внутренним дата-сервисам банка
- Программа адаптации, внутреннее обучение по Deep Learning и NLP, а также доступ к корпоративной библиотеке.