Мы строим агентные решения на базе LLM для высоконагруженных сервисов оценки нефинансовых рисков.
Ищем опытного Python-инженера, который любит ML, понимает его ограничений и силу, и хочет делать «настоящий» продакшен-бэкенд: надёжный, масштабируемый, с чёткой инженерной культурой.
Вам предстоит внедрять современные подходы ML System Design, проектировать и эволюционировать агентные системы, которые реально приносят бизнес-ценность.
Если вам близок дух Bell Labs/Xerox PARC в их лучшие годы — исследовать, проверять гипотезы и доводить до прома — вам к нам.
Технологический ландшафт:
Python 3.11+, FastAPI, Dishka, gRPC/HTTP, Kafka, PostgreSQL/PgVector; Triton/vLLM/SgLang/ONNX, PyTorch/Lightning, инструменты для LLM-оркестрации, LangGraph, CrewAI, mem0, NeMo Guardrails; Grafana/OpenTelemetry;
Обязанности
- проектировать и разрабатывать backend-сервисы на Python для LLM-агентов и ML-пайплайнов (низкие задержки, высокая надёжность, observability)
- встраивать и развивать архитектуру агентных систем (оркестрация инструментов, память, планирование, безопасные guardrails, оценка качества)
- внедрять ML System Design подходы: искать и применять передовые идеи и мировой опыт в области архитектур агентных систем
- работать с данными и интеграциями: очереди/стриминг, базы, кэш, внешние API
- проводить технические исследования (R&D), быстро прототипировать, измерять, масштабировать в прод
- развивать платформу: тестирование, CI/CD, мониторинг, трассировка, расходы
- влиять на инженерную культуру: код-ревью, дизайн-сессии, менторство.
Требования
- 4–8+ лет промышленной backend-разработки на Python
- опыт проектирования распределённых систем и высоконагруженных сервисов.
- уверенная математическая база (вероятность/статистика/оптимизация)
- опыт работы с ML-системами в проде: фичи, офлайн/онлайн-оценка, A/B, наблюдаемость качества
- навык разбираться в новых подходах (LLM-агенты, инструменты, память, RAG, оценка), критически их проверять и доводить до результата.
будет плюсом:
- опыт построения agentic-архитектур (планировщики, многoшаговые цепочки, инструментализация, безопасность)
- опыт реализации высокоэффективного инференса LLM моделей, глубокое понимание работы kernelов для инференса
- вклад в open-source или публикации/доклады
- знание домена рисков.
Условия
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.