Мы строим платформу для инференса и SFT open-source LLM. Используем продвинутые cutting-edge движки для инференса, много экспериментируем и боремся за каждую дополнительную единицу в Token throughput. Cейчас мы находимся в поиске MLOps-инженера, который вместе с нами продолжит настраивать и улучшать инфраструктуру инференса LLM-моделей и осуществлять вывод решений в прод контур.

Вам предстоит:

Разрабатывать и оптимизировать инфраструктуру инференса LLM-моделей для минимальной задержки и высокой пропускной способности внутренних приложений и сервисов.
Обеспечивать масштабируемость и надежность LLM-serving инфраструктуры; выбирать и настраивать инструменты для инференса (sglang, vLLM, llama.cpp).
Разрабатывать механизмы разграничения доступов к API-сервисам моделей.
Строить систему observability и мониторинга LLM-инференса.
Собирать модели в сервисы и интерфейсы (FastAPI, Flask, Tornado, Streamlit, Chainlit и т.д.).

Мы ожидаем:

Опыт в аналогичной роли от 5 лет.
Опыт с Linux (сеть, storage, роли/пользователи, менеджмент процессов).
Уверенное владение Kubernetes (используем Istio Service Mesh).
Опыт построения высокопроизводительных LLM-сервисов (sglang, vLLM).
Опыт настройки высоконагруженных прокси-серверов (nginx, Envoy, HAProxy): load balancing, rate limiting, SSL termination, health checks.
Владение языками: Bash, Python, Groovy (Jenkins scripted).
Продвинутые навыки в CI/CD и оркестрации моделей.

Мы предлагаем:

Гибридный формат работы (2-3 дня в офисе).
Годовой бонус и ежегодный пересмотр.
Расширенный ДМС с первого дня + стоматологию и льготное страхование для семьи.
Корпоративный университет Сбера, внутреннюю образовательную платформу, участие в IT-конференциях.
Офис на Кутузовской с зонами отдыха и спортзалом.
Льготную ипотеку в Сбере, корпоративную пенсионную программу, подписку СберПрайм+, скидки от партнеров и сервисов группы компаний.

Senior MLOps/DevOps Engineer (LLM)

Вам предстоит:

Мы ожидаем:

Мы предлагаем:

Сопроводим до оффера

Сопроводим до оффера

Сопроводим до оффера

Сопроводим до оффера