Описание вакансии
it-компания gnivc- партнер государственных компаний и лидеров российского бизнеса, разработчик и системный интегратор крупнейших государственных информационных систем, а также коммерческих решений для налогового мониторинга.
- Компания входит в ТОП-100 лучших работодателей страны и на 9-м месте в категории «IT-компании» 2025 года по рейтингу работодателей hh среди крупных компаний;
- Мы в 25% лучших по уровню счастья среди компаний отрасли IT и России 2025 по версии Happy Job;
- У нас есть ИИ-песочница - среда для экспериментов и реальных проектов на современных опенсорс-больших языковых моделях. Здесь можно применять ИИ для оптимизации своей работы, автоматизации процессов и реализации собственных идей от гипотезы до результата;
- Являемся аккредитованной ИТ-компанией.
Ищем инженера с практическим опытом, который будет заниматься разработкой и эксплуатацией платформы инференса LLM в промышленной эксплуатации. Роль предполагает активную работу с инфраструктурой, GPU-нагрузкой, API-слоем и оптимизацией производительности моделей.
- задачи:
- Разворачивать и поддерживать сервисы инференса моделей (vLLM, llama.cpp, Triton и др.);
- Настраивать и оптимизировать инференс LLM (пропускная способность, задержки, батчинг, KV-cache);
- Работать с GPU-инфраструктурой (распределение, загрузка, диагностика, профилирование);
- Разворачивать и сопровождать сервисы ИИ в Kubernetes (Helm, Stateful workloads, автомасштабирование);
- Строить API-слой для моделей (OpenAI-совместимый API, потоковые ответы, маршрутизация);
мы от вас ждём:
- 4+ года опыта в MLOps / DevOps / инфраструктурной разработке;
- Практический опыт работы с Kubernetes;
- Опыт работы с GPU (NVIDIA stack, nvidia-smi, CUDA);
... (Список продолжается)