Тимлид разработки рантайма в Алису
Алиса — это самый популярный эмпатичный ассистент в России с 70 миллионами активных пользователей. Наша команда создаёт ассистента, который решает задачу пользователя целиком: от «нужно» до «готово». Мы строим Agentic Web, где Алиса выполняет поручения в реальном мире, объединяя специализированных агентов.
Мы занимаемся ядром диалогового движка — инфраструктурой, которая связывает все компоненты Алисы. Наша ключевая цель — создать новый, единый и гомогенный рантайм, который будет одинаково эффективно работать как с мгновенными запросами, так и с долгими агентскими задачами, длящимися десятки минут.
Это вызов, требующий решения сложных технических задач и постоянной готовности к масштабированию. Вы будете влиять на архитектуру продукта, который ежедневно помогает миллионам людей.
Какие задачи вас ждут
- Проектирование архитектуры
Вам предстоит разработать прозрачную и понятную архитектуру для рантайма Алисы. Система должна единообразно обрабатывать разнородные задачи — от быстрых запросов (сотни миллисекунд) до длительных агентских сессий (десятки минут) — с минимальным оверхедом. Архитектура будет работать с различными типами входных данных: текстом, голосом, изображениями и другими файлами.
- Разработка и поддержка высоконагруженного рантайма
Вы будете разрабатывать и поддерживать рантайм, который позволяет независимо развивать и развёртывать любой компонент системы: модели, инструменты, агентов. Система должна обрабатывать десятки тысяч RPS, сохраняя надёжность на уровне 99,99%, эффективность и лёгкую масштабируемость.
- Работа с командой
Вам предстоит развивать и усиливать команду разработки рантайма: растить сотрудников и искать новых. Вы будете участвовать в сборе требований, влиять на приоритеты и планы развития продукта, разрабатывать новую функциональность, отвечать за технические решения.
Больше о бэкенде в Яндексе — в канале Yandex for Backend
Мы ждем, что вы
- Разрабатывали распределённые системы, где критически важно управление состоянием, потоками данных и отказоустойчивостью
- Умеете проектировать высоконагруженные серверные системы с жёсткими требованиями к задержкам (latency) и стабильности
- Понимаете принципы построения асинхронных пайплайнов с большим количеством сетевых вызовов (оркестрация LLM, инструментов и внешних сервисов)
- Готовы писать код на C++
- Руководили командой разработки от 4 человек
Будет плюсом, если вы
- Работали с системами оркестрации, такими как Temporal
- Интересуетесь большими языковыми моделями (LLM) и понимаете принципы их работы
- Оптимизировали высоконагруженные системы на C++
Что мы предлагаем
- Здоровье
- Рост и развитие
- Спорт
- И ещё
Расширенная медицинская страховка начинает работать с первого месяца в Яндексе. В неё входят стоматология, ежегодные чекапы, неотложная помощь за рубежом, лечение критических заболеваний, в том числе онкологии, и страхование от несчастных случаев.