SberAds — единая рекламная платформа экосистемы Сбера. Мы предоставляем бизнесу и агентствам технологичный инструмент для запуска эффективной рекламы на главных цифровых площадках страны.
В основе платформы лежит искусственный интеллект: система сама выбирает оптимальную площадку для показа, работает с 250+ уникальными сегментами аудитории и использует нейросети для генерации креативов. Мы создаем продукт, который принимает решения в реальном времени и обеспечивает точность для тысяч рекламодателей.
Мы ищем Senior SRE, который станет связующим звеном между инфраструктурой и командами разработки. Под капотом SberAds — высоконагруженный AdTech-движок, требующий безупречной надежности. Вы будете отвечать за надежность и автоматизацию сервисов, обслуживающих миллионы RPS. Важный вектор развития — внедрение ИИ в процессы самой команды SRE для делегирования рутины AI-агентам.
Наш стек:
- Облако: SberCloud (CCE, ECS, VPC, NAT Gateway и др.).
- Оркестрация: Kubernetes (CCE), Helm.
- Базы данных: PostgreSQL, MySQL, MongoDB, Redis, Tarantool, ClickHouse.
- Брокер сообщений: Kafka.
- Observability: VictoriaMetrics, Grafana, ELK-стек, Elastic APM, Sentry.
- Языки прикладного стека: C++, Go.
- Конфиги и Безопасность: HashiCorp Vault, Consul (KV), Keycloak (IAM).
- IaC & CI/CD: Terraform, Ansible, GitLab CI.
- Прочее: VPN, Mattermost.
Обязанности
- управление инфраструктурой в SberCloud. Администрирование и масштабирование кластеров CCE (Cloud Container Engine), настройка инфраструктурных объектов (Ingress, StorageClasses, Сеть)
- построение сквозной наблюдаемости, развитие инфраструктуры мониторинга (VictoriaMetrics, Grafana), логирования (ELK), распределенного трейсинга и прикладного APM (Elastic APM), а также интеграция Sentry
- взаимодействие с командами C++/Go, помощь в расследовании инцидентов, анализ проблем производительности на стыке кода и инфраструктуры
- взаимодействие с выделенной командой DBA по вопросам инфраструктуры баз данных. Понимание влияния работы СУБД на общую надежность сервисов и SLO
- эксплуатация кластера Kafka. Обеспечение отказоустойчивости и пропускной способности потоков данных
- управление распределенными конфигурациями через Consul и секретами через HashiCorp Vault
- внедрение искусственного интеллекта в инженерную культуру. Делегирование стандартных операционных задач (создание ранбуков, первичный анализ логов, генерация IaC-кода) ИИ-агентам
- настройка инфраструктуры как кода (IaC). Capacity management — прогнозирование и управление ресурсами кластеров K8s и облачных сервисов
- поддержка инфраструктуры VPN для удаленных сотрудников, платформы Mattermost и управление матрицей доступов (в т.ч. агентских кабинетов) через Keycloak.
Требования
- высшее образование
- опыт работы на позиции Senior SRE / DevOps от 5 лет
- глубокое понимание архитектуры Kubernetes и опыт работы с облачными кластерами (CCE, EKS, GKE или аналогами)
- практический опыт работы с Kafka
- уверенные знания HashiCorp Vault и Consul
- понимание принципов построения Observability-систем и опыт работы с Elastic APM / ELK / VictoriaMetrics
- опыт работы с IaC (Terraform) и написания скриптов на Python/Go/Bash для автоматизации
- понимание сетевого стека (VPC, DNS, балансировка), работы ОС Linux.
- открытость и стремление использовать AI-агентов и LLM в ежедневной работе SRE-команды для делегирования рутины, ускорения расследований и автоматизации
- умение выстраивать процессы взаимодействия между смежными командами (DevOps, DBA, Sec)
- умение общаться с разработчиками, переводить бизнес-требования в инфраструктурные решения.
Будет плюсом:
- опыт работы с инфраструктурой SberCloud / Huawei Cloud.
- опыт разработки или глубокого профилирования приложений на C++ или Go (понимание специфики работы с памятью, core dumps).
- практический опыт интеграции ИИ-инструментов (LLM, AI-агентов) в процессы CI/CD, мониторинга или автоматического резольвинга инцидентов.
- опыт интеграции Vault с облачными KMS (у нас этот процесс впереди, будем рады экспертизе).
Условия
- офис рядом с метро Маяковская
- гибридный формат работы
- годовой бонус и ежегодный пересмотр
- расширенный ДМС с первого дня + стоматология и льготное страхование для семьи
- корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
- 90 дней удаленной работы из любого региона РФ
- льготная ипотека в Сбере, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.