Общее описание
Яндекс 360 — это сервисы для решения ежедневных задач пользователей и бизнеса: Диск, Почта, Документы, Календарь, Телемост и другие продукты с общей многомиллионной аудиторией.
Мы постоянно работаем над качеством и производительностью и экспериментируем с новыми технологиями. Хотим предоставить нашим клиентам возможность использовать сервисы Яндекс 360 для бизнеса по модели on-premises, то есть развёртывать их в своей инфраструктуре.
Ищем в команду SRE/DevOps уровня middle и выше, который поможет нам реализовать эту задачу и сделает процесс установки, поддержки и обновления сервисов Яндекс 360 в клиентской инфраструктуре максимально простым и удобным как для клиента, так и для нашей команды.
Задачи
- Разработка и автоматизация
- В составе команды вам предстоит обеспечивать запуск сервисов Яндекс 360 на площадке заказчика: разрабатывать инструменты доставки, установки, конфигурации и обновления (включая микросервисы бэкенда, ansible-пайплайны, Helm-чарты и т. д.).
- Observability
- Вам будет необходимо обеспечить наблюдаемость сервисов для команд эксплуатации клиента и возможность поддержки со стороны Яндекса — разработать инструменты для мониторинга и сбора отладочной информации.
- Инфраструктура
- Нужно будет расширять и поддерживать необходимую инфраструктуру стендов разработки и тестирования на стороне Яндекса в Yandex Cloud.
Мы ждём, что вы
- Разрабатывали автоматизацию и бэкенд на Python или другом современном языке, но можете быстро перейти на Python.
- Знаете Kubernetes: и с точки зрения пользователя, использующего K8s как платформу для работы сервисов, и с точки зрения инженера, понимающего устройство, состав и ограничения этой платформы.
- Занимались автоматизацией установки и конфигурации микросервисных приложений и legacy-приложений в облачных средах.
- Работали с какими-либо публичными облаками (AWS, Azure, Yandex Cloud).
- Понимаете принципы infrastructure as code (IaC), использовали Terraform и Ansible.
- Занимались построением мониторинга микросервисных систем с использованием Prometheus, Victoria Metrix, Grafana, ELK-стека, vector.dev.
- Работали с PostgreSQL, Kafka, Redis и другой инфраструктурой.
- Понимаете, что такое система контроля версий, как работает Git, разрабатывали CI/CD-пайплайны на любой платформе (например, GitLab, GitHub, Azure DevOps).
- Знаете, что такое GitOps, и работали с ArgoCD или FluxCD.
- Хотите и умеете быстро и самостоятельно учиться новому.