ТВОЁ ЛАЙВ (tvoe.live) — аккредитованная IT-компания и онлайн-кинотеатр. Наша инфраструктура — это основа скорости и стабильности сервиса. Сейчас мы ищем человека, который возьмёт инфраструктуру в свои руки и поднимет её на новый уровень.
Чем предстоит заниматься
- Руководить инфраструктурой и платформенной командой: строить планы, расставлять приоритеты и вести roadmap
- Управлять командой DevOps/SRE, организовать дежурства (on-call) и проводить разборы после инцидентов
- Строить observability с нуля: мониторинг, логи, алерты, SLO и SLI
- Создавать и поддерживать CI/CD в GitLab — от простых пайплайнов до сложных многоэтапных
- Создавать и улучшать Helm-чарты для всех сервисов
- Работать с Kubernetes-кластерами: CNI, Ingress, RBAC, безопасность
- Внедрять IaC, GitOps и автоматизацию
- Развёртывать и поддерживать инфраструктуру через Terraform
- Работать с облачной инфраструктурой (AWS, Yandex Cloud)
- Создавать внутреннюю платформу для разработчиков, чтобы они быстро и удобно выпускали фичи
- Участвовать в проектировании всей инфраструктуры компании
- Работать со стендами и тестовыми окружениями, настраивать Argo Rollouts
Что мы ждём от кандидата
Kubernetes и оркестрация
- Уверенное знание Kubernetes: CNI, Ingress, RBAC, Helm, ArgoCD
Облака
- Опыт работы с облачными провайдерами (AWS / Azure / GCP)
- Опыт с managed Kubernetes (EKS / AKS / GKE)
- Опыт с Yandex Cloud или отечественными облаками — будет плюсом
CI/CD и GitLab
- Настройка и администрирование сервера GitLab: разворачивание, бэкапы, сопровождение
- Настройка и сопровождение GitLab Runner
- Построение релизного цикла проектов на основе GitLab Pipelines
Инфраструктура и сети
- Уверенный Linux на уровне ОС, сервисов и сети: iptables, Nginx, DNS, TLS, балансировка
- Опыт с Docker-образами: написание, оптимизация и безопасность
- Terraform + Ansible
- HashiCorp Vault или Nexus
Данные и брокеры сообщений
- Базы данных: PostgreSQL, ClickHouse, MongoDB, Redis и его форки, а также DBaaS-решения
- Брокеры сообщений: Kafka, RabbitMQ
Observability и SRE
- Prometheus, Grafana, Loki (или аналогичные инструменты мониторинга)
- Понимание принципов SRE: Error Budgets, SLI/SLO, снижение рутинной нагрузки (toil)
- Опыт с Sentry
Прочее
- Умение писать скрипты на Bash или Python
- Внимание к деталям и высокая ответственность на продакшене
- Английский для чтения документации и общения — плюс, но не обязательно
Условия
- Официальное трудоустройство по ТК РФ
- Работа в аккредитованной IT-компании
- График 5/2
- Формат на выбор: офис, гибрид или полностью удалённо
Готовы взять инфраструктуру в свои руки? Присылайте резюме 🚀