Мы ищем опытного Core DevOps инженера, который возьмёт на себя развитие, эксплуатацию и автоматизацию инфраструктуры в высоконагружённой среде. Нужен специалист с глубокими знаниями Kubernetes, сетей, CI/CD и IaC, умеющий проектировать устойчивые и безопасные системы.
Функциональные обязанности
- Разработка, развёртывание и эксплуатация Kubernetes-кластеров (production), включая управление Control Plane, сетевыми CNI-плагинами, CSI-драйверами, Ingress-контроллерами и обеспечением высокой доступности.
- Поддержка и оптимизация сетевой, вычислительной и storage-архитектуры Kubernetes. Управление мультикластерной средой;
опыт с Rancher/RKE2 будет преимуществом.
Создание и поддержка CI/CD-процессов на базе GitLab CI/CD:
- проектирование пайплайнов, автоматизация сборки, тестирования и деплоя, работа с GitLab Runners, секретами, артефактами и инфраструктурными пайплайнами.
- Внедрение/Поддержание GitOps-подходов.
Автоматизация инфраструктуры с использованием Terraform и Ansible:
- описание ресурсов, создание модульных конфигураций, управление состоянием, автоматизация конфигураций серверов, кластеров, сетевых политик и сервисов.
- Применение принципов Infrastructure as Code.
Развитие контейнерной и виртуальной инфраструктуры:
- Docker, создание и оптимизация образов, работа с реестрами.
- Администрирование виртуализации VMware (vSphere/ESXi), настройка вычислительных пулов, сетей и хранилищ.
Построение системы мониторинга:
- настройка мониторинга на Prometheus/Grafana, логирования через ELK (Opensearch, Logstash, Kibana), Vector, интеграции с Zabbix.
- Разработка дашбордов, метрик, алёртов и систем уведомлений.
- Участие в расследовании инцидентов и построении SLI/SLO.
Администрирование Linux-систем на уровне эксперта:
- Оптимизация сетей, ядра, ресурсов; работа с systemd, журналированием, файловыми системами и распределёнными компонентами.
- Решение сложных технологических инцидентов на уровне сети, хранилища, виртуализации и Kubernetes.
- Взаимодействие с командами разработки и эксплуатации, участие в архитектурных встречах, документирование решений и автоматизаций, вклад в развитие инженерных стандартов.
Требования
- Опыт работы DevOps / SRE / Platform Engineer от 3–5 лет в средах production.
- Глубокие практические знания Kubernetes: архитектура Control Plane, etcd, сетевые стеки, CNI (Calico/Cilium), CSI, StatefulSet, ingress-контроллеры, балансировка, масштабирование, безопасность (RBAC, network policies).
- Уверенные навыки разработки CI/CD в GitLab, проектирование пайплайнов любой сложности.
- Опыт применения IaC: Terraform (модули, реиспользование, state), Ansible (роли, плейбуки).
- Знания Docker и контейнерной архитектуры.
- Уверенные знания виртуализации на базе VMware.
- Понимание архитектуры виртуальных сетей, хранилищ, кластеров.
- Глубокое понимание сетей: TCP/IP, DNS
- Способность диагностировать и устранять сетевые проблемы в распределённых системах.
- Знание инструментов мониторинга и логирования: Prometheus, Grafana, ELK/EFK, Zabbix, Vector.
- Уверенные навыки работы с Linux (ядро, systemd, сети, диски, безопасность), а также опыт написания скриптов на Bash или Python.
- Способность разбираться со сложными инцидентами, проводить RCA, документировать решения и работать в команде инженеров.
Условия: