В связи с расширением команды и масштабированием проектов находимся в поиске DevOps инженера уровня Senior в IT-компанию, которая занимается разработкой и полным сопровождением заказного программного обеспечения, веб-сайтов и мобильных приложений, предоставляя широкий спектр услуг.
Чем предстоит заниматься:
Участие в проектировании, внедрении и поддержке решений для обеспечения высокой доступности и отказоустойчивости систем;
Сопровождение стратегии Observability и решений ее обеспечивающих (VM stack, CloudWatch, ELK etc), обучение команд инструментам Observability, мониторинга и принципам надежности;
Настройка и поддержка мониторинга, дашбордов, алертинга с учетом особенностей систем;
Формирование и постоянная работа со стратегией создания инцидентов и регламентов по работе с ними, разработка и реализация мер для предотвращения повторных инцидентов;
Обеспечение соответствующего реагирования на инциденты PagerDuty согласно регламенту и OnCall дежурствам;
Взаимодействие с командами разработки для внедрения принципов надежного дизайна систем.
Наши ожидания от кандидата:
Опыт работы SRE Engineer от 3-х лет;
Опыт работы с инструментами observability: OpenTelemetry, Loki, Grafana, Tempo, Mimir, Victoria metrics, Elastic Stack (ELK), Vector, Sentry;
Опыт работы с Kubernetes, Docker;
Опыт описания IaC в Terraform, Ansible;
Опыт сопровождения backend команд использующих .Net как основной фреймворк;
Опыт работы с CI/CD системами: GitLab CI/CD, ArgoCD;
Опыт в решении критических инцидентов и проведении Post-Mortem, RCA;
Умение и желание взаимодействовать с различными командами разработки и инфраструктуры, способность четко доносить свои идеи и предложения;
Проактивность и инициативность в предложении улучшений.
Мы предлагаем:
Данное рабочее место является планируемым к созданию и замещению (перспективным).