Чем предстоит заниматься:
- Проектировать и поддерживать устойчивую, масштабируемую и высокодоступную инфраструктуру.
- Обеспечивать высокую доступность и отказоустойчивость сервисов.
- Внедрять и развивать практики мониторинга, алертинга, логирования и observability на базе стека VictoriaMetrics, Grafana и других инструментов.
- Обеспечивать полную наблюдаемость систем за счёт организации сбора метрик, логов и трейсов.
Что мы ждем от кандидата:
- Глубокое понимание принципов SRE и культуры надежности.
- Экспертные знания в области Linux, мониторинга, логирования, алертинга и визуализации данных.
- Опыт работы с SLO/SLI.