Мы ищем инженера по надежности сайта (SRE) для присоединения к нашей команде на Кипре (офис) или удаленно. В этой роли вы будете отвечать за поддержание стабильности и надежности нашей производственной среды.
Обязанности:
- Обеспечение стабильности производственной и разработческой инфраструктуры
- Разработка и улучшение систем мониторинга, оповещений и наблюдаемости (метрики, логи, трассировка)
- Настройка и оптимизация систем метрик и логирования
- Анализ инцидентов и предотвращение их повторения
- Работа с оповещениями и улучшение их качества
- Повышение надежности сервиса и отказоустойчивости
- Оптимизация производительности и стабильности системы
Ключевые компетенции:
- Глубокое понимание Linux
- Опыт работы в роли SRE / DevOps / системного инженера
- Уверенный опыт работы с инструментами мониторинга и оповещений (Prometheus, Grafana или аналогичные)
- Понимание концепций наблюдаемости (метрики, логи, трассировка)
- Опыт работы с Kubernetes и контейнеризацией
- Опыт анализа инцидентов и устранения проблем в производстве
- Навыки автоматизации (Bash, Python)
- Понимание сетевых технологий, производительности и отказоустойчивости
- Опыт работы с GCP является плюсом
Мы предлагаем:
- Удаленную работу или из нашего офиса в Лимассоле
- Компенсацию занятий английским или греческим языком
- Медицинскую страховку (только для Кипра)
- Обеды в офисе (только для Кипра)
- Гибкое начало рабочего дня