Присоединяйтесь к Skyro в качестве старшего инженера SRE
Skyro — быстрорастущая финтех-компания, обслуживающая тысячи клиентов на Филиппинах через наш кредитный бизнес. Наша миссия — развиться в полноценную финансовую экосистему, предоставляя передовые решения, которые делают финансовые услуги более доступными, эффективными и безопасными для всех.
Что вам предстоит делать
Техническое выполнение:
- Проектировать, создавать и поддерживать надежную инфраструктуру и платформенные сервисы в нескольких регионах
- Отвечать за надежность назначенных сервисов, включая определение SLI/SLO, мониторинг и улучшение
- Устранять и решать сложные производственные проблемы на всех уровнях стека
- Внедрять и улучшать инфраструктуру как код, CI/CD пайплайны и инструменты автоматизации
- Продвигать архитектурные улучшения, повышающие доступность, производительность и отказоустойчивость
Операционное совершенство:
- Руководить реагированием на инциденты критических производственных проблем и проводить тщательные постмортемы
- Разрабатывать и поддерживать инструкции по эксплуатации, операционную документацию и процедуры восстановления
- Вносить вклад в стратегию аварийного восстановления (DR) и участвовать в тестировании DR и упражнениях по хаос-инжинирингу
- Проактивно выявлять риски надежности и внедрять превентивные меры
Сотрудничество и наставничество:
- Наставлять младших и инженеров среднего уровня через ревью кода, парное программирование и обмен знаниями
- Сотрудничать с командами продуктовой инженерии по требованиям надежности и лучшим практикам
- Вносить вклад в межкомандные стандарты по наблюдаемости, оповещениям и управлению инцидентами
- Участвовать в обзорах архитектуры и предоставлять технические рекомендации по решениям в области надежности
Непрерывное улучшение:
- Оценивать и рекомендовать новые инструменты, технологии и методологии для улучшения практик SRE
- Автоматизировать рутинные и повторяющиеся операционные задачи для повышения эффективности команды
- Вносить вклад в планирование емкости и инициативы по оптимизации затрат
- Следить за актуальными тенденциями в инженерии надежности и облачной инфраструктуре
Что вам нужно иметь:
- Опыт работы 5+ лет в SRE, инфраструктурной инженерии или платформенной инженерии
- Глубокие знания распределенных систем, паттернов надежности и отказоустойчивой архитектуры
- Уверенные навыки программирования на Python, Go или аналогичных языках, а также владение скриптами (Bash)
- Глубокий практический опыт эксплуатации и устранения неполадок Kubernetes в масштабах
- Сильный опыт работы с публичными облачными платформами (AWS, GCP) в производственных средах
- Опыт работы с инфраструктурой как кодом (Terraform, Terragrunt), включая разработку модулей
- Отличные навыки наблюдаемости: Prometheus, Grafana, распределенный трассинг и централизованное логирование
- Опыт определения и поддержки SLI/SLO для производственных сервисов
- Доказанная способность руководить реагированием на инциденты и проводить содержательные постмортемы
Желательно иметь:
- Опыт работы с базами данных (PostgreSQL, MongoDB, ClickHouse)
- Опыт работы с GitLab CI/CD пайплайнами и разработкой Helm-чартов
- Опыт работы в финансовых услугах или регулируемой среде
- Опыт работы с платформами XaaS (S3, DBaaS, VMaaS, CDNaaS)
- Знание стандартов безопасности и соответствия (ISO 27001, SOC 2, NIST)
- Опыт хаос-инжиниринга или тестирования аварийного восстановления
Что происходит после подачи заявки?
Мы рассматриваем заявки по мере их поступления и стараемся ответить в течение 2–3 рабочих дней. Если вы подходите, мы свяжемся с вами. Если в течение 2–3 недель от нас не поступит ответа — считайте, что в этот раз не получилось. Спасибо, что уделили время — мы ценим ваш интерес. 🚀
Уведомление о сотрудничестве
Обратите внимание, что рабочий день должен начинаться не позднее 14:00 (GMT+8)/7:00 (CET) для обеспечения эффективного взаимодействия в нашей международной команде.
Сделайте первый шаг к карьере в Skyro!