Фонд TON — это некоммерческая организация, поддерживающая развитие блокчейна TON и его экосистемы. Основанный в Швейцарии в 2023 году и поддерживаемый глобальным сообществом, Фонд предоставляет разработчикам, создателям и бизнесу гранты, технические ресурсы и стратегические партнерства. TON функционирует как децентрализованная, открытая сеть с открытым исходным кодом, независимая от централизованного контроля и открытая для вкладов всех желающих.
Мы ищем инженера по надежности сайта (Site Reliability Engineer), который обеспечит устойчивую, безопасную и готовую к эксплуатации платформу, позволяющую безопасно и эффективно развертывать приложения и сервисы. Эта роль сосредоточена на повышении доступности сервисов, мониторинге, реагировании на инциденты и надежности системы, поддержке операционных команд и постоянном улучшении масштабируемости, времени безотказной работы и стабильности платформы.
Обязанности
- Повышать устойчивость и надежность решений PaaS с помощью таких действий, как:
- Настройка и поддержка мониторинга и оповещений для наших кластеров Kubernetes и производственных сервисов
- Нагрузочное тестирование и оптимизация производительности наших производственных сервисов
- Создание панелей мониторинга, систем мониторинга и механизмов оповещения
- Разработка и интеграция решений с уклоном в автоматизацию для улучшения и поддержания надежности всей производственной инфраструктуры и упрощения восстановления
- Проектирование и внедрение отказоустойчивых решений для stateful-сервисов и поддерживающей инфраструктуры
- Проектирование и отслеживание метрик времени безотказной работы и производительности для обеспечения высокого уровня видимости
- Тесное сотрудничество со всеми инженерными подразделениями для своевременной обратной связи по нашим средам
- Участие в графике дежурств и поддержка реагирования на инциденты и восстановления сервисов
Требования
- Опыт работы с системами мониторинга, такими как Prometheus, Grafana и VictoriaMetrics
- Опыт проектирования и поддержки отказоустойчивых кластеров Redis, RabbitMQ и PostgreSQL
- Глубокое понимание масштабирования, устойчивости и высокой доступности под нагрузкой
- Навыки нагрузочного тестирования и работы с инструментами производительности, такими как K6
- Сильные навыки работы с Linux и скриптами для автоматизации платформы и устранения неполадок
- Способность тесно работать с инженерными командами для улучшения доставки, надежности и опыта разработчиков
Фонд TON является работодателем, предоставляющим равные возможности.