RetailCRM — это передовое SaaS-решение для eCommerce и ритейла, которым каждый день пользуются тысячи клиентов.
RetailCRM вырос с нуля до большого высоконагруженного проекта (4 датацентра в Европе и России, 100+ млн запросов к backend в сутки, 70+ тысяч запросов к БД в секунду)
Сейчас над продуктом работает 12 команд разработки и эксплуатации, каждая из которых сосредоточена на своей зоне в продукте.
Наш проект полностью работает на bare-metal (250+ серверов), и мы сформировали хорошую экспертизу в построении SaaS-решении на выделенных серверах. У вас будет возможность получить опыт развития и обслуживания подобной инфраструктуры. В свою очередь от кандидатов мы ожидаем достаточно хорошего опыта администрирования серверов. Это не значит, что вам придется вручную настраивать сервера, но этот опыт важен при анализе узких точек инфраструктуры и правильной настройке production-решений.
О команде:
Команда DevOps:
Обеспечивает и повышает надежность инфраструктуры;
Реагирует на инциденты, оперативно решает их;
Проводит анализ слабых точек, повышает уровень auto-failover;
Развертывает новые сервисы, разрабатываемых product teams;
Предоставляет и развивает инструменты мониторинга инфраструктуры и сервисов.
Как мы работаем:
Управляем инфраструктурой с помощью Ansible 2.18, придерживаемся подхода GitOps (все плейбуки и конфигурация кластеров, в том числе «секреты», в Git, довольно много pipeline-ов в ansible-репозитории);
Аналогично через GitOps организовано управление доменами в связке Gitlab + OctoDNS + Cloudflare;
130+ сервисов в инфраструктуре. Автоматически строим визуальную и текстовую карту сервисов http://ds.retailcrm.tech/s/1625674134.png;
Для мониторинга и логов используем Zabbix, Pinba, ClickHouse, Redash, Grafana;
В качестве внутренних систем используем Redmine, Gitlab, Mattermost;
Довольно компактный стек технологий для разработки сервисов. 99% сервисов на Nginx, PHP, Go, Python, PostgreSQL, ClickHouse, Redis, Temporal, beanstalkd, k8s;
В команде выстроена система дежурств. Каждую неделю дежурит определенный DevOps-специалист, который в первую очередь реагирует на инциденты и помогает отделам техподдержки и разработки;
Выстроена система Postmortem. Фиксируем хронологию инцидентов, причины их возникновения и пути решения.
Требования к кандидатам:
В свою очередь мы гарантируем:
Официальное оформление в аккредитованной IT компании;