Яндекс 360
Яндекс 360 — это виртуальный офис для работы команды: корпоративная Почта, Диск, Документы, Телемост, Мессенджер, Доски, Трекер и Вики. Мы создаём экосистему, которой пользуются миллионы людей и тысячи компаний.
Наше направление on-premise занимается поставкой этих сервисов в закрытые контуры крупных корпоративных заказчиков (Enterprise). Это сложные распределённые инсталляции, высокие требования к безопасности и надёжности.
Мы ищем CRE-инженера (Customer Reliability Engineer), который станет мостиком между инфраструктурой заказчика и нашей разработкой, обеспечивая надёжную работу наших продуктов на стороне клиента. Вы столкнётесь с разными задачами на инфраструктуре заказчика. Это идеальная роль для тех, кто любит сложные задачи в Linux и хочет видеть бизнес-результат своей работы.
Какие задачи вас ждут
- Решение сложных технических задач — вам предстоит разбираться в инцидентах, которые не смогла решить первая и вторая линии поддержки. Вы будете анализировать логи, дампы сетевого трафика, поведение ядра Linux и работу баз данных, чтобы находить корневую причину (Root Cause Analysis).
- Эксплуатация и внедрение — вы будете помогать заказчикам разворачивать и обновлять инсталляции Яндекс 360 на их серверах — вам предстоит работать с гетерогенными средами, где «железо» и сеть не под нашим прямым контролем.
- Автоматизация работы — вам нужно будет писать скрипты и инструменты (Python/Bash), а также создавать плейбуки.
- Влияние на продукт — вам предстоит отвечать за надёжность систем, передавать разработчикам качественную обратную связь «с полей», а также помогать адаптировать архитектуру сервисов под реалии on-premise-эксплуатации.
- Выстраивание коммуникаций — вы будете общаться с техническими специалистами и системными администраторами на стороне крупных заказчиков.
Мы ждем, что вы
- Работали с базами данных: знаете основы администрирования PostgreSQL и S3-совместимых хранилищ, умеете писать простые SQL-запросы и читать логи БД.
- Глубоко знаете Linux: понимаете, как работает ОС «под капотом» (память, процессы, дисковая подсистема, namespaces), умеете пользоваться strace, tcpdump, lsof, perf.
- Разбираетесь в сетях: знакомы с моделью OSI, протоколами TCP/IP, знаете, как работает DNS, балансировка нагрузки (L3/L7), умеете диагностировать сетевые проблемы.
- Умеете программировать: пишете на Python для автоматизации рутины, уверенно владеете Bash.
- Знакомы с контейнеризацией: понимаете принципы работы Docker/Containerd, имеете опыт работы с оркестраторами (K8s).
- Обладаете эмпатией: готовы погружаться в проблемы клиента и не просто «закрывать тикеты», а действительно решать задачу.
Будет плюсом, если вы
- Работали в роли SRE, DevOps или системного администратора в HighLoad-проектах.
- Знаете системы управления конфигурациями (Ansible).
- Умеете работать с мониторингом (Prometheus, Grafana, ELK-стек).
- Понимаете CI/CD-процессы.
Что мы предлагаем
- Здоровье.
- Рост и развитие.
- Спорт.
- И ещё — расширенная медицинская страховка начинает работать с первого месяца в Яндексе. В неё входят стоматология, ежегодные чекапы, неотложная помощь за рубежом, лечение критических заболеваний, в том числе онкологии, и страхование от несчастных случаев.
Также мы предлага
- психотерапию в офисе или онлайн-сервисах;
- лазерную коррекцию зрения через год работы;
- ведение беременности и роды — через два года.
...и много других социальных льгот.