Почему стоит работать в Nebius
Nebius возглавляет новую эру в облачных вычислениях, обслуживая глобальную экономику ИИ. Мы создаём инструменты и ресурсы, необходимые нашим клиентам для решения реальных задач и трансформации отраслей, без огромных затрат на инфраструктуру и необходимости создавать большие внутренние команды по ИИ/машинному обучению. Наши сотрудники работают на переднем крае облачной инфраструктуры ИИ вместе с одними из самых опытных и инновационных лидеров и инженеров в этой области.
Где мы работаем
Штаб-квартира находится в Амстердаме, компания котируется на Nasdaq, Nebius имеет глобальное присутствие с исследовательскими и разработческими центрами по всей Европе, Северной Америке и Израилю. Команда из более чем 800 сотрудников включает более 400 высококвалифицированных инженеров с глубокими знаниями в области аппаратного и программного обеспечения, а также внутреннюю команду по исследованиям и разработкам в области ИИ.
Роль
Мы ищем старшего инженера поддержки аппаратного обеспечения, который будет отвечать за надёжность производственного оборудования в масштабных, критически важных дата-центрах. Эта роль находится на пересечении аппаратной инженерии, операций и работы с поставщиками, обеспечивая стабильность парка оборудования, быстрое выявление коренных причин и постоянное улучшение надёжности серверов и платформ.
Ваши обязанности будут включать
- Руководство анализом коренных причин сложных сбоев аппаратного и встроенного программного обеспечения в производственных парках
- Сбор повторяющихся проблем и шаблонов ошибок для выявления системных проблем с надёжностью
- Выступать в качестве старшей точки эскалации по инцидентам, связанным с аппаратным обеспечением, влияющим на доступность или производительность
- Координация с поставщиками для своевременной диагностики, возврата оборудования (RMA), исправления встроенного ПО и корректирующих действий
- Сотрудничество с внутренними инженерными командами для проверки исправлений и предотвращения повторных сбоев
- Проведение валидации аппаратного обеспечения и встроенного ПО перед масштабным развертыванием
- Проведение структурированных расследований инцидентов с использованием установленных методологий управления проблемами в ИТ
- Поддержка команд на местах с технической координацией во время критических аппаратных событий
- Улучшение процессов наблюдаемости аппаратного обеспечения, отслеживания сбоев и отчетности
- Вклад в долгосрочную стратегию надёжности аппаратного обеспечения и улучшение стабильности парка оборудования
Что мы ожидаем от вас
- Сильные практические навыки работы с серверным оборудованием в дата-центрах или масштабных производственных средах
- Подтверждённый опыт проведения анализа коренных причин сбоев аппаратного и встроенного ПО
- Глубокое понимание компонентов серверов (ЦПУ, память, хранилище, сеть, питание, BMC) и режимов отказов
- Опыт работы напрямую с поставщиками аппаратного обеспечения и инженерными командами для решения производственных проблем
- Структурированные навыки решения проблем с использованием формальных методологий управления ИТ или инцидентами
- Сильные аналитические способности и умение интерпретировать логи, телеметрию и шаблоны ошибок
- Опыт координации технических действий с операционными командами на местах
- Умение управлять несколькими параллельными расследованиями с влиянием на производство
- Чёткие письменные и устные коммуникативные навыки в кросс-функциональной среде
Будет плюсом, если у вас есть
- Опыт работы в средах с высокой плотностью GPU, ИИ или высокопроизводительных вычислениях
- Знания в управлении жизненным циклом встроенного ПО и валидации масштабных развертываний
- Знакомство с производственными системами на базе Linux и инструментами инфраструктуры
- Опыт улучшения показателей надёжности аппаратного обеспечения на уровне всего парка
Условия работы
- Удалённая работа в пределах Соединённых Штатов
- Возможны редкие командировки для координации на местах или участия в критических аппаратных событиях
- Участие в эскалациях инцидентов, влияющих на производство
Основные преимущества для сотрудников
- Полное медицинское, стоматологическое и офтальмологическое страхование
- Пенсионный план 401(k) с взносами от компании
- Гибкий оплачиваемый отпуск
- Оплачиваемый отпуск по уходу за ребёнком
- Поддержка профессионального развития
Оплата труда
125 000 – 180 000 долларов в год плюс ежегодный бонус, основанный на результатах работы.
Что мы предлагаем
- Конкурентоспособную зарплату и полный пакет льгот.
- Возможности профессионального роста внутри Nebius.
- Гибкие условия работы.
- Динамичную и совместную рабочую среду, которая ценит инициативу и инновации.