Системный инженер (Token Factory)
Амстердам, Нидерланды; Германия; Израиль; Прага, Чехия; Удалённо - Европа; Удалённо - США; Великобритания
Почему стоит работать в Nebius
Nebius возглавляет новую эру облачных вычислений для обслуживания глобальной экономики ИИ. Мы создаём инструменты и ресурсы, необходимые нашим клиентам для решения реальных задач и трансформации отраслей, без огромных затрат на инфраструктуру и необходимости создавать большие внутренние команды по ИИ/МО. Наши сотрудники работают на переднем крае облачной инфраструктуры ИИ вместе с одними из самых опытных и инновационных лидеров и инженеров в этой области.
Где мы работаем
Штаб-квартира находится в Амстердаме, компания котируется на Nasdaq, Nebius имеет глобальное присутствие с исследовательскими и разработческими центрами по всей Европе, Северной Америке и Израилю. Команда из более чем 800 сотрудников включает более 400 высококвалифицированных инженеров с глубокими знаниями в аппаратном и программном обеспечении, а также внутреннюю команду по исследованиям и разработкам в области ИИ.
О роли:
Token Factory — часть Nebius Cloud, одного из крупнейших в мире GPU-облаков, в котором работают десятки тысяч GPU. Мы создаём платформу для инференса, которая делает любой тип фундаментальной модели — текстовой, визуальной, аудио и новых мультимодальных архитектур — быстрой, надёжной и простой в масштабном развертывании.
Обязанности:
- Разработка и оптимизация низкоуровневых ядер и компонентов времени выполнения для инференса ИИ
- Улучшение производительности движков инференса на GPU-платформах
- Профилирование и отладка проблем производительности на уровне системы и аппаратного обеспечения
- Интеграция поддержки новых аппаратных архитектур (Hopper, Blackwell, Rubin)
- Сотрудничество с командами машинного обучения и бэкенда для оптимизации сквозного выполнения
Требуемые квалификации:
- Высокий уровень владения C++ ИЛИ опыт программирования GPU с акцентом на низкоуровневое высокопроизводительное кодирование и управление памятью
- Опыт программирования GPU или разработки системного программного обеспечения, например, внутренностей операционных систем, модулей ядра или драйверов устройств
- Практический опыт работы с инструментами профилирования и отладки для выявления проблем производительности как на CPU, так и на GPU, а также умение оптимизировать код на основе этих данных
- Твёрдое понимание архитектуры CPU/GPU и иерархии памяти
Желательные квалификации:
- Опыт программирования для GPU: CUDA, ROCm, CUTLASS, Cute, ThunderKittens, Triton, Pallas, Mosaic GPU
- Знакомство с рантаймами инференса машинного обучения (например, TensorRT, TVM)
- Знание внутренностей Linux, драйверов или компиляторных тулчейнов
- Опыт работы с инструментами, такими как perf, VTune, Nsight или ROCm profiler
- Знакомство с популярными движками инференса (например, vLLM, sglang, TGI)
В рамках процесса мы проводим технические собеседования с кодированием.
Что мы предлагаем
- Конкурентоспособную зарплату и полный пакет социальных льгот.
- Возможности профессионального роста внутри Nebius.
- Гибкие условия работы.
- Динамичную и совместную рабочую среду, которая ценит инициативу и инновации.
Мы растём и ежедневно расширяем наши продукты. Если вы готовы к вызову и так же увлечены ИИ и МО, как и мы, присоединяйтесь к нам!