О нас:
Мы являемся ведущим участником децентрализованной AI-сети Gonka, используя высокопроизводительную GPU-инфраструктуру для максимизации вознаграждений за майнинг. Мы ищем инженера по оптимизации машинного обучения, который поможет нам достичь превосходной эффективности и веса в экосистеме Gonka.
Основные обязанности:
- Реализация передовых оптимизаций вывода (спекулятивное декодирование, квантизация, модификации внимания и др.) для максимизации веса майнинга — техники, уже доказавшие удвоение веса при использовании идентичных GPU у других участников
- Тонкая настройка конфигураций Docker для различных моделей GPU на основе доступного реестра
- Разработка индивидуальных стратегий оптимизации, балансирующих пропускную способность и качество
- Создание и поддержка пользовательских Docker-образов, оптимизированных для конкретных архитектур GPU
- Проектирование и внедрение систем для стабильного и масштабируемого майнинга Gonka и других протоколов
- Разработка оптимизированных образов для AI ASIC Tenstorrent с целью расширения нашего аппаратного экосистемы за пределы текущего развертывания GPU
- Миграция Python-кода и реализаций VLLM на новые образы VLLM и адаптация их под конкретные GPU-карты
Требуемые квалификации:
- Подтверждённый опыт оптимизации больших языковых моделей
- Глубокое понимание архитектур трансформеров и механизмов внимания
- Уверенное владение PyTorch, CUDA и методами оптимизации GPU
- Опыт работы с vLLM, FlashInfer или аналогичными фреймворками оптимизации вывода
- Знание контейнеризации Docker и управления нагрузкой на GPU
Желательные квалификации:
- Опыт работы с Claude Code Max (будет предоставлен при необходимости)
- Предыдущий опыт работы с Gonka или аналогичными децентрализованными AI-сетями
- Опыт в конкурентном машинном обучении или оптимизации распределённых систем
- Опыт работы с архитектурами GPU NVIDIA (B200/B300/H200/H100/A100)
- Знания о AI ASIC Tenstorrent или другом специализированном AI-оборудовании
Что мы предлагаем:
- Возможность работать с передовой AI-инфраструктурой
- Высокие бонусы, основанные на достигнутых улучшениях веса
- Возможность постоянной работы с долей от прибыли майнинга
- Гибкий удалённый режим работы
- Доступ к высококлассному GPU-оборудованию для экспериментов
Процесс подачи заявки:
Заинтересованные кандидаты должны отправить своё резюме вместе с кратким описанием релевантного опыта в оптимизации ML или идеями по улучшению производительности.