О нас:

Мы являемся ведущим участником децентрализованной AI-сети Gonka, используя высокопроизводительную GPU-инфраструктуру для максимизации вознаграждений за майнинг. Мы ищем инженера по оптимизации машинного обучения, который поможет нам достичь превосходной эффективности и веса в экосистеме Gonka.

Основные обязанности:

Реализация передовых оптимизаций вывода (спекулятивное декодирование, квантизация, модификации внимания и др.) для максимизации веса майнинга — техники, уже доказавшие удвоение веса при использовании идентичных GPU у других участников

Тонкая настройка конфигураций Docker для различных моделей GPU на основе доступного реестра

Разработка индивидуальных стратегий оптимизации, балансирующих пропускную способность и качество

Создание и поддержка пользовательских Docker-образов, оптимизированных для конкретных архитектур GPU

Проектирование и внедрение систем для стабильного и масштабируемого майнинга Gonka и других протоколов

Разработка оптимизированных образов для AI ASIC Tenstorrent с целью расширения нашего аппаратного экосистемы за пределы текущего развертывания GPU

Миграция Python-кода и реализаций VLLM на новые образы VLLM и адаптация их под конкретные GPU-карты

Требуемые квалификации:

Подтверждённый опыт оптимизации больших языковых моделей

Глубокое понимание архитектур трансформеров и механизмов внимания

Уверенное владение PyTorch, CUDA и методами оптимизации GPU

Опыт работы с vLLM, FlashInfer или аналогичными фреймворками оптимизации вывода

Знание контейнеризации Docker и управления нагрузкой на GPU

Желательные квалификации:

Опыт работы с Claude Code Max (будет предоставлен при необходимости)

Предыдущий опыт работы с Gonka или аналогичными децентрализованными AI-сетями

Опыт в конкурентном машинном обучении или оптимизации распределённых систем

Опыт работы с архитектурами GPU NVIDIA (B200/B300/H200/H100/A100)

Знания о AI ASIC Tenstorrent или другом специализированном AI-оборудовании

Что мы предлагаем:

Возможность работать с передовой AI-инфраструктурой

Высокие бонусы, основанные на достигнутых улучшениях веса

Возможность постоянной работы с долей от прибыли майнинга

Гибкий удалённый режим работы

Доступ к высококлассному GPU-оборудованию для экспериментов

Процесс подачи заявки:

Заинтересованные кандидаты должны отправить своё резюме вместе с кратким описанием релевантного опыта в оптимизации ML или идеями по улучшению производительности.

Obscuracompute.com

4 июл.