Команда голосовых технологий создает онлайн и офлайн модели распознания голоса и извлечения признаков, синтеза и клонирования речи.
Используемый технологический стек:
- Исследование и обучение: PyTorch, PyTorch Lightning, NeMo
- Инференс: Triton Inference Server (ONNX, TensorRT)
ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:
- Собирать данные под домен, размечать данные;
- Файнтюнить компоненты пайплайна под термины домена;
- Развивать микросервисы инференса моделей;
- Подбирать лучшие практики сбора и предобработки датасетов (в т.ч. Nemo Forced Aligner);
- Разрабатывать модели поло-возрастной классификации.
МЫ ЖДЕМ, ЧТО ВЫ:
ЧТО МЫ ПРЕДЛАГАЕМ:
- Достойный уровень вознаграждения;
- ДМС со стоматологией с первого месяца работы;
- Отпуск 33 дня;
- Полное соблюдение ТК РФ.