Middle / Senior Data Scientist ASR в команду голосовых технологий

ЗП не указана•Москва•Удаленная работа•Middle, Senior

Команда голосовых технологий создает онлайн и офлайн модели распознания голоса и извлечения признаков, синтеза и клонирования речи.

Используемый технологический стек:

ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:

Собирать данные под домен, размечать данные;
Файнтюнить компоненты пайплайна под термины домена;
Развивать микросервисы инференса моделей;
Подбирать лучшие практики сбора и предобработки датасетов (в т.ч. Nemo Forced Aligner);
Разрабатывать модели поло-возрастной классификации.

Обладаете уверенными знаниями теории отрасли speech (сигналы, распознание, синтез, VAD, диаризация, фреймворки, токенизация);
Имеете высшее образование по компьютерным наукам, математике, физике (бакалавриат / магистратура / специалитет / аспирантура);
Пишете код на python с механиками асинхронизма для создания датасетов, pipeline;
Занимались обучением ASR CTC/RNN-T Conformer, NeMo (в т.ч. метрики обучения, пре-процессинг/пост-процессинг, лоссы);
Иметее опыт инференса Torch, ONNX, TensorRT, MultiGPU, pytorch-lightning;
Обладаете знаниями в отрасли NLP (n-gram, TF-IDF, Transformers);
Обладаете знаниями и опытом в отрасли синтеза речи.