Привет!
Robotmia – продуктовая IT-компания, специализирующаяся на технологиях машинного обучения, искусственного интеллекта и понимания естественного языка. На рынке больше 7 лет и каждый год растет минимум в 2 раза.
Основные продукты – "Голосовой ассистент" и "Модуль определения автоответчиков". С их помощью наши клиенты кратно увеличивают качество обслуживания своих пользователей и в разы сокращают расходы. А с операторов call-центров снимают скучную и рутинную работу.
Наши клиенты — российские компании из самых разных сфер (логистика, медицина, банковский сектор и другие). Многих из них ты можешь найти в ежегодном рейтинге Forbes “ТОП-200 крупнейших частных компаний России”.
Кого мы ищем:
Нам нужен Data Scientist, нацеленный на бизнес-результат.
Мы не занимаемся исследованиями ради исследований. Ты должен понимать: модель ценна только тогда, когда приносит прибыль или сокращает издержки. Ждем прагматика и энтузиаста, который умеет быстро проверять гипотезы и доводить решения до продакшна.
Чем предстоит заниматься:
Анализировать большие объемы аудиоданных (работа с ClickHouse) и проводить EDA для поиска неочевидных закономерностей;
Формулировать гипотезы, жестко привязанные к бизнес-метрикам (снижение операционных расходов, рост точности детекта);
Работать с сильным дисбалансом классов при классификации аудио;
Настраивать и применять алгоритмы кластеризации данных для выявления скрытых паттернов;
Исследование и применение современных архитектур нейронных сетей (CNN, RNN, LSTM, TCN и др.);
Работать над задачами коррекции аудио (шумоподавление) с применением современных архитектур;
Управлять ML-экспериментами через ClearML, обеспечивая воспроизводимость результатов.
Мы ожидаем от тебя:
Опыт в DS/ML от 3 лет, с фокусом на результат, а не на процесс;
Умение работать с большими базами данных (ClickHouse) и писать сложные аналитические запросы;
Опыт кластеризации данных (K-Means, DBSCAN, иерархические методы) и настройки этих алгоритмов;
Умение выбирать и настраивать архитектуры нейронных сетей для задач классификации (CNN, RNN, LSTM, Transformer и др.);
Опыт решения задач классификации с сильным дисбалансом классов (sampling, weighted loss, синтетические данные);
Python, Pandas/NumPy, Scikit-learn, PyTorch/TensorFlow;
Библиотеки для аудио: Librosa, torchaudio;
Опыт работы с ClearML (MLflow, Weights & Biases — как альтернатива, но плюсом именно ClearML);
Опыт разработки систем автоматического алертинга (мониторинг дрифта, аномалий, падения метрик в проде с автореакцией);
Git, Docker, Kubernetes (понимание CI/CD для ML).
Будет плюсом:
Опыт с архитектурами RNN, LSTM, TCN, Transformer, WaveNet;
Решения задач Source Separation или шумоподавления;
Участие в Kaggle с задачами классификации небалансированных классов;
Опыт работы с потоковыми данными и реальными production-системами.
Мы предлагаем:
Официальное трудоустройство в аккредитованной IT-компании;
Гибкий рабочий график 5/2, гибридный формат работы;
Стабильную зарплату 2 раза в месяц, отпуска и больничные;
Персонального наставника;
Креативную дружную команду, готовую помочь, научить и поддержать;
Удобный офис в Академгородке (2 мин. от станции Сеятель);
Уютную атмосферу и классные корпоративы;
Корпоративное обучение и карьерный рост.
Мы не корпорация, наша стратегия основана на доверии и долгосрочных отношениях. Если ты согласен с фразой “Ты – причина всех своих решений” - нам точно по пути!
Ждем твой отклик.
Будьте осторожны: если работодатель просит войти через Google, iCloud или Госуслуги, прислать код или пароль, запустить ПО или перевести деньги — это мошенники.