Dataspike — динамично развивающаяся российская технологическая компания, специализирующаяся на разработке продуктов в области комплаенс-контроля. Мы создаем онлайн-платформу на базе искусственного интеллекта и API-интерфейсов для эффективной верификации клиентов (KYC) и предотвращения отмывания денежных средств (AML).
Наши продукты помогают бизнесу обеспечивать высокий уровень безопасности и соответствия нормативным требованиям.
На данный момент мы в поиске CV Engineer / ML Data Specialist.
Вы будете отвечать за следующие направления деятельности:
Работа с данными:
- Поиск и подготовка высококачественных датасетов из различных источников, включая публичные ресурсы и внутренние задания.
- Проведение аугментации, препроцессинга и очистки данных для повышения точности моделей.
Разметка данных:
- Использование инструмента Label Studio для качественной разметки данных.
- Организация процесса полуавтоматической разметки для ускорения подготовки наборов данных.
Моделирование (опционально):
- Участие в обучении и тестировании базовых моделей машинного обучения.
- Подключение готовых решений, таких как модели от Hugging Face Transformers.
Инфраструктурные задачи:
- Интеграция разработанных пайплайнов в существующую инфраструктуру компании (Docker, Git, gRPC и другие инструменты).
Мы ждем от тебя
Технические навыки:
- Владение Python и библиотеками NumPy, OpenCV, Pillow, Matplotlib.
- Базовые знания PyTorch для разработки и тестирования моделей.
- Опыт работы с инструментами управления версиями (Git), контейнеризацией (Docker).
- Уверенное владение методами анализа и предварительной обработки данных, включая работу с изображениями.
Профессиональные качества:
- Ответственное отношение к качеству данных и внимание к деталям.
- Инициативность и способность самостоятельно находить пути улучшения процессов.
- Готовность оперативно осваивать новые навыки и эффективно справляться с рутинными задачами.
Мы предлагаем:
- Возможность стать частью молодой амбициозной команды единомышленников.
- Современные IT-стеки и регулярные обновления используемых технологий.
- Возможность работать удаленно.
- Работа над масштабными зарубежным проектам.