IT компания MA - крупнейший провайдер данных о товарах и ценах для федеральных розничных сетей. Область экспертизы - управление массовым персоналом и обработка больших массивов данных. Компания основана в 2012 году, резидент Сколково, аккредитована в Минцифры.
У нас есть 2 продукта:
MA.works - Большой и сложный программный комплекс, который позволяет нам собирать и обрабатывать миллионы строк данных для крупных корпоративных заказчиков.
MA.direct - SaaS решение для управления массовым мобильным персоналом, сбора данных, их последующей обработки и представления.
Сейчас мы в поиске Data Scientist.
Предстоящие задачи:
Поддержка и развитие нейросетевой модели (CV) по распознаванию ценников;
Поддержка и развитие текущей системы сопоставления товарных позиций, максимальная автоматизация мэтчинга товарных позиций по названию или, в идеальном варианте, гибридной (название + картинка);
Разработка и внедрение нейросетевых моделей в управление работой конвейера. Process mining;
Разработка и внедрение нейросетевых моделей в прочие типовые операции по обработке данных.
От вас мы ждем инициативы в поиске подходов и алгоритмов.
Требуемый опыт:
SQL: написание, профилирование и оптимизация запросов;
Знания рекуррентной нейронных сетей, языковых моделей;
Уверенно пользуетесь IDE, например: PyCharm, VS Code, Sublime, Vim;
Python: опыт работы с Scikit-learn, SciPy;
Опыт работы с фреймворками Pytorch и TensorFlow (Keras);
Умеете читать и рефакторить чужой код;
Для решения своих задач используете jupyter-тетрадки, а также библиотеки pandas и numpy;
Знание алгоритмов машинного обучения, опыт решения задач в области NLP;
Знакомы с библиотеками: PIL, OpenCV, scipy, sklearn;
Обучали модели на GPU не в облаке (!), умеете развертывать модели на nvidia-docker;
Имеете опыт ML-разработки на нейросетевых задачах в продакшене;
Имеете опыт применения машинного обучения для реальных бизнес-задач, работы с сырыми данными, разработки моделей и их валидации;
Имеете опыт ведения проекта от разработки модели до внедрения в продакшен;
Разворачивали модели машинного обучения (не обязательно нейросетевые) в продакшн (REST API).
Будет плюсом, если вы:
Свободно владеете теорией построения архитектуры и state of art решениями для распознавания текстов и детекции объектов с изображений;
Знаете технологии Kafka, Hadoop, Avro;
Имеете в портфолио пет-проекты по OCR/распознаванию текста на изображениях;
Работали с системами на базе OS Linux;
Понимаете в профилировании и работе с ресурсами системы;
Есть опыт в работе с современными форматами разметки данных: CVAT, Label studio и т.д.
Что мы предлагаем:
Взаимодействие с эффективной командой с глубоким пониманием процессов управления массовыми полевыми исполнителями и массовой обработки данных;
Официальное трудоустройство по ТК РФ, полностью белая зарплата, в том числе бонусная часть;
Удобный график с гибким началом рабочего дня;
Возможность работать удаленно, по гибридному графику или в офисе;
Обучение и развитие: компания компенсирует профессиональное обучение;
Ежемесячная компенсация каршеринга;
Реальная возможность влиять на результаты и быстро воплощать идеи в жизнь;
Отсутствие дресс-кода, бюрократии, формализма в процессах и коммуникациях;
Офис рядом с метро Цветной бульвар.