Мы ищем стажера, которому было бы интересно обучать модели машинного обучения на стыке Computer Vision и Natural Language Processing. Наш основной проект – IDP (Intelligent Document Processing). Тебя ждёт работа над реальными проектами под руководством опытного наставника в молодом коллективе, участие в выводе в промышленную эксплуатацию моделей, которые позволят улучшить опыт взаимодействия пользователей с продуктом.
Стажировка длиться 6 месяцев с трудоустройством успешного кандидата.
Что предстоит делать:
Помощь в разработке и тестировании моделей NLP и CV
Участие в сборе, очистке и анализе данных (работа с текстами и изображениями)
Поддержка backend-разработки на Python
Помощь в интеграции моделей в продакшн
Участие в создании ML-пайплайнов (автоматизация этапов обработки и обучения)
Проведение небольших исследований (R&D) под руководством ментора (например, сравнение моделей)
Ведение документации и бэклога по задачам
Что мы ожидаем:
Базовые знания Python
Понимание основ машинного обучения (обучение/валидация, переобучение, метрики)
Ознакомление с NLP (токенизация, эмбеддинги, Transformers) или CV (классификация, детекция)
Умение писать простые SQL-запросы
Базовое понимание Docker
Желание учиться, задавать вопросы и расти в Data Science





