Автор на курс «Обучение с подкреплением — Reinforcement Learning»
Яндекс-Практикум — сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу. А технологии и команда экспертов помогают довести дело до конца.
Что делает автор?
- Создаёт материалы для новых курсов в команде с другими авторами, методистами, редакторами, иллюстраторами и продакт‑менеджерами программы.
- Пишет тексты уроков, в которых поддерживает интерес студентов к обучению.
- Улучшает существующий контент на основе обратной связи от студентов, экспертов сопровождения и редакторов.
- Разрабатывает дополнительные материалы (тренажёр, чек-листы, тесты, памятки, квизы) и тестовые задания для проверки знаний.
- Предлагает идеи, как улучшить усвоение материала.
- Участвует в проектировании программы.
Что мы ожидаем от вас?
Техническая и доменная экспертиза
- Знания классических методов RL: MDP, POMDP, value-based и policy-based подходы, уравнения Беллмана, стратегии исследования.
- Опыт работы с Deep Reinforcement Learning: DQN, Policy Gradient, Actor-Critic, PPO и смежные алгоритмы.
- Опыт реализации RL-систем: построение агента, буфера опыта, TD-обновлений, сетевых архитектур и обучающего контура.
- Понимание продвинутых методов поведения: curiosity-driven подходы, RND/ICM, model-based RL, планирование, многоагентные системы.
- Опыт работы с PyTorch: построение и обучение нейросетевых моделей, реализация policy/value-сетей, оптимизация.
- Практический опыт работы с RL-средами: OpenAI Gym/Gymnasium, PettingZoo, custom environments.
- Понимание продакшен-сервисов: API, Docker, логирование, мониторинг.
- “Боевой” опыт ведения типового ML проекта: проектирование пайплайнов, версионирование, работа с экспериментами, дебагинг.
Будет преимуществом
- Опыт применения RL в более, чем одной сфере: робототехнике, симуляторах, играх, рекомендательных системах или других.
- Опыт менторства, написания статей или образовательного контента на темы RL.
Что мы предлагаем?
- Мы предлагаем удаленное сотрудничество, нужно только быть на связи в мессенджерах и иногда в Zoom.
- Возможность экспериментировать и реализовать свой потенциал: мы доверяем вашему опыту и не тратим время и силы друг друга на микроменеджмент.
- Плавное погружение в сотрудничество: познакомим вас с инструментами разработки курсов и с командой, которая поможет преобразовать ваши знания в целый курс.
- Пополнение портфолио: мы выдаем нашим экспертам сертификаты о социально-полезной деятельности.
- Нетворкинг, поддержка и вдохновение от комьюнити экспертов из разных сфер.
- Возможность писать статьи и участвовать в конференциях, мероприятиях и подкастах Яндекс-Практикума.