Вести план поставки данных по источникам: записи с роботов, внешние датасеты, симуляции, тестовые запуски, корректирующие демонстрации и данные, размеченные подрядчиками.
Переводить запросы на данные в конкретные задачи на сбор, разметку и проверку качества с объемами, приоритетами, сроками, критериями приемки и владельцами.
Координировать исследователей, инженеров, аналитиков, операторов тестирования, инфраструктурные команды и подрядчиков.
Фиксировать и поддерживать data contracts для сбора и подготовки датасетов к обучению: какие сигналы, метаданные, критерии качества и статусы готовности должны быть соблюдены.
Организовывать процессы разметки: ТЗ, инструкции, эталонные наборы примеров, согласованные сроки и критерии качества, приемка, учет дефектов и циклы исправлений.
Управлять статусами релизов датасетов.
Вести регулярные обзоры поставки данных, учет рисков, журналы решений, планы кампаний сбора данных и отчеты для команды и руководства.
Следить за основными метриками: скорость подготовки данных к обучению, сроки разметки, доля данных, прошедших проверку качества, и прирост полезных часов данных.
Помогать превращать ошибки модели и пробелы в тестах в понятные задачи на сбор, разметку, проверку и обновление датасетов.
Требования
От 3 лет опыта project/program management, data operations, technical operations, product operations, consulting или похожей роли в data/ML/R&D среде.
Умение управлять несколькими параллельными потоками с разными командами, сроками, зависимостями и приоритетами.
Будьте осторожны: если работодатель просит войти через Google, iCloud или Госуслуги, прислать код или пароль, запустить ПО или перевести деньги — это мошенники.
Будьте осторожны: если работодатель просит войти через Google, iCloud или Госуслуги, прислать код или пароль, запустить ПО или перевести деньги — это мошенники.