Основанная в США в 2022 году и теперь базирующаяся в Лондоне, Великобритания, компания Recraft — это инструмент на базе ИИ для профессиональных дизайнеров, иллюстраторов и маркетологов, устанавливающий новый стандарт качества в генерации изображений.
Мы разработали инструмент, который позволяет создателям быстро генерировать и итеративно создавать оригинальные изображения, векторное искусство, иллюстрации, иконки и 3D-графику с помощью ИИ. Более 3 миллионов пользователей из 200 стран создали сотни миллионов изображений с помощью Recraft, и мы только начинаем.
Присоединяйтесь к вселенной профессиональных возможностей, развивайте и поддерживайте крупномасштабные проекты и формируйте будущее творчества. Мы стремимся сделать Recraft незаменимым ежедневным инструментом для каждого дизайнера и установить отраслевой стандарт. Наша миссия — обеспечить создателям полный контроль над их творческим процессом с помощью ИИ, предоставляя им инновационные инструменты для воплощения идей в реальность.
Если вы увлечены расширением границ ИИ, мы хотим видеть вас в нашей команде!
В Recraft мы создаём следующее поколение генеративных моделей для изображений и текста. Мы ищем ML Data Engineer для масштабирования наших конвейеров данных для неструктурированных данных (в основном изображений) и обеспечения быстроты, надёжности и повторяемости наших процессов обучения. Вы будете проектировать и эксплуатировать высокопроизводительные процессы загрузки и предварительной обработки на Kubernetes, развивать нашу внутреннюю инфраструктуру конвейеров данных и тесно сотрудничать с инженерами машинного обучения для поставки наборов данных, которые повышают качество моделей.
Разрабатывать и поддерживать конвейеры загрузки данных для получения и подготовки крупномасштабных наборов изображений (и иногда текста/HTML) из открытых, общедоступных и разрешённых источников.
Отвечать за полный цикл: необработанные данные → фильтрация по качеству/красоте/релевантности → удаление дубликатов/валидация → готовые к обучению артефакты.
Эксплуатировать и улучшать нашу инфраструктуру конвейеров данных на базе Kubernetes (распределённые задачи, повторные попытки, мониторинг, автоматизация).
Работать с объектным хранилищем в стиле S3: эффективные схемы хранения, жизненный цикл, пропускная способность и оптимизация затрат.
Добавлять инструменты вокруг конвейеров (визуализация прогресса/состояния, метрики, оповещения) для наблюдаемости и ускорения итераций.
Тесно сотрудничать с инженерами машинного обучения для согласования наборов данных с требованиями обучения и ускорения экспериментов.
Обязательные
Прочные знания Python; вы пишете чистый, поддерживаемый, готовый к продакшену код.
Опыт практической работы с Kubernetes (контейнеры, задачи, пакетная/распределённая обработка).
Подтверждённый опыт работы с неструктурированными данными, особенно с изображениями (загрузка, фильтрация, масштабное преобразование).
Опыт разработки инструментов для загрузки или парсинга данных из общедоступных источников, включая грамотное управление реальными случаями отказов и надёжности.
Уверенное владение S3/объектным хранилищем и эффективной, безопасной передачей больших объёмов данных.
Практичный, внимательный к деталям, с менталитетом ответственности; вам нравится делать системы надёжными и быстрыми.
Желательные
Знакомство с ML-воркфлоу (PyTorch) и особенностями downstream-обучения.
Опыт работы с оценкой качества изображений, созданием подписей или конвейерами image-to-text.
Визуализация DAG/воркфлоу или инструменты UX для конвейеров.
Знания DevOps: Docker, CI/CD, автоматизация инфраструктуры.
Конкурентоспособная зарплата и долевое участие.
Мы можем предложить спонсорство визы Skilled Worker в Великобритании для квалифицированных кандидатов.
Реальное влияние на качество моделей: ваши конвейеры напрямую поддерживают обучающие запуски и улучшения продукта.
Ответственность с поддержкой: автономия в проектировании и улучшении систем вместе с опытными коллегами из ML.
Современный стек: Python, Kubernetes, S3, внутренняя инфраструктура конвейеров, созданная для масштабирования.
Рост: динамичная среда, где выпуск хорошо спроектированных систем — норма.