Мы ищем Python-разработчика (Middle+/Senior) для долгосрочного проекта (от 1 года) в иностранную компанию — одного из игроков рынка покупки и продажи автозапчастей.
Суть проекта:
Необходимо разработать бота, который будет взаимодействовать с веб-сервисом исключительно по картинке экрана, имитируя действия живого пользователя. Доступ к сервису осуществляется через RDP (VMware Horizon). Исходного кода страницы (DOM) и API нет, но текст и элементы интерфейса доступны для выделения и копирования.
Это не типичная RPA-задача с готовыми конструкторами, а кастомная разработка движка для работы с интерфейсами, где нет доступа к внутренностям. Если ты писал ботов для игр или автоматизировал «тяжелые» legacy-системы по скриншотам — нам по пути.
Чем предстоит заниматься:
Разработка движка, который исполняет сценарии, описанные в YAML/JSON.
Реализация захвата экрана/окна и управление мышью/клавиатурой (клики, скролл, сочетания клавиш, работа с буфером обмена).
Распознавание состояния интерфейса: поиск элементов по шаблону (template matching), поиск текста с помощью OCR (Tesseract или аналоги), проверка, что бот попал на нужный экран.
Создание механизма логирования успешных/неуспешных действий с возможностью «обучения на опыте» (оптимизация маршрутов, расширение словарей паттернов, кэширование).
Обработка нестандартных ситуаций: таймауты, всплывающие окна, ошибки распознавания.
Мы ждем от тебя:
Обязательно:
Коммерческий опыт автоматизации UI по картинке/скриншоту (не по DOM).
Опыт работы через RDP/удаленный рабочий стол (особенно VMware Horizon).
Уверенное знание Python, опыт написания чистового кода, а не только склейки библиотек.
Практические навыки работы с OpenCV (template matching, поиск изображений).
Опыт интеграции OCR (Tesseract или аналоги) для извлечения текста.
Понимание, как строить конфигурируемые сценарии и писать движок для их исполнения.
Будет плюсом:
Опыт разработки кастомных RPA-решений (не только drag-n-drop инструменты).
Навыки работы с текстовыми эмбеддингами и fuzzy search для сопоставления названий.
Наличие в портфолио проектов типа «бот, который играет/работает по скриншоту».
Условия работы:
Локация и гражданство: Без ограничений. Работаем удаленно.
Формат: Проектная работа (remote), долгосрочный проект (от 1 года с возможным продлением).
Оплата производится за фактически отработанные часы (еженедельно/ежемесячно, обсуждаемо).
Ключевые навыки:
Python, OpenCV, RPA, Computer Vision, Tesseract, Image Recognition, Automation, RDP, VMware, YAML, JSON.