Специалист по маркировке и валидации данных OCR/IDP - контракт
Бангалор, Индия (гибридный формат)
Присоединяйтесь к ABBYY и станьте частью команды, которая ценит ваш уникальный стиль работы. С гибкими вариантами работы, поддерживающей командой и вознаграждениями, отражающими вашу ценность, вы сможете сосредоточиться на самом важном — развитии себя, одновременно способствуя нашему росту.
Наша приверженность уважению, прозрачности и простоте означает, что вы можете доверять нам всегда выбирать правильный путь.
Будучи надежным партнером в области специализированного ИИ и интеллектуальной автоматизации, мы решаем сложнейшие задачи для наших корпоративных клиентов и используем их информацию для трансформации их бизнеса. Более 10 000 клиентов доверяют ABBYY, включая многих из списка Fortune 500. Вы будете работать над дальнейшим развитием портфолио, в котором уже есть такие клиенты, как DHL, Johnson & Johnson, FDA, DMV, PwC, KeyBank, Spotify и H&R BLOCK.
Важное замечание
Это проектная контрактная позиция с первоначальным сроком 6 месяцев. Хотя продление контракта может быть предложено в зависимости от результатов работы и потребностей бизнеса, данная роль не предусматривает переход на постоянную занятость, если это явно не указано.
Обзор позиции
Мы ищем внимательных к деталям специалистов по маркировке и валидации данных для поддержки систем ABBYY OCR и интеллектуальной обработки документов (IDP).
Эта роль сочетает в себе практическую аннотацию документов с структурированной проверкой результатов автоматической маркировки. Вы сыграете ключевую роль в процессе с участием человека, обеспечивая обучение моделей машинного обучения на высококачественных, точных эталонных данных.
Для успешной работы на этой позиции требуется опыт практической аннотации и способность оценивать, соответствуют ли автоматические результаты требованиям качества, выявлять шаблоны ошибок и предоставлять структурированную обратную связь для улучшения работы моделей.
Основные обязанности
Аннотация документов
- Аннотировать полуструктурированные и неструктурированные документы в различных форматах и областях
- Выполнять маркировку ключевых элементов IDP, включая:
- Распознавание текста (включая рукописный)
- Классификация документов
- Извлечение полей (персональные данные, даты, суммы, подписи и др.)
- Обнаружение таблиц и их структуры
- Маркировка элементов макета документа, таких как зоны, порядок чтения и иерархия
- Проверка точности OCR-вывода и исправление ошибок распознавания
- Обработка сложных или неоднозначных форматов документов, выходящих за рамки автоматических возможностей
- Поддержание высокого уровня точности и последовательности во всех задачах аннотации
Валидация автоматической маркировки и анализ ошибок
- Проверять выборочные подмножества автоматически маркированных данных и сравнивать с эталонными
- Выявлять, классифицировать и документировать ошибки, включая различение:
- Изолированных проблем
- Систематических сбоев по типам документов
- Предоставлять структурированную, действенную обратную связь командам ML-инженеров
- Оценивать показатели уверенности и отмечать результаты ниже порогов качества
- Отслеживать метрики валидации с течением времени и выявлять тенденции качества
Обеспечение качества и обратная связь
- Проверять аннотации, выполненные другими членами команды, для обеспечения согласованности
- Выявлять и документировать крайние случаи (например, необычные макеты, неоднозначные поля)
- Участвовать в сессиях калибровки для согласования стандартов аннотации
- Предоставлять обратную связь для улучшения руководств по аннотации и рабочих процессов
- Строго соблюдать стандарты конфиденциальности и защиты данных
Требования
Образование и опыт
- Среднее образование или эквивалент; предпочтительно наличие степени младшего специалиста или бакалавра
- Опыт практической аннотации документов или маркировки данных не менее 1 года (требуется прямое выполнение аннотации)
- Доказанная способность поддерживать высокую точность при выполнении повторяющихся, ориентированных на детали задач
- Опыт работы с руководствами по аннотации и их соблюдение
Технические навыки
- Знание инструментов аннотации и платформ маркировки
- Понимание структуры документов и типов макетов
- Базовые знания практик конфиденциальности и безопасности данных
- Надежный компьютер и высокоскоростное интернет-соединение
- Хорошее понимание английского языка на уровне чтения и письменного общения
Аналитические навыки
- Способность различать изолированные ошибки и системные проблемы
- Сильное распознавание шаблонов в больших наборах данных
- Критическое мышление для оценки неоднозначных случаев и правильного эскалации
- Высокое внимание к деталям при проверке автоматически сгенерированных результатов
Желательно
- Опыт от 1 до 2 лет в OCR, IDP или процессах маркировки документов
- Опыт работы с системами автоматической маркировки или инструментами аннотации с поддержкой ИИ
- Опыт проверки или аудита машинно-сгенерированных результатов
- Знание показателей согласованности между аннотаторами и качества данных
- Экспертиза в отраслях с большим объемом документов (например, финансы, юриспруденция, здравоохранение)
- Владение языками, кроме английского
- Опыт работы с электронными таблицами, инструментами отслеживания данных или отчетности
Оплата и льготы
- Конкурентная почасовая ставка (в зависимости от местоположения и опыта)
- Гибкий график в рамках сроков проекта
- Удаленная работа
Что вы получите
- Практический опыт работы с реальными AI/ML пайплайнами данных
- Прямое сотрудничество с инженерами машинного обучения
- Знакомство с системами автоматической маркировки и технологиями документального ИИ
- Развитие навыков обеспечения качества данных, валидации и анализа ошибок
- Опыт, ценный для будущих ролей в операциях с ML-данными, QA или инженерии аннотаций
Обучение и поддержка
- Структурированное введение в должность (1–2 недели) с охватом инструментов, рабочих процессов и руководств
- Постоянная поддержка от менеджеров проектов и технических команд
- Доступ к подробной документации и лучшим практикам
- Регулярная обратная связь по результатам с метриками и рекомендациями по улучшению
Детали проекта
- Срок: 6-месячный контракт (продление в зависимости от результатов и потребностей проекта)
- Нагрузка: обычно 20–40 часов в неделю в зависимости от фазы проекта
- Структура команды: распределенная команда с налаженными каналами коммуникации
- Метрики эффективности:
- Точность аннотации
- Пропускная способность валидации
- Качество документации ошибок
- Соблюдение руководств
Требования к заявке
Пожалуйста, предоставьте:
- Резюме с выделением релевантного опыта в аннотации, маркировке данных или контроле качества
- Сопроводительное письмо с описанием вашего подхода к выявлению ошибок в автоматических результатах
- Примеры работ (если есть), демонстрирующие точность маркировки или проверки документов
Присоединившись к ABBYY, вы:
- Полюбите, как вы работаете
- Мы предлагаем удаленную и гибридную работу, подходящую для любого образа жизни.
- Мы используем гибкий график в большинстве команд, чтобы вы могли найти свое определение баланса.
- Поощряя культуру помощи, мы предоставляем два оплачиваемых дня волонтерства в год, чтобы вы могли уделить время важным для вас делам.
- Чтобы ваша семья была под заботой, мы предлагаем оплачиваемый отпуск по уходу за ребенком во всех наших локациях.
- Полюбите, с кем вы работаете
- Мы — глобальная команда из более чем 600 коллег, работающих в 15 странах на четырех континентах.
- Наш коллектив представляет более 30 национальностей, отражая многообразие мира.
- Инновации и совершенство — наша суть. Наши команды обладают экспертизой, которая принесла ABBYY более 140 патентов на технологии.
- Нас руководят ценности уважения, прозрачности и простоты.
- «Командная среда» входит в тройку самых высоко оцениваемых факторов вовлеченности во всех наших отделах.
- Полюбите, над чем вы работаете
- Мы — компания с более чем 35-летним опытом на рынке технологий;
- Более 10 000 клиентов доверяют ABBYY, включая многих из списка Fortune 500, таких как DHL, Johnson & Johnson, FDA, DMV, PwC, KeyBank, Spotify и H&R BLOCK;
- Мы модернизировали рынок захвата данных, создав первую low-code/no-code платформу IDP.
- Наши технологии машинного обучения, обработки естественного языка, компьютерного зрения и маркетплейс на базе ИИ могут преобразовать любой документ в любом процессе;
- Ведущие аналитические компании признают лидерство ABBYY на рынке, включая Gartner, Everest PEAK Matrix ® Assessment, ISG Intelligent Automation Lens и NelsonHall, среди прочих.
ABBYY является работодателем, предоставляющим равные возможности, который ценит силу разнообразия на рабочем месте. Чтобы узнать больше о нашей приверженности разнообразию и инклюзии, посетите раздел карьеры на нашем сайте.