О проекте

B2B SaaS-продукт, работающий с большими объёмами слабоструктурированных документов (PDF / DOCX / XLSX) и строящий на них аналитику. Сейчас вся обработка данных — rule-based (regex + словари). Запускается контур локального LLM-инференса для нормализации и извлечения структурированных данных.

Ограничение: данные — коммерческая тайна, деплой только on-prem, облачные LLM-API исключены — используются открытые модели локально.

Junior ML/LLM-инженер Локальный LLM-инференс и извлечение данных из документов. On-prem, без облачны

Задачи

Эксперименты с открытыми LLM: подбор моделей и промптов под задачи извлечения, сравнение результатов.

Разработка кода извлечения структурированных данных (constrained JSON) из документов и таблиц на Python в существующем бэкенде.

Сбор и разметка наборов для оценки качества, расчёт метрик (точность по полям), отслеживание регрессий при смене модели или промпта.

Нормализация данных: дедупликация и сопоставление сущностей, очистка полей правилами и LLM.

Поддержка OCR-пайплайна для сканов (Tesseract / Surya / PaddleOCR).

Работа с очередью ручной проверки результатов.

Требования

Коммерческий опыт на Python — от 1 года: продакшен-код, работа в команде и с чужой кодовой базой.

Уверенный Python: ООП, структуры данных, чистый читаемый код.

Портфолио с проектами на LLM/ML — собственные или рабочие, с возможностью показать (GitHub) и разобрать.

Практический опыт с LLM: запуск моделей, написание промптов под задачи, RAG, работа с эмбеддингами.

Git, Docker. Английский на чтение документации.

Будет преимуществом

Опыт fine-tune (LoRA/QLoRA) или дообучения эмбеддеров.

Локальный запуск моделей: Ollama / llama.cpp / vLLM.

SQL, опыт с PostgreSQL.

Понимание основ ML: метрики качества, train/val, переобучение.

Обработка текста и таблиц (pandas, парсинг документов).

ML-соревнования (Kaggle и т. п.).

Матузова Олеся Васильевна

11 июн.

AI Engineer / AI Automation Specialist / AI Workflow Engineer

ЗП не указана, ≈ 249 033 ₽

Санкт-Петербург

Middle

Senior

АНО ЦИСМ

11 июн.

ML-разработчик (CV)

ЗП не указана, ≈ 249 033 ₽

Москва

Senior

АНО ЦИСМ

11 июн.

ML-разработчик (NLP/LLM)

ЗП не указана, ≈ 249 033 ₽

Москва

Middle

Senior

MR Group, группа компаний

11 июн.

AI-инженер (Дирекция продукта)

ЗП не указана, ≈ 249 033 ₽

Москва

Middle

Senior

Coasthill IV LLC-FZ

11 июн.

AI-инженер по автоматизации

ЗП не указана, ≈ 249 033 ₽

Москва, Дубай

Удалённо

Middle

Сбер

11 июн.

ML Engineer

ЗП не указана, ≈ 249 033 ₽

г Москва

Middle

Senior

ML/LLM-инженер

О проекте

Задачи

Стек

Требования

Будет преимуществом

Наш телеграм канал с вакансиями каждый день

Сопроводим до оффера

Сопроводим до оффера

Похожие вакансии

AI Engineer / AI Automation Specialist / AI Workflow Engineer

ML-разработчик (CV)

ML-разработчик (NLP/LLM)

AI-инженер (Дирекция продукта)

AI-инженер по автоматизации

ML Engineer