- Подготовка аналитической информации в сфере нормативно-технических документов;
- формирование XML-файлов согласно методическому пособию;
- проведение семантического анализа требований, содержащихся в Реестре требований ЕИС «Стройкомплекс.РФ»;
- перевод требований нормативных документов, используемых в строительстве, в цифровой (машиночитаемый и машинопонимаемый) формат представления данных;
- Подбор конфигураций (CPU, GPU, RAM, диски) под задачи работы с LLM;
- Реализация контура: документы мбеддинги/ векторная БД/запрос к LLM;
- Написание скриптов для обработки данных, работы с файлами и API;
- Автоматизация рутинных задач (парсинг, конвертация, загрузка данных и т. п.);
- Практическое использование эмбеддингов, чанкинга и поиска «по смыслу»;
- Написание парсеров/ETL-скриптов для сбора и очистки данных из различных источников (PDF, сайты, документы);
- Подготовка структурированных корпусов для базы знаний.
Требования:
- Понимание различий в ресурсах для обучения и инференса моделей;
- Понимание на уровне применения: модель, токенизация, эмбеддинги;
- Опыт использования готовых моделей в прикладных задачах;
- Знание языков программирования.
- Практическая работа с open-source LLM через готовые инструменты/рантаймы;
- опыт работы с векторной БД (Chroma, Qdrant, Weaviate и др.);
Условия:
Работа в стабильной, динамично-развивающейся компании;
- Команда постоянно развивается, участвует в решении амбициозных и интересных задач, которые влияют на дальнейшее развитие строительной отрасли;
- Оформление по ТК РФ;
- Возможность профессионального, личностного и карьерного роста;
- Испытательный срок 3 месяца




