разработка и поддержка промышленных пайплайнов вокруг больших языковых моделей (LLM) — интеграция агентов, RAG-модулей, кэширования и асинхронных очередей
реализация многоагентных систем на базе LangGraph / LangChain — orchestration, routing, memory-модули, логика принятия решений
интеграция LLM API (GigaChat, OpenAI, Gemini, Qwen) и разработка внутренних сервисов общения между агентами
подключение векторных и поисковых движков (OpenSearch, Qdrant) для семантического поиска в юридических документах
разработка внутренних REST/gRPC-API для взаимодействия с фронтом, хранилищем и внешними LegalTech-системами
настройка пайплайнов логирования, трейсинга и мониторинга (Prometheus, Grafana, Loki)
совместная работа с Data Science-командой — внедрение моделей, дообучение и эксперименты в продакшне.
Требования
опыт коммерческой разработки на Python 3+ от 3 лет
глубокое понимание асинхронного программирования, многопоточности и очередей сообщений
опыт построения микросервисной архитектуры и REST/gRPC-API
навыки работы с векторными базами данных или поисковыми движками
базовое понимание принципов работы LLM, RAG, агентов и промтинг-пайплайнов