Технологии/инструменты

Обязанности

Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation.
Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking).
Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя.
Настраивать и оптимизировать векторный и гибридный поиск.
Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов.
Разрабатывать агентные системы с использованием инструментов и многошаговым планированием.
Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели.
Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy).
Контейнеризировать и деплоить решения на on-prem инфраструктуру.

Опыт работы от 3 лет.
Опыт работы с AI-инструментами: от года.
Опыт создания RAG-систем.
Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference.
Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках.
Знание LangChain, LlamaIndex.
LLM-инференс: OpenAI API, GigaChat API, LLM, Ollama.
Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch.
Знание Hybrid search: BM25 + dense retrieval, reciprocal rank fusion.
Опыт построения Embedding-модели: e5, bge, multilingual-e5.
Знание Python, Git, Docker, Docker Compose.
Знание PostgreSQL, Redis.
Методы оценки: hit rate, RAGAS, human evaluation.
Способность объяснить принятые технические решения и их trade-offs.

Достойная заработная плата + годовой бонус.
Сильная команда.
ДМС, с первого рабочего дня.
Работа в аккредитованной IT-компании.
Льготная ипотека от Сбера.
Локация: Москва, м. Цветной бульвар, формат работы преимущественно удалённый / гибридный с редкими визитами в офис в Москве по необходимости.