Обязанности:

Разрабатывать и поддерживать LLM/RAG-решения для бизнес-задач:
- Интеграция внутренней документации (CRM, техническая база знаний) с LLM через векторные БД;
- Оптимизация релевантности ответов за счет тюнинга эмбеддингов и ранжирования;
Работать с векторными базами данных:
- Настройка и администрирование (QDrant, ChromaDB, pgvector);
- Оптимизация скорости поиска и качества эмбеддингов (выбор моделей, размер chunk’ов, метрик сходства).
Интегрировать сервисы в существующую ИТ-инфраструктуру (API, брокеры сообщений, хранилища данных).
Создавать API-интеграции для LLM:
- Построение микросервисов на FastAPI для обработки запросов к LLM;
- Интеграция с внешними системами (CRM, чат-боты, аналитические платформы);
- Обеспечение безопасности и аудита запросов (rate limiting, фильтрация данных).
Оптимизировать производительность и масштабируемость разрабатываемых сервисов для высоконагруженных систем.
Настраивать мониторинг технических и качественных метрик моделей.
Взаимодействовать с инженерами, аналитиками и продуктовыми командами.
Экспериментировать с генеративным ИИ:
- RnD/Fine-tuning моделей (open-source Ollama / Cloud LLMs) под нишевые задачи;
- Тестирование новых архитектур (агента на основе AutoGen, multi-agent системы);
- Внедрение cost-эффективных решений (quantization, кэширование ответов).

Требования:

Опыт работы с RAG-архитектурами (от проектирования до оптимизации в production).
Python — продвинутый уровень (от 3 лет), умение писать чистый и поддерживаемый production код (OOP, SOLID), знание фреймворков FastAPI, ORM (sqlalchemy).
Понимание эмбеддингов: как генерировать, сравнивать, оптимизировать под задачи бизнеса.
Практический опыт с векторными БД:
- Уверенное использование минимум одной: QDrant, ChromaDB;
- Навыки настройки индексов, гиперпараметров поиска, обработки больших датасетов.
Знание LLM-стека:
- Работа с LangChain, LlamaIndex;
- Понимание принципов prompt engineering, retrieval strategies, reranking;
- Опыт деплоя моделей через vLLM, Text Generation Inference или аналоги.
Навыки API-интеграций:
- Создание REST api-сервисов для LLM;
- Работа с асинхронными запросами, очередями и фоновыми задачами (Celery, RabbitMQ, Redis).
Опыт подготовки моделей к продакшену:
- Docker, CI/CD.
Хорошее знание Linux.
Опыт работы с GitLab.
Понимание принципов MLOps и мониторинга (включая Grafana).
Опыт работы с SQL и NoSQL базами данных.
Способность самостоятельно разбираться в предметной области и видеть связь технической постановки с бизнес-потребностями.

Условия:

Работа на курорте "Роза Хутор";
Оформление по ТК РФ;
График работы 5/2 (с 9:00 до 18:00) или гибрид (3/2);
ДМС со стоматологией после испытательного срока;
Корпоративный транспорт (из Сочи, Адлера, Хосты, Кудепсты, Веселого, Чайсовхоза, Молдовки, Красной Поляны);
Мотивационный пакет (доступ к уникальным возможностям курорта, включая пользование канатными дорогами и различными услугами);
Полугодовой бонус по результатам работы курорта;
Позиция не подразумевает предоставление жилья.

AI Engineer

Сопроводим до оффера

Сопроводим до оффера

Похожие вакансии

LLM/RAG/AI Engineer (GigaChat Enterprise)

AI-инженер / AI Engineer

NLP Engineer (ML-Engineer) в проект "Чат-бот"

AI Lead

AI Lead

ML-engineer (NLP, LLM) (мидл уровень)

Похожие вакансии

LLM/RAG/AI Engineer (GigaChat Enterprise)

AI-инженер / AI Engineer

NLP Engineer (ML-Engineer) в проект "Чат-бот"

AI Lead

AI Lead

ML-engineer (NLP, LLM) (мидл уровень)