Разрабатывать и поддерживать LLM/RAG-решения для бизнес-задач: - Интеграция внутренней документации (CRM, техническая база знаний) с LLM через векторные БД; - Оптимизация релевантности ответов за счет тюнинга эмбеддингов и ранжирования;
Работать с векторными базами данных: - Настройка и администрирование (QDrant, ChromaDB, pgvector); - Оптимизация скорости поиска и качества эмбеддингов (выбор моделей, размер chunk’ов, метрик сходства).
Интегрировать сервисы в существующую ИТ-инфраструктуру (API, брокеры сообщений, хранилища данных).
Создавать API-интеграции для LLM: - Построение микросервисов на FastAPI для обработки запросов к LLM; - Интеграция с внешними системами (CRM, чат-боты, аналитические платформы); - Обеспечение безопасности и аудита запросов (rate limiting, фильтрация данных).
Оптимизировать производительность и масштабируемость разрабатываемых сервисов для высоконагруженных систем.
Настраивать мониторинг технических и качественных метрик моделей.
Взаимодействовать с инженерами, аналитиками и продуктовыми командами.
Экспериментировать с генеративным ИИ: - RnD/Fine-tuning моделей (open-source Ollama / Cloud LLMs) под нишевые задачи; - Тестирование новых архитектур (агента на основе AutoGen, multi-agent системы); - Внедрение cost-эффективных решений (quantization, кэширование ответов).
Требования:
Опыт работы с RAG-архитектурами (от проектирования до оптимизации в production).
Python — продвинутый уровень (от 3 лет), умение писать чистый и поддерживаемый production код (OOP, SOLID), знание фреймворков FastAPI, ORM (sqlalchemy).
Понимание эмбеддингов: как генерировать, сравнивать, оптимизировать под задачи бизнеса.
Практический опыт с векторными БД: - Уверенное использование минимум одной: QDrant, ChromaDB; - Навыки настройки индексов, гиперпараметров поиска, обработки больших датасетов.
Знание LLM-стека: - Работа с LangChain, LlamaIndex; - Понимание принципов prompt engineering, retrieval strategies, reranking; - Опыт деплоя моделей через vLLM, Text Generation Inference или аналоги.
Навыки API-интеграций: - Создание REST api-сервисов для LLM; - Работа с асинхронными запросами, очередями и фоновыми задачами (Celery, RabbitMQ, Redis).
Опыт подготовки моделей к продакшену: - Docker, CI/CD.
Хорошее знание Linux.
Опыт работы с GitLab.
Понимание принципов MLOps и мониторинга (включая Grafana).
Опыт работы с SQL и NoSQL базами данных.
Способность самостоятельно разбираться в предметной области и видеть связь технической постановки с бизнес-потребностями.
Условия:
Работа на курорте "Роза Хутор";
Оформление по ТК РФ;
График работы 5/2 (с 9:00 до 18:00) или гибрид (3/2);
ДМС со стоматологией после испытательного срока;
Корпоративный транспорт (из Сочи, Адлера, Хосты, Кудепсты, Веселого, Чайсовхоза, Молдовки, Красной Поляны);
Мотивационный пакет (доступ к уникальным возможностям курорта, включая пользование канатными дорогами и различными услугами);