MWS AI – это часть экосистемы МТС Web Services, где создаются AI-решения будущего. Здесь мы разрабатываем современные AI-решения для различных сфер: от банковской до медицины и телекома. Мы стремимся к инновациям в области речевого ИИ, видеоаналитики и Gen AI: активно занимаемся исследованиями и публикуем научные статьи. В MWS AI вы найдете профессиональное сообщество единомышленников и возможности для реализации прорывных проектов.
Мы ищем опытного AI-инженера, который сможет превратить сложные бизнес-задачи в работающие, масштабируемые AI-решения. Фокус на решении реальных бизнес-проблем, а не на исследованиях. Нам важно стратегическое мышление: умение быстро собирать PoC, валидировать их на метриках и итеративно доводить MVP до продакшена
Основные задачи:
Анализ и декомпозиция бизнес-задач
Проектирование архитектуры AI-решений совместно с командой: выбор подходящих паттернов
Внедрение метрик качества (точность, релевантность, время ответа), регулярный анализ результатов, формулирование гипотез, итеративное улучшение решения
Разработка AI-агентов и copilot-систем (оркестрация агентов, управление памятью, планирование и декомпозиция задач, умная маршрутизация)
Построение RAG-систем: выбор стратегий индексации, определение оптимального чанкинга, обогащение метаданными, реализация гибридного поиска и переранжирования
Версионирование промтов, моделей, датасетов
Внедрение наблюдаемости (observability) решений: трейсинг цепочек вызовов, мониторинг качества ответов, контроль затрат токенов и времени ответа
Взаимодействие с командой разнонаправленных специалистов (backend/devops/ml/promt-engineer)
Мы ждем от вас:
3+ лет прикладной AI/ML-разработки с фокусом на NLP и LLM-системы
Опыт с LLM API: промпт-инжиниринг, управление контекстом, streaming
Практический опыт с LLM-агентами: ReAct-паттерн, function calling, chain-of-thought рассуждения, multi-agent системы
Обязательное знание LangFlow, n8n или аналоги
Глубокое понимание RAG: векторный и гибридный поиск, стратегии чанкинга, переранжирование
Сильный Python: чистый, типизированный код, unit-тесты, асинхронное программирование, ооп, docker
Знание фреймворков: LangChain, LangGraph, CrewAI или аналоги
Векторные базы данных: Milvus, Chroma или аналоги
LLM observability tools: LangFuse или подобные платформы
Понимание микросервисной архитектуры
Опыт с FastAPI или аналогами
Способность объяснить сложные AI-концепции нетехническим стейкхолдерам
Будет преимуществом опыт fine-tuning и дистилляции моделей, а также понимание современных архитектур сетей
Практический опыт с семействами Qwen, GLM, DeepSeek и аналогами
Понимание принципов развёртывания LLM: инференс-серверы (vLLM, sglang), масштабирование, квантизация, GPU trade-offs
Что мы предлагаем:
Будьте осторожны: если работодатель просит войти через Google, iCloud или Госуслуги, прислать код или пароль, запустить ПО или перевести деньги — это мошенники.