Мы — команда GigaSearch, создаём поисковый сервис, который отвечает на запросы пользователей на естественном языке. Наша миссия: предоставить GigaChat доступ к актуальной информации, чтобы пользователи получали точные ответы на любые вопросы — включая самые свежие новости и события.
Миссия команды: Сломать барьер между статичными знаниями языковой модели и постоянно меняющимся миром. Мы предоставляем GigaChat доступ к актуальной информации, чтобы пользователи получали точные ответы на любые вопросы, включая вопросы о свежих новостях и событиях.
В нашем проекте мы используем самые современные подходы к решению задачи Information Retrieval, проводим эксперименты по улучшению ранжирования поисковой выдачи с использованием методов машинного обучения, запускаем и анализируем результаты A/B тестов.
Обязанности
- участие в разработке и развитии ML части поискового движка
- разработка и оптимизация алгоритмов и моделей машинного обучения для задач поиска и ранжирования.
- обучение и дообучение моделей на базе Transformer-архитектур.
- планирование и проведение исследований и экспериментов для улучшения качества поиска (офлайн-оценка, анализ метрик)
- изучение SOTA архитектур и применение их в построении ML решений
- изучение и подбор релевантных бенчмарков для оценки качества ранжирования
- постановка и проведение исследовательских экспериментов: дизайн эксперимента, выбор метрик, интерпретация результатов, принятие продуктовых решений на основе данных.
- навык формулирования и проверки гипотез, умение работать с неопределённостью и предлагать несколько альтернативных подходов к решению задачи
- интеграция ML-решений в продакшн: подготовка сервисов, взаимодействие с разработчиками и инфраструктурой.
Требования
- опыт работы в задачах NLP, ранжирования, поиска или рекомендаций от 2 лет.
- хорошее знание классических структур данных и алгоритмов, фундаментальное понимание принципов работы классических алгоритмов машинного обучения и нейросетевых архитектур
- практический опыт работы с современными языковыми моделями на архитектуре Transformer (обучение, дообучение, интеграция в продукт).
- уверенное владение Python, умение писать читаемый, поддерживаемый и тестируемый код.
- опыт работы с фреймворками глубокого обучения.
Будет плюсом:
- опыт работы с RAG-системами и понимание их специфики (чанкование, эмбеддинги, ретривер vs. генератор)
- практика с фреймворками автоматической оценки: Ragas, DeepEval, TruLens, MLflow Evaluate
- опыт работы с краудсорсинговыми платформами (Толока, Label Studio и аналоги)
- знакомство с OpenSearch / ElasticSearch как поисковым инструментом.
Условия
- ежегодный пересмотр зарплаты, годовой бонус
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа.