Data Scientist в команду Deep Personalization
Команда Монетизация
ЛокацияМосква, можно удаленно
В работе мы ставим амбициозные цели и не остаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
Если вы хотите развивать свою карьеру и иметь влияние на продукт, эта позиция именно для вас!
О команде
Мы отвечаем за персонализацию главной страницы Авито — подбираем объявления для десятков миллионов пользователей так, чтобы каждый видел максимально релевантный контент. Мы развиваем двухбашенные трансформерные модели, работаем со state-of-the-art подходами в recommendation systems и ведём полный цикл разработки: от исследования архитектур до продакшен-инferenса с ANN-поиском и кэшированием эмбеддингов.
Пример нашей работы: доклад на DataFest о двухбашенных моделях для персонализации.
Примеры будущих задач:
- Проектировать и поддерживать ETL-пайплайны на Spark для обработки миллиардов событий;
- Строить витрины данных и управлять их качеством;
- Оптимизировать распределённую подготовку обучающих датасетов;
- Развивать архитектуру двухбашенной трансформерной модели: улучшать энкодеры пользователей и айтемов, экспериментировать с обработкой изображений и функциями потерь;
- Исследовать и адаптировать современные подходы: sequence modeling, multimodal encoders, advanced retrieval architectures;
- Масштабировать обучение на multi-GPU/multi-node, оптимизировать throughput и конвергенцию;
- Интегрировать модели в продакшен: экспорт в ONNX, настройка ANN-индексов, работа с Redis;
- Проводить AB-тесты, анализировать влияние на метрики (CTR, конверсии, retention);
- Итерировать на основе результатов экспериментов.
Мы ждём, что вы:
- Хорошо понимаете deep learning: обучали трансформеры, seq2seq или двухбашенные модели в продакшене;
- Уверенно владеете PyTorch и имеете опыт работы с большими объёмами данных;
- Понимаете распределённое обучение (DDP, FSDP) и умеете отлаживать пайплайны;
- Имеете опыт формулирования гипотез, дизайна экспериментов и интерпретации AB-тестов.
Будет здорово, если вы:
- Имеете опыт в области recommendation systems или information retrieval;
- Работаете с PySpark/SQL для обработки больших данных;
- Знакомы с современными исследованиями в области recommendations (Tiger, DSSM, контрастивное обучение).
Работа у нас — это:
- Возможность влиять на бизнес и развитие продукта;
- Интересные и разнообразные задачи: аналитики в Авито ищут точки роста бизнеса, изучают поведение пользователей, придумывают фреймворки и настраивают дашборды;
- Много качественных данных, мощная инфраструктура и инструменты, любое необходимое железо — всё готово для продуктивной работы;
- Талантливая команда, крутая аналитическая культура и сообщество профессионалов;
- Прозрачная система премий, достойная зарплата — размер обсудим на собеседовании;
- Личный бюджет на обучение, который можно тратить на книги, курсы и конференции;
- Забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
- Удалёнка и замечательный офис в двух минутах от метро «Белорусская»: панорамный вид центр города, места для уединённой работы и зоны отдыха.
Откликнуться