Data Scientist в команду Deep Personalization

ЛокацияМосква, можно удаленно

В работе мы ставим амбициозные цели и не остаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

Если вы хотите развивать свою карьеру и иметь влияние на продукт, эта позиция именно для вас!

О команде

Мы отвечаем за персонализацию главной страницы Авито — подбираем объявления для десятков миллионов пользователей так, чтобы каждый видел максимально релевантный контент. Мы развиваем двухбашенные трансформерные модели, работаем со state-of-the-art подходами в recommendation systems и ведём полный цикл разработки: от исследования архитектур до продакшен-инferenса с ANN-поиском и кэшированием эмбеддингов.

Пример нашей работы: доклад на DataFest о двухбашенных моделях для персонализации.

Примеры будущих задач:

Проектировать и поддерживать ETL-пайплайны на Spark для обработки миллиардов событий;
Строить витрины данных и управлять их качеством;
Оптимизировать распределённую подготовку обучающих датасетов;
Развивать архитектуру двухбашенной трансформерной модели: улучшать энкодеры пользователей и айтемов, экспериментировать с обработкой изображений и функциями потерь;
Исследовать и адаптировать современные подходы: sequence modeling, multimodal encoders, advanced retrieval architectures;
Масштабировать обучение на multi-GPU/multi-node, оптимизировать throughput и конвергенцию;
Интегрировать модели в продакшен: экспорт в ONNX, настройка ANN-индексов, работа с Redis;
Проводить AB-тесты, анализировать влияние на метрики (CTR, конверсии, retention);
Итерировать на основе результатов экспериментов.

Мы ждём, что вы:

Хорошо понимаете deep learning: обучали трансформеры, seq2seq или двухбашенные модели в продакшене;
Уверенно владеете PyTorch и имеете опыт работы с большими объёмами данных;
Понимаете распределённое обучение (DDP, FSDP) и умеете отлаживать пайплайны;
Имеете опыт формулирования гипотез, дизайна экспериментов и интерпретации AB-тестов.

Будет здорово, если вы:

Имеете опыт в области recommendation systems или information retrieval;
Работаете с PySpark/SQL для обработки больших данных;
Знакомы с современными исследованиями в области recommendations (Tiger, DSSM, контрастивное обучение).

Работа у нас — это:

Возможность влиять на бизнес и развитие продукта;
Интересные и разнообразные задачи: аналитики в Авито ищут точки роста бизнеса, изучают поведение пользователей, придумывают фреймворки и настраивают дашборды;
Много качественных данных, мощная инфраструктура и инструменты, любое необходимое железо — всё готово для продуктивной работы;
Талантливая команда, крутая аналитическая культура и сообщество профессионалов;
Прозрачная система премий, достойная зарплата — размер обсудим на собеседовании;
Личный бюджет на обучение, который можно тратить на книги, курсы и конференции;
Забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
Удалёнка и замечательный офис в двух минутах от метро «Белорусская»: панорамный вид центр города, места для уединённой работы и зоны отдыха.

Про направление Про команду Подготовка к интервью

Откликнуться

Data Scientist

Data Scientist в команду Deep Personalization

О команде

Примеры будущих задач:

Мы ждём, что вы:

Будет здорово, если вы:

Работа у нас — это:

Про направление Про команду Подготовка к интервью

Сопроводим до оффера

Сопроводим до оффера

Похожие вакансии

Data Scientist

Data Scientist (AI/ML/B2C)

Team Lead Data Scientist

Data Scientist (ML Autotasking)

NLP Data Scientist (ИИ-агенты)

Программист-математик

Похожие вакансии

Data Scientist

Data Scientist (AI/ML/B2C)

Team Lead Data Scientist

Data Scientist (ML Autotasking)

NLP Data Scientist (ИИ-агенты)

Программист-математик