Twinby — один из крупнейших российских дейтинг-сервисов с миллионами пользователей. Мы собираем сильную продуктовую ML-команду и ищем играющего тимлида DS/ML, который возьмёт на себя три ML-направления, напрямую двигающих продукт и деньги:
- Рекомендации / матчинг — кого и в каком порядке показывать в ленте (ранжирование, кандидат-генерация → реранкинг).
- Антифрод / антискам — боты, накрутки, фейки, romance scam.
- Модерация контента — CV/NSFW и текст, Trust & Safety, безопасность пользователя.
Это роль и про глубокий прод-ML до бизнес-метрики, и про то, чтобы рядом росла команда. Ты будешь владеть направлением целиком — от гипотезы до раскатки и эффекта.
Чем предстоит заниматься:
- Владеть ML-направлением: доводить модели до боя и мерить эффект бизнес-метриками (конверсия, retention, fraud rate), а не только офлайн-метрикой.
- Ставить процесс экспериментов: гипотеза → офлайн → A/B → раскатка → мониторинг дрейфа.
- Растить команду: менторство, найм, развитие DS/ML-инженеров.
- Приоритизировать ML-работу по бизнес-эффекту и договариваться с продуктом.
Что мы ждём:
- Опыт, где ты вёл или строил рекомендации/ранжирование, антифрод/риски, поиск или модерацию и довёл их до измеримого влияния на бизнес-метрику (A/B, цифры). Сам недавно «в проде».
- Зрелое A/B: дизайн теста, длина и мощность, новелти- и сетевые эффекты, заранее заданный критерий успеха; умеешь отделить офлайн-метрику от бизнес-эффекта.
- Понимание прод-реалий ML: утечки данных (data leakage), дрейф моделей, train/serve skew, бюджет latency на инференс — для тебя норма.
- Опыт ведения ML-команды/направления: растил инженеров, нанимал, ставил процесс экспериментов.
- Говоришь и про модели (AUC/NDCG), и про бизнес (конверсия/retention/fraud rate); умеешь обосновать продукту, почему та или иная модель даст/не даст эффект.
- Уровень — сильный senior / staff с подтверждённым лид-опытом.
Будет плюсом
- Релевантный домен: рекомендации/ранжирование, антифрод/риски, модерация/Trust & Safety, RTB/прогноз CTR (e-com, соцсети, банки, ad-tech).
- MLOps / ML-платформа: фича-стор, registry, пайплайны обучения и раскатки, мониторинг моделей.
- Мультимодалка / CV, векторный поиск, two-tower рекомендации.
Чего НЕ требуем
Знания свежих SOTA-архитектур наизусть, научных публикаций, призовых мест на kaggle, именно нашего фреймворка. Нам важнее прод-зрелость и умение растить команду — стек подберём и доучим.
Технический стек
Python, PyTorch, OpenCV, LLM, MLflow, Git, Airflow, Docker, GitLab CI/CD, ClickHouse, Postgres, Yandex DataLens. Инфраструктура — российское облако (Yandex Cloud).
Что предлагаем:
- Владение ML-функцией, по сути, с нуля — высокая автономия и прямое влияние на продукт.
- Задачи, где ML напрямую двигает деньги (матчинг, антифрод, модерация) и где A/B по-настоящему сложное (сетевые эффекты дейтинга).
- Миллионы пользователей, заметный масштаб, быстрый цикл «гипотеза → эффект».
- Формат: удалёнка, РФ.