Мы ищем Senior Data Scientist в команду SmartSearch,
которая будет драйвить развитие поискового стека — от классических моделей поиска и ранжирования до нейронных и мультимодальных решений, доведённых до стабильного high-load продакшена.
Сейчас мы активно работаем над тем, чтобы AI играл ключевую роль в процессе поиска недвижимости, чтобы сделать его по-настоящему умным и удобным.
Стек:
- Пишем преимущественно на Python (Transformers, PyTorch, Numpy, Pandas, Sklearn, CatBoost).
- Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер
- Для автоматизации запусков наших пайплайнов используем Airflow
- Для технических метрик — Grafana, для бизнес-метрик — FineBI.
Основные задачи:
- Развивать текстовый поиск Циан: query understanding, retrieval, ranking, re-ranking
- Улучшать качество подсказок и автокомплита
- Работать с классическими и нейросетевыми моделями поиска: BM25, dense / hybrid retrieval
- Развивать мультимодальный поиск (текст + изображения + гео)
Требования к кандидату:
- 3+ лет опыта работы с NLP / поиском / ранжированием
- Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др.
- Опыт работы с NLP задачами Генерация/Классификация/NER от исследований до продакшена
- Классический ML: бустинги, линейные модели.
- Python: пишет легко читаемый и поддерживаемый код
- SQL запросы на продвинутом уровне (оконные функции, оптимизация запросов)
- Способен самостоятельно коммуницировать с заказчиками и смежниками.
Будет плюсом:
- Практический опыт работы с векторными БД и ANN-алгоритмами, понимание поисковых движков
- Работа с мультимодальными представлениями
- Знаком с Apache стек: HDFS/Kafka/Spark (DF API)
- Имеет базовые знания CV: классификация, детекция, сегментация
- Опыт использования LLM как части поискового пайплайна, а не единственного решения
Что мы предлагаем:
- Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе – кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки;
- Технический рост. У нас есть успешные примеры роста с точки зрения ML, а также инженерии (разработка, архитектура приложений и сервисов) : есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов.
- Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях;
Как устроена разработка
Рассказываем о команде и процессах Читать
Гайд по интервью
О каждом этапе — понятно и прозрачно Читать