В SOFTEZZA мы создаем умную платформу для онлайн-кинотеатра, которой ежедневно пользуются тысячи людей, выбирая, что посмотреть сегодня вечером.
Мы ищем уверенного ML-инженера, который не просто запускает модельки, а строит End-to-End решения: от идеи и сбора данных в ClickHouse до выкатки мультиагентных систем в Kubernetes. Тебе предстоит развивать гибридную рекомендательную систему и внедрять передовые LLM-практики (RAG, Agents), чтобы наш сервис понимал пользователя лучше, чем он сам.
Проект и вызовы
Мы строим рекомендательную систему нового поколения. Сейчас это связка Airflow + Feature Store + ClickHouse с быстрым бэкендом.
Твоя цель
Эволюция RecSys: Переход от простых эвристик к двухуровневому ранжированию (Deep Learning + бизнес-логика) для повышения релевантности выдачи.
GenAI Innovation: Создание AI-ассистентов, которые не просто отвечают на вопросы, а обладают памятью, умеют рассуждать и управлять действиями платформы через мультиагентные сценарии.
Наш технологический стек
Мы используем современные и эффективные инструменты. Если ты любишь, когда технологии работают на бизнес, - нам по пути.
- ML Core: Python, PyTorch, PySpark.
- LLM & Agents: LangChain, LangGraph (мультиагентные системы), RAG-пайплайны.
- Data & Storage: ClickHouse, Redis, Kafka, S3, PostgreSQL, MySQL.
- Ops & Orchestration: Apache Airflow, MLFlow, Kubernetes, Docker.
- Serving: FastAPI, Go.
Чем предстоит заниматься
Блок RecSys:
- Разрабатывать и совершенствовать End-to-End пайплайны обучения рекомендательных моделей.
- Внедрять вторую очередь ранжирования для персонализации выдачи.
- Работать с Feature Store: создавать новые фичи на основе истории просмотров и поведения пользователей.
- Проводить A/B тесты, анализировать метрики в Apache Superset и тюнить гиперпараметры для роста бизнес-показателей.
Блок GenAI:
- Проектировать мультиагентные системы на базе LLM, способные выполнять сложные цепочки действий.
- Развивать методы RAG: учить модель эффективно работать с нашими данными.
- Реализовывать функционал NL-to-SQL (перевод естественного языка в запросы к базе) для внутренней аналитики или пользовательских фич.
Мы ожидаем от кандидата
- Опыт в ML от 2 лет.
- Уверенное владение Python и SQL (сложные запросы, оптимизация существующих запросов).
- Понимание архитектуры RecSys: от матричного разложения до современных нейросетевых подходов.
- Опыт работы с LLM: понимание принципов RAG, Prompt Engineering, опыт работы с LangChain/LangGraph.
- Инженерный бэкграунд: опыт работы с Docker, Kubernetes, CI/CD. Ты можешь завернуть свою модель в контейнер и задеплоить её.
Будет крутым плюсом:
- Опыт работы с ClickHouse и Feature Store.
- Понимание принципов работы MLOps (MLFlow, DVC).
- Желание погружаться в бизнес-логику продукта и влиять на продуктовые метрики.
Что мы предлагаем
- Реальный High-load: Твои алгоритмы будут работать под высокой нагрузкой и влиять на опыт реальных пользователей.
- Свобода действий: Мы приветствуем инициативу. Хочешь попробовать новый алгоритм ранжирования или внедрить свежую LLM-библиотеку? Дерзай!
- Сильная команда: Рядом с тобой будут работать эксперты в Backend (Go/Laravel) и Data Engineering, готовые поддержать любую сложную интеграцию.
- Гибкость: Офис или гибрид, гибкое начало дня.
- Конкурентная заработная плата (обсуждаем на собеседовании, отталкиваясь от твоих ожиданий).
Если ты готов строить рекомендации, которые действительно работают, и экспериментировать с AI-агентами - откликайся!