Мы продуктовая компания ПрессИндекс. Ищем ML/AI инженера, который будет развивать интеллектуальное ядро продукта по мониторингу СМИ и соцмедиа: от обработки текстов до построения аналитики по компаниям, событиям и информационным волнам.
Чем предстоит заниматься
1. извлечение сущностей (компании, персоны, бренды, объекты)
2. определение тональности и полярности
3. тематическая классификация и рубрикация
4. определение типа и характера упоминаний (новость, отзыв, инсайд и т.п.).
1. метрики и скоринги для компаний, брендов, отраслей,
2. профили упоминаний, рисковые индикаторы, динамику и аномалии.
1. модели эмбеддингов, семантический поиск, кластеризация событий,
2. поиск похожих публикаций, построение цепочек распространения.
1. формирование датасетов, разметка и подготовка данных,
2. обучение, валидация, подбор гиперпараметров,
3. интеграция моделей в прод: API/сервисы, оптимизация, мониторинг качества.
1. продумывать, как встроить модели в существующую инфраструктуру,
2. обеспечивать масштабируемость и стабильность работы ML-сервисов.
Наш стек (ML / данные)
- Python (pandas, numpy, scikit-learn).
- PyTorch / TensorFlow, HuggingFace Transformers.
- Инструменты для работы с текстом русскоязычными и англоязычными моделями.
- Хранение и обработка данных: PostgreSQL, Elasticsearch, S3-совместимые хранилища.
- Docker, базовый MLOps (CI/CD для моделей, трекинг экспериментов — MLflow и аналоги).
Кого мы ищем:
Плюсом будет:
- опыт работы с медиа-данными (новости, Telegram, соцсети, отзывы),
- опыт построения векторного поиска, кластеризации событий,
- участие в RAG-сценариях или чат-ботах поверх корпоративных данных.
Что предлагаем:




