Вместе с нами тебе предстоит:
- Постановка и декомпозиция DS‑задач из бизнес‑формулировки (HR/подбор персонала) в ML‑задачи с метриками успеха.
- Построение end‑to‑end пайплайнов: сбор/очистка данных → фичи → обучение → валидация → деплой → мониторинг качества.
- Разработка и улучшение моделей для поиска и ранжирования кандидатов/вакансий, извлечения сущностей из резюме и описаний вакансий.
- Интерпретация моделей и объяснение результатов бизнес‑заказчикам понятным языком.
Какие знания и навыки для нас важны: - Опыт работы в DS/ML от 2–3 лет, решённых боевых задач в проде.
- Уверенный Python для продакшн‑кода, хорошее владение SQL.
- Понимание классического ML (classification, ranking, clustering, anomaly detection), метрик (ROC‑AUC, PR‑AUC, F1, NDCG).
- Уверенный опыт в NLP: обработка русскоязычного текста, эмбеддинги, text classification, similarity search.
- Опыт анализа данных и A/B‑экспериментов, умение формулировать и проверять гипотезы.
- Понимание и практика работы с LLM и RAG: выбор моделей, дообучение/инструкционное дообучение, построение пайплайнов поиска по базе знаний.
Знание стека: - Языки: Python 3.x, SQL (PostgreSQL/Greenplum/ClickHouse).
- ML/DL: scikit‑learn, LightGBM/CatBoost/XGBoost, PyTorch (желательно).
- NLP/LLM: transformers, sentence‑transformers, HuggingFace, fastText/word2vec; RAG‑фреймворки (LangChain, LlamaIndex – плюс).