RounDC - это сервис автоматизированного подбора инвесторов для стартапов:
мы забираем данные из Telegram/WhatsApp, обогащаем их при помощи LLM и строим умный матчинг стартапов и фондов/ангелов поверх собственной CRM.
Ищем Applied ML / Data Engineer, который возьмёт на себя развитие ядра матчинга и data‑пайплайна.
Задачи:
- Проектировать и развивать сервис матчинга стартапов и инвесторов на основе эмбеддингов, правил и инструментов вроде Splink.
- Настраивать entity resolution / deduplication для баз людей и компаний в CRM.
- Интегрировать ML‑логику с текущим стеком (Python, LLM API, CRM, далее -Elasticsearch).
- Вводить метрики качества (precision/recall, hit‑rate и др.), улучшать качество матчинга по фидбеку пользователей.
Требования:
- Сильный Python, желателен опыт продового кода для data/ML‑задач.
- Практический опыт с текстовыми эмбеддингами и векторным поиском.
- Опыт в entity matching / deduplication (fuzzy matching, record linkage; Splink или аналоги- плюс).
- Уверенный SQL и опыт работы с прикладными базами (CRM, OLTP‑схемы).
- Понимание, как доводить ML‑решения до продакшена: API‑сервисы, очереди/ стриминг, логирование, мониторинг.
Будет плюсом:
- Опыт с Elasticsearch или другим поисковым движком.
- Опыт интеграции с мессенджерами или high‑load data ingestion.
- Опыт в рекомендательных системах или продуктовом data science.