Сейчас в команде несколько человек, и пара инженеров полностью закрывает data-инфраструктуру. Объём данных растёт, количество источников увеличивается, требования к качеству становятся строже — нужен ещё один сильный инженер, который возьмёт часть ответственности на себя.
Это чистая инженерия:
— без ресёрча
— без аналитики
— без «поэкспериментировать в ноутбуке»
Только Python, пайплайны, архитектура и надёжная инфраструктура данных.
Разработка и поддержка сервисов для сбора данных (data feeders)
Развитие системы контроля качества данных
Интеграция новых источников через внешние API
Поддержка и оптимизация ETL-процессов
Работа с существующей инфраструктурой (Airflow, CI/CD и др.)
DevOps-нагрузка минимальна — вы не будете «человеком-оркестром».
Middle+ или Senior Data Engineer с сильной разработческой базой.
Это не роль аналитика. Нам нужен инженер, который:
пишет понятный, поддерживаемый код
мыслит архитектурно
понимает систему целиком
способен довести пайплайн от идеи до продакшена
3+ года опыта разработки на Python (FinTech / hedge fund / data-heavy среда — большой плюс)
Уверенное владение Python:
OOP (классы, наследование, абстракции)
Асинхронность (asyncio)
Параллелизм (multithreading / multiprocessing / joblib)
NumPy, Pandas
Работа с визуализацией (Matplotlib, Plotly)
Apache Airflow или другой оркестратор
SQL, ClickHouse
Git
Будет плюсом
Grafana, Dash или другие инструменты визуализации
Dask, Ray или распределённые вычисления
SciPy, Scikit-learn
Опыт в крипте или построении инфраструктуры под research-команды
Мы ищем человека с инженерным мышлением.
Важно:
способность объяснять свои решения
умение обсуждать архитектуру
нормальная коммуникация без токсичности
Не подойдёт: закрытость, снобизм, «я гений, разберитесь сами».