За последний год мы превратили данные из побочного результата работы продуктовых систем в полноценный продукт: строим lakehouse, развиваем self-service платформу и помогаем бизнес-командам быстрее превращать сырые события в надежные витрины, метрики и аналитические продукты.
Сейчас масштаб задач растет, поэтому нам нужен инженер, которому интересны сложные распределенные системы, качество данных, прозрачные процессы и ощутимый бизнес-импакт.
Чем предстоит заниматься
- Развивать Lakehouse как единую точку входа для ad-hoc аналитики и data-продуктов.
- Улучшать CDC- и streaming-процессы на базе Kafka, Debezium и Spark Streaming.
- Ускорять путь от сырых событий до production-ready витрин.
- Повышать надежность, наблюдаемость и качество данных.
- Развивать self-service инструменты для аналитиков, продуктовых и бизнес-команд.
- Работать с batch и streaming pipelines в production-среде.
- Помогать командам использовать данные как продукт, а не как разрозненный набор таблиц.
Стек
PySpark, Airflow, ClickHouse, Trino, PostgreSQL, Kafka Connect, Debezium, Kubernetes, Iceberg, dbt.
Что для нас важно
- Практический опыт в Data Engineering: Python, SQL, orchestration и production data pipelines.
- Опыт работы с Airflow или другими оркестраторами.
- Понимание batch и streaming processing, опыт работы со Spark / PySpark.
- Опыт работы с lakehouse- и аналитическим стеком: Trino/Presto, ClickHouse, Iceberg/Parquet/DeltaLake.
- Опыт с Kafka, Kafka Connect, Debezium или другими event streaming инструментами.
- Инженерное мышление: умение думать про надежность, стоимость, качество данных, поддержку и влияние изменений на пользователей.
Почему это интересно
- Мы строим Data Platform как продукт, а не просто набор пайплайнов: от ingestion, CDC и streaming до lakehouse, self-service инструментов и production-ready витрин для бизнеса.
- Даем широкую зону ответственности и возможность влиять на архитектурные решения, платформенные подходы и то, как команды внутри компании работают с данными.
- Здесь много сложных инженерных задач: надежный streaming, CDC, Spark, Iceberg/Trino/ClickHouse, качество данных, наблюдаемость, стоимость запросов и production reliability.
- У нас современный стек: PySpark, Airflow, ClickHouse, Trino, PostgreSQL, Kafka Connect, Debezium, Kubernetes, Iceberg, dbt.
- Мы сохранили скорость и инициативность стартапа, но уже отстроили зрелые процессы: понятные цели, production-подход, ответственность за результат и прозрачную коммуникацию.
- Формируем измеримые цели всей командой и смотрим не только на факт выполнения задач, но и на их влияние на бизнес, пользователей данных и скорость работы продуктовых команд.
- Работаем в команде сильных специалистов, где ценится глубина экспертизы, инженерное мышление и способность предлагать улучшения, а не просто закрывать тикеты.
- Команды слушают и слышат друг друга: мы работаем с бизнесом, аналитиками и продуктами как партнеры.
Что мы предлагаем:
-
Удаленка из любой точки мира или уютный офис в Ташкенте
-
У нас можно расти в инженерном или управленческом треке, а еще выстроена регулярная оценка перформанса
-
Платим на уровне топовых компаний российского рынка
-
Обучение и развитие — мы поддерживаем как внутри компании, так и за ее пределами (митапы, конференции, профессиональное обучение, публикации). А еще помогаем развивать личный бренд
-
База — комьюнити профессионалов с желанием делать круто. Приятный бонус — ДМС в привязке к вашей локации, обучение и другие плюшки