Инженер по данным в UZUM TECHNOLOGIES | Эйч — сервис развития карьеры

За последний год мы превратили данные из побочного результата работы продуктовых систем в полноценный продукт: строим lakehouse, развиваем self-service платформу и помогаем бизнес-командам быстрее превращать сырые события в надежные витрины, метрики и аналитические продукты.
Сейчас масштаб задач растет, поэтому нам нужен инженер, которому интересны сложные распределенные системы, качество данных, прозрачные процессы и ощутимый бизнес-импакт.

Чем предстоит заниматься

Развивать Lakehouse как единую точку входа для ad-hoc аналитики и data-продуктов.
Улучшать CDC- и streaming-процессы на базе Kafka, Debezium и Spark Streaming.
Ускорять путь от сырых событий до production-ready витрин.
Повышать надежность, наблюдаемость и качество данных.
Развивать self-service инструменты для аналитиков, продуктовых и бизнес-команд.
Работать с batch и streaming pipelines в production-среде.
Помогать командам использовать данные как продукт, а не как разрозненный набор таблиц.

Стек

PySpark, Airflow, ClickHouse, Trino, PostgreSQL, Kafka Connect, Debezium, Kubernetes, Iceberg, dbt.

Что для нас важно

Практический опыт в Data Engineering: Python, SQL, orchestration и production data pipelines.
Опыт работы с Airflow или другими оркестраторами.
Понимание batch и streaming processing, опыт работы со Spark / PySpark.
Опыт работы с lakehouse- и аналитическим стеком: Trino/Presto, ClickHouse, Iceberg/Parquet/DeltaLake.
Опыт с Kafka, Kafka Connect, Debezium или другими event streaming инструментами.
Инженерное мышление: умение думать про надежность, стоимость, качество данных, поддержку и влияние изменений на пользователей.

Почему это интересно

Мы строим Data Platform как продукт, а не просто набор пайплайнов: от ingestion, CDC и streaming до lakehouse, self-service инструментов и production-ready витрин для бизнеса.
Даем широкую зону ответственности и возможность влиять на архитектурные решения, платформенные подходы и то, как команды внутри компании работают с данными.
Здесь много сложных инженерных задач: надежный streaming, CDC, Spark, Iceberg/Trino/ClickHouse, качество данных, наблюдаемость, стоимость запросов и production reliability.
У нас современный стек: PySpark, Airflow, ClickHouse, Trino, PostgreSQL, Kafka Connect, Debezium, Kubernetes, Iceberg, dbt.
Мы сохранили скорость и инициативность стартапа, но уже отстроили зрелые процессы: понятные цели, production-подход, ответственность за результат и прозрачную коммуникацию.
Формируем измеримые цели всей командой и смотрим не только на факт выполнения задач, но и на их влияние на бизнес, пользователей данных и скорость работы продуктовых команд.
Работаем в команде сильных специалистов, где ценится глубина экспертизы, инженерное мышление и способность предлагать улучшения, а не просто закрывать тикеты.
Команды слушают и слышат друг друга: мы работаем с бизнесом, аналитиками и продуктами как партнеры.

Что мы предлагаем:

Удаленка из любой точки мира или уютный офис в Ташкенте
У нас можно расти в инженерном или управленческом треке, а еще выстроена регулярная оценка перформанса
Платим на уровне топовых компаний российского рынка
Обучение и развитие — мы поддерживаем как внутри компании, так и за ее пределами (митапы, конференции, профессиональное обучение, публикации). А еще помогаем развивать личный бренд
База — комьюнити профессионалов с желанием делать круто. Приятный бонус — ДМС в привязке к вашей локации, обучение и другие плюшки

Теги

#Airflow #ClickHouse #DBT #Kafka #Kubernetes #PostgreSQL #Pyspark #Python #SQL #Spark #Trino

Откликнуться на hh

Инженер по данным

Наш телеграм канал с вакансиями каждый день

Сопроводим до оффера

Сопроводим до оффера

Похожие вакансии

Data Engineer

Data Engineer

Data Engineer

Data engineer

Дата инженер

Data Engineer