Технологии/инструменты
- SQL
- Trino / Hive / Presto
- Dbt
- Iceberg
- Superset
- Python
Мы — аккредитованная IT-компания, крупнейшая в России Digital Health-платформа, объединяющая различные сервисы цифровой медицины.
Кого ищем?
Мы в поиске аналитика-разработчика, который будет заниматься преобразованием сырых данных в удобный формат для продуктовых аналитиков в бизнес-слое хранилища и позволит аналитикам сосредоточиться на бизнес-выводах, а команде — повысить качество и производительность аналитической инфраструктуры за счёт стандартизации, ускорения расчётов и улучшения документации.
Цели и задачи:
- Выделение мастер-сущностей из ядра ХД, разработка бизнес-правил дедубликации, унификации, создания золотых записей.
- Разработка витрин на основе объектов raw data vault на движке Trino + Iceberg.
- Описание моделей данных в DBT с полнотой тестов и документации.
- Анализ отчётов Superset: определение популярных дашбордов, восстановление lineage от отчета до источника в STG/MDM, помощь в выстраивании витрин.
- Написание SQL/Python-скриптов для контроля качества данных, инициировать улучшения качества данных.
- Документирование и обмен знаниями. Ведение каталога данных, участие в код-ревью и внутренних демо.
Зона ответственности:
- Разработка слоя мастер-данных (MDM) и витрин Data Mart на основе данных в STG (Data Vault 2.0).
- Разработка переиспользуемых витрин, покрывающих ключевые аналитические отчёты в Superset.
- Работа в связке с архитектором, аналитиками, продуктовыми командами бизнеса для унификации сущностей (клиенты, заказы, врачи и др.).
Что надо уметь:
- Уверенный SQL (написание сложных запросов, понимание того, как работает запрос в БД, как его можно оптимизировать через Explain analyze, как правильно выбрать ключ распределения, минимизировать джойны).
- Python для расчётов.
- Опыт работы с Data Vault 1.0 / 2.0, понимание основных объектов DV.
- Опыт построения витрин, применение подходов моделирования измерений и фактов star/snowflake schema.
- Понимание и использование MDM подходов дедубликации, gold-records, matching, survivorship.
- Работа с медленно меняющимися данными SCD2, ref.
Что мы предлагаем:
- Свободный выбор рабочего формата: удалённый внутри страны или гибридный в Москве.
- Медицинская программа, включающая телемедицинские консультации, очные приёмы в клиниках, психологов, стоматологию, лабораторные и инструментальные диагностики.
- Поддерживаем активный образ жизни — выбирай виды спорта по душе (корпоративные занятия сквошем, бегом, футболом в Москве и компенсация твоего спортивного абонемента).
- Ипотечные программы (IT-ипотека или льготная ипотека для сотрудников).
- Индивидуальный план развития каждому, он поможет тебе всегда видеть вектор своего пути.
- Компенсация профильного обучения и конференций.
- Ветеринары для ваших домашних животных 24/7.
Приятное дополнение:
- Мы общаемся на “ты”, не любим бюрократию и всегда помогаем друг другу.
- Devrel и коммьюнити: поможем начать вести блог и делиться своим опытом, выступать на митапах и быть лидером сообщества компетенций.