от 250 000 ₽•Москва•Удалённо, Офис, Гибрид•Middle, Senior
Зарплата
+4% выше рынка
вакансия: 250 000 ₽
рынок: ≈ 239 868 ₽
Обязанности:
Проектирование и разработка ETL и ELT потоков, витрин данных для моделей.
Очистка и стандартизация сырых данных, разработка проверок качества данных.
Осуществление переливки данных из источников в Озеро Данных.
Оптимизация и автоматизация процессов работы с данными.
Сопровождение существующих регламентов на Airflow.
Анализ и мониторинг производительности существующих запросов и их последующая оптимизация.
Внедрение современных практик и инженерных подходов.
Регулярное взаимодействие с Дата-сайентистами и Дата аналитиками, ревью и валидация написанных запросов, помощь в оптимизации.
Требования:
Продвинутые знания теории БД, SQL (PostgreSQL, PL/SQL), Python 3.8+, Airflow, Pandas.
Опыт работы с распределенными хранилищами данных (Greenplum, Hadoop) и классический BigData стек (Hive/Impala, hdfs, PySpark).
Знание Python-библиотек для работы обработки данных.
Навыки работы с Jupyter (notebook, lab, hub).
Уверенное понимание Git и принципов разработки, базовое понимание CI/CD.
Знания различных типов архитектуры хранилищ, ETL/ELT-инструментов и принципов работы с данными.
Умение покрывать код и артефакты разработки документацией.
Английский, достаточный для чтения и понимания документации.
Условия:
Обучение за счет компании (посещение конференций, курсов, помощь в написании статей на Хабр и т.д.).
Вертикальное и горизонтальное развитие: регулярные тренинги, вебинары, митапы.
Забота о вашем здоровье: ДМС с первого месяца работы, куда входит стоматология.
Прозрачный доход: оклад (по итогам интервью) + ежеквартальные премии по результатам KPI.
Гибкий график или полная удаленка (по итогам общения с командой); Комфортные и современные офисы в городах присутствия (Москва, Санкт-Петербург, Уфа, Брянск, Новосибирск и др.).
Дополнительные бонусы от Россельхозбанка для сотрудников группы компаний (Скидки на спортзалы, рестораны, маркетплейсы и т.д.).