ФАУ НИА — оператор ФГИС Росаккредитации, занимающийся разработкой информационных систем, обработкой данных, научными исследованиями, издательской деятельностью и продвижением стандартов оценки соответствия.
Мы развиваем экосистему работы с данными и ищем эксперта, который умеет превращать хаос legacy-структур в стройную архитектуру. Нам нужен человек, готовый погрузиться в недра ФГИС, восстановить скрытые связи и построить эффективные витрины данных для аналитиков и бизнеса.
Если вы обладаете системным мышлением, любите порядок в данных и виртуозно владеете SQL — мы ждем вас в команде!
Чем предстоит заниматься:
1. Проектирование архитектуры и моделирование:
- Проводить реверс-инжиниринг баз данных ФГИС и корпоративного DWH;
- Проектировать логические и физические модели данных (таблицы, связи, ключи);
- Разрабатывать наглядные ER-диаграммы (Crow’s Foot, IDEF1X, UML) и поддерживать их актуальность;
- Создавать карты маппинга (Source-to-Target) от «сырых» слоев до витрин.
2. Управление потоками данных (ETL/ELT):
- Проводить инвентаризацию и рефакторинг скриптов загрузки (SQL, Python, Bash, Airflow);
- Строить схемы движения данных (DFD) и фиксировать SLA потоков;
- Формировать детальный каталог (реестр) данных с правилами расчетов и бизнес-описаниями.
3. Создание витрин данных:
- Анализировать требования бизнес-заказчиков и проектировать оптимальные модели витрин;
- Реализовывать витрины на SQL, внедрять стратегии обновления (Incremental/Full refresh) и оптимизировать их производительность (индексы, партиционирование);
- Внедрять паттерны SCD (Slowly Changing Dimensions) типов 1 и 2.
4. Оркестрация и автоматизация:
- Разрабатывать и поддерживать графы (DAG) в Apache Airflow;
- Создавать воспроизводимые пайплайны данных (Staging → ODS → DDS → DM).
Мы ожидаем от тебя:
- Глубокую экспертизу в СУБД: Уверенная работа с PostgreSQL, Oracle или MS SQL на уровне системных каталогов и профилирования запросов;
- SQL (Advanced): Свободное владение оконными функциями, CTE, сложными JOIN и конструкциями MERGE;
- Навыки моделирования: Понимание Dimensional Modeling (Кимбалл), схем «звезда»/«снежинка», нормализации и денормализации;
- Опыт с ETL/ELT и оркестрацией: Умение писать пайплайны на Python/SQL и настраивать задачи в Airflow (или аналогах);
- Инструментарий: Опыт работы с DBeaver, DataGrip, draw.io или профессиональными CASE-средствами (ER/Studio, PowerDesigner);
- Системный подход: Способность превратить сотни разрозненных таблиц в понятную и документированную структуру.
Будет преимуществом:
- Опыт взаимодействия с государственными системами (ФНС, ЕГАИС, Честный ЗНАК, ГИС ЖКХ и др.);
- Знание современных подходов (dbt, Data Vault 2.0, Anchor Modeling);
- Опыт работы с Data Catalog (DataHub, OpenMetaData, Amundsen);
- Навыки автоматизации сбора метаданных на Python;
- Умение проводить нагрузочное тестирование пайплайнов и поиск «узких мест».
Мы предлагаем:
- Работу в офисе класса "А" БЦ Павелецкая плаза (в шаговой доступности от метро)
- Официальное трудоустройство и полностью белая заработная плата
- График работы 5/2 с 09.00 до 18.00 (в пятницу до 17.30)
- Комфортный формат работы (офис на испытательном сроке, гибрид на основном)
- Конкурентный уровень дохода (обсуждается с успешным кандидатом по итогам интервью)
- Премии (ежемесячные, квартальные, годовые)
- ДМС, социальные и иные гарантии, предусмотренные ТК РФ
- Возможность самореализации в надежной и стабильной компании
Будем очень рады видеть в своей команде активного, открытого, честного, ответственного и позитивного будущего коллегу. С нетерпением ждем отклик!