Задачи, которые ты будешь выполнять:
- Обеспечение отказоустойчивости и высокой доступности платформ Big Data (Hadoop, Spark, Cassandra)
- Мониторинг и анализ производительности кластеров (CPU, RAM, I/O, Network, YARN/Mesos ресурсы)
- Установка, обновление и патчинг Cloudera CDP и Linux (production-окружение)
- Управление жизненным циклом ML-моделей:
настройка CI/CD пайплайнов
автоматизация деплоя (inference)
мониторинг производительности и качества моделей - Администрирование и оптимизация распределения ресурсов кластера (YARN queues, resource pools)
- Обеспечение безопасности и разграничения доступов (Kerberos, ACL, RBAC)
- Участие в разработке и развитии архитектуры Big Data платформы
- Поддержка команд Data Engineering / Data Science в части инфраструктуры
Нам по пути, если у тебя есть:
- Высшее техническое образование
- Опыт администрирования Linux (production level)
- Опыт работы с: Hadoop/Spark/Cassandra, Kafka, Zookeeper, Git и Kubernetes
- Опыт развертывания и масштабирования кластеров (Hadoop, Spark, Cassandra)
- Навыки автоматизации (Bash/Python)
- Понимание CI/CD принципов (GitLab CI/ArgoCD/GitHub Actions - будет плюсом)
- Понимание архитектуры ETL/ELT процессов
- Понимание принципов работы распределённых систем
Будет плюсом:
- Опыт работы с Cloudera CDP/Arenadata ADP/Hadoop Data Platform
- Опыт работы с ML-платформами (Kubeflow, MLFlow)
- Опыт внедрения мониторинга (Prometheus, Grafana, Zabbix)
- Опыт работы в банковском или финтех-секторе
Мы предлагаем тебе:
- Конструктор льгот OLZHA: кэшбек на здоровье, спорт, путешествия и саморазвитие в рамках утвержденных лимитов
- Продукты компании для сотрудников на выгодных условиях
- Внутреннее и внешнее обучение, корпоративный доступ к образовательной платформе Udemy
- Merch Store: брендированная продукция с корпоративной символикой
- Отсутствие дресс-кода
- Ультрасовременный и уютный офис HCB HUB
- Массаж в офисе, йога-классы, корпоративные скидки в фитнес-клубы, клиники, магазины
- Яркая корпоративная жизнь: мероприятия, клубы по интересам