29 июня 2026 г. · 12–14 мин чтения
Data scientist (специалист по data science)
Data scientist (дата-сайентист, специалист по data science) — это человек, который учит компьютер предсказывать будущее по данным прошлого: кто из клиентов уйдёт, какой товар стоит порекомендовать, является ли транзакция мошеннической. Если дата-аналитик отвечает на вопрос «что произошло», то data scientist отвечает на вопрос «что произойдёт и что с этим делать». Это одна из самых высокооплачиваемых и одновременно самых требовательных к подготовке профессий в данных. Ниже — честная карта: чем дата-сайентист отличается от аналитика, сколько реально платят в России в 2026 году, какой стек нужен и как в профессию войти.
Кто такой data scientist
Data scientist — это специалист на стыке трёх дисциплин: математики и статистики, программирования и предметной области бизнеса. Его задача — не просто описать данные, а построить из них модель, которая делает прогноз или принимает решение автоматически.
Классическая иллюстрация ценности. Банк хочет понять, кто из заёмщиков не вернёт кредит. Дата-аналитик посмотрит на исторические данные и скажет: «В прошлом году не вернули кредит вот такие клиенты, у них были такие-то признаки». Data scientist пойдёт дальше: он построит ML-модель, которая по 200 параметрам нового заявителя выдаёт вероятность дефолта в момент подачи заявки — и банк на основе этой цифры одобряет или отклоняет кредит. Первый описывает прошлое, второй автоматизирует решение о будущем. Именно эта разница и определяет разрыв в зарплатах и в пороге входа.
В российском бигтехе дата-сайентисты стоят за вещами, которыми вы пользуетесь каждый день: рекомендации товаров на Wildberries и Ozon, лента и поиск Яндекса, антифрод и кредитный скоринг Сбера и Т-Банка, ранжирование контента во ВКонтакте. За каждой из этих систем — модели, которые кто-то спроектировал, обучил и вывел в продакшн.
Чем data scientist отличается от дата-аналитика
Это главная развилка, которую важно понять до того, как вы выберете путь обучения.
| Дата-аналитик | Data scientist | |
|---|---|---|
| Главный вопрос | Что произошло и почему | Что произойдёт и что делать |
| Основной результат | Дашборд, отчёт, рекомендация | Обученная ML-модель в продакшене |
| Ядро навыков | SQL, BI, бизнес-логика | Python, статистика, машинное обучение |
| Порог входа | Низкий (6–9 месяцев) | Высокий (год-полтора и сильная база математики) |
| Математика | Базовая статистика | Линейная алгебра, матанализ, теорвер |
Если коротко: аналитик — это про интерпретацию, дата-сайентист — про моделирование. Многие приходят в data science именно из аналитики, докрутив математику и ML (об этом подробно в блоке про траектории).
Чем занимается: обязанности
Расхожий миф гласит, что data scientist целыми днями обучает нейросети. На практике, по известному правилу, до 70–80% времени уходит на работу с данными, и лишь оставшееся — на собственно модели.
Базовые задачи
- Постановка задачи в терминах ML. Перевести бизнес-запрос («хотим меньше оттока») в формальную задачу машинного обучения (бинарная классификация: уйдёт клиент или нет, с такой-то метрикой качества).
- Сбор и подготовка данных. Выгрузить данные через SQL, очистить, разметить, собрать признаки (feature engineering) — это самая трудоёмкая часть.
- Исследовательский анализ (EDA). Изучить распределения, выбросы, корреляции, проверить гипотезы статистически.
- Обучение и валидация моделей. Подобрать алгоритм (от логистической регрессии до градиентного бустинга и нейросетей), обучить, честно проверить на отложенной выборке, не допустить переобучения.
- Оценка качества и A/B-тесты. Доказать, что модель работает не только на бумаге: вывести её в A/B-тест и измерить реальный эффект на бизнес-метрику.
- Вывод в продакшн. Передать модель в эксплуатацию — часто совместно с ML-инженером, который отвечает за инфраструктуру.
Специализации
- Classic ML / табличные данные — скоринг, прогноз спроса, рекомендации, антифрод. Основной хлеб финтеха и e-commerce.
- NLP — обработка естественного языка: чат-боты, классификация обращений, поиск. На подъёме из-за больших языковых моделей.
- Computer Vision — распознавание изображений и видео: модерация контента, медицина, беспилотники.
- Generative AI / LLM — дообучение и применение больших языковых моделей. Самая дорогая и горячая специализация 2025–2026: такие специалисты получают на 25–30% больше коллег из классического ML.
Сколько зарабатывает data scientist в России
Data science — профессия с высоким порогом входа и, как следствие, высокой оплатой. Стартовые джуны получают скромнее из-за конкуренции и долгого обучения, зато потолок сеньоров и лидов один из самых высоких в IT. Ниже — ориентиры по медианам и рыночным вилкам на 2025–2026 год по данным калькуляторов Хабр Карьеры, getmatch и hh.ru (суммы до вычета налогов, gross).
| Грейд | Опыт | Вилка по рынку, ₽/мес | Ориентир (медиана грейда) |
|---|---|---|---|
| Junior | 0–1 год | 80 000 – 150 000 | ~120 000 |
| Middle | 1–3 года | 180 000 – 300 000 | ~230 000 |
| Senior | 3–6 лет | 300 000 – 500 000 | ~360 000 |
| Lead / Head | 5+ лет | 450 000 – 1 000 000+ | ~500 000 |
Общая медиана по профессии — около 240 000 ₽ (Хабр Карьера, начало 2026), что заметно выше медианы дата-аналитика (~171 000 ₽). Это плата за более высокий порог входа.
Что влияет на цифру:
- Специализация. Инженеры, работающие с LLM и генеративным ИИ, получают на 25–30% больше специалистов классического ML — это главный разгоняющий фактор 2025–2026.
- Компания. Топ-офферы делают бигтех и финтех. В Сбере и Т-Банке сильные сеньоры выходят на 350 000–500 000 ₽, а позиции уровня Lead AI Engineer / AI Solutions Architect в Сбере доходят до 700 000–1 000 000 ₽ на руки. В Яндексе вилки для middle/senior — заметные, у ведущих экспертов офферы превышают 300 000 ₽ net.
- Город и удалёнка. Москва платит выше, но дата-сайентистов часто берут на удалёнку, и региональный специалист может получать московский оклад.
- Математическая база. Кандидаты с сильным профильным образованием (МФТИ, ВШЭ, выпускники ШАД) на старте котируются выше.
Какие навыки нужны
Профессия техничная и математичная — это не «аналитик с курсами», а отдельный уровень подготовки.
| Навык | Junior | Middle | Senior |
|---|---|---|---|
| Python | уверенный синтаксис, pandas, NumPy | чистый код, ООП, оптимизация | архитектура ML-пайплайнов |
| SQL | SELECT, JOIN, агрегации | оконные функции, оптимизация | проектирование витрин |
| Математика и статистика | базовая статистика, теорвер | проверка гипотез, A/B-тесты | дизайн экспериментов |
| Машинное обучение | основные алгоритмы, scikit-learn | бустинги (CatBoost), подбор моделей | выбор подхода под задачу |
| Deep Learning | базовое понимание нейросетей | PyTorch, типовые архитектуры | NLP/CV/LLM на уровне эксперта |
| Бизнес-контекст | понимает метрику задачи | связывает модель с бизнесом | влияет на продуктовую стратегию |
Soft skills, без которых не вырасти:
- Научное мышление — формулировать и честно проверять гипотезы, не обманывать себя метриками.
- Коммуникация — объяснить нетехническому менеджеру, что делает модель и чему можно доверять.
- Продуктовое чутьё — понимать, что красивая модель без эффекта на бизнес-метрику бесполезна.
- Упорство — большая часть экспериментов не даёт результата, и это норма.
Инструменты и стек (российские реалии)
- Python — главный язык data science. Ключевые библиотеки: pandas и NumPy (данные), scikit-learn (классический ML), matplotlib/seaborn (графики).
- CatBoost — библиотека градиентного бустинга от Яндекса, де-факто стандарт для табличных данных в российском бигтехе. Знание CatBoost — большой плюс в резюме.
- PyTorch — основной фреймворк для глубокого обучения (нейросети, NLP, CV). Нужен с уровня middle при работе с DL.
- SQL — без него не выгрузить и не собрать данные. Базы: PostgreSQL, ClickHouse (любимая БД бигтеха для аналитики), Greenplum.
- Yandex DataSphere — отечественная ML-платформа в Yandex Cloud для обучения моделей, работы с GPU и совместной разработки. Альтернатива западным облачным ML-сервисам, всё чаще встречается в требованиях.
- Облака. Вместо AWS/GCP — Yandex Cloud, Cloud.ru (SberCloud), VK Cloud.
- Статистика и A/B. Проверка гипотез — обязательная часть работы: без статистики модель невозможно честно оценить.
- Трекеры и документация. Задачи ведут в Yandex Tracker или Kaiten, заметки и описания экспериментов — в Yandex Wiki, Yonote.
Как стать data scientist
Главное, что нужно честно понять: это профессия с высоким порогом входа. Войти «за три месяца с нуля» здесь не получится — нужна математика, программирование и реальные проекты. Зато и отдача выше.
Пути входа:
- ШАД — Школа анализа данных Яндекса. Самый престижный и сложный путь. Это бесплатная двухгодичная программа с очень жёстким отбором (математика и алгоритмы), фактически кузница кадров для Яндекса и всего бигтеха. Выпускник ШАД — топовый кандидат на рынке. Подходит тем, у кого сильная математическая база.
- Профильные вузы. ВШЭ (факультет компьютерных наук), МФТИ, ИТМО, МГУ дают сильнейший фундамент. Многие совмещают вуз с ШАД.
- Онлайн-курсы. Яндекс Практикум (профессия «Специалист по Data Science»), Нетология, Stepik (много бесплатных курсов по Python и ML, в том числе от вузов). Курсы дают за 9–12 месяцев структуру, но требуют от вас серьёзной самостоятельной работы над математикой.
- Переход из смежной роли — самый реалистичный массовый путь, об этом ниже.
С чего начать практически:
- Освойте Python и pandas до уверенного уровня, параллельно подтягивая математику (линейная алгебра, статистика, теорвер) — без неё ML останется «магией».
- Изучите классический ML на scikit-learn и CatBoost, прежде чем браться за нейросети.
- Соберите портфолио: участие в соревнованиях по машинному обучению (Kaggle и российские аналоги), 2–3 проекта с честной постановкой задачи, обучением модели и оценкой качества. Для российского рынка живое портфолио и соревновательный рейтинг весят больше любого сертификата.
- Ищите первую работу на hh.ru, Хабр Карьере, getmatch и в профильных Telegram-каналах. Стажировки в Яндексе, Сбере, Т-Банке и VK — отличный вход: там быстро растёшь рядом с сильными командами.
Карьерные траектории
Data science — это не тупик и не вершина сама по себе, а развилка с дорогими дорогами в обе стороны. Сюда приходят из нескольких профессий и отсюда уходят в ещё более узкие и оплачиваемые роли.
Откуда приходят в профессию
- Дата-аналитики. Самый частый и логичный вход. У аналитика уже есть SQL, Python, статистика и бизнес-чутьё — остаётся серьёзно докрутить математику и машинное обучение. Переход занимает от года, доход в перспективе растёт на 40–70%. См. дата-аналитик.
- Разработчики (бэкенд и не только). Сильны в программировании и архитектуре, им нужно добрать математику, статистику и ML. Часто приходят через бэкенд-разработку.
- Математики, физики, выпускники технических факультетов. Идеальная база: у них уже есть аппарат, остаётся освоить Python и прикладной ML. Для них data science — естественное приложение знаний.
- Выпускники ШАД и профильных программ. Классический вход через стажировку или junior-позицию в бигтехе. Самые конкурентные кандидаты на рынке.
Куда растут вертикально
Внутри профессии путь предсказуемый и денежный:
Junior (~120 000 ₽) → Middle (~230 000 ₽) → Senior (~360 000 ₽) → Lead DS / Head of Data Science (450 000–1 000 000+ ₽).
- Junior → Middle обычно занимает 1,5–2 года; здесь дата-сайентист начинает решать задачи самостоятельно, доход почти удваивается.
- Middle → Senior — ещё 2–3 года; сеньор сам выбирает подход к задаче и отвечает за результат моделей в продакшене.
- Senior → Lead Data Scientist — управление командой дата-сайентистов и техническими решениями, прирост дохода 30–60%.
- Lead → Head of Data Science / Head of AI — стратегический уровень: отвечает за всё ML-направление компании, бюджеты и найм. Здесь компенсации в бигтехе доходят до миллиона и выше.
Куда уходят горизонтально (смежные профессии)
- ML-инженер — самый близкий переход. Если вам интереснее не строить модели, а выводить их в продакшн, масштабировать и держать в эксплуатации (MLOps), это ваша дорога. Срок 6–12 месяцев, нужно докрутить инженерию и DevOps; доход сопоставим или выше.
- Бэкенд-разработчик — для тех, кто в процессе понял, что любит код и системы больше, чем математику. Переход назад в инженерию, обратный одному из путей входа.
- Дата-аналитик — реже, но бывает: если хочется ближе к бизнесу и меньше математики. Технически это «шаг вниз» по порогу входа, но иногда осознанный выбор по образу жизни.
- Продакт-менеджер (особенно AI/ML-продакт) — для тех, кто хочет управлять продуктом, а не моделями. Сильное преимущество: продакт с DS-бэкграундом редок и дорог. Срок 6–12 месяцев, нужно добрать работу со стратегией и командой.
Если вы не уверены, какая из этих дорог ваша — оставаться в моделировании, уходить в инженерию или к продукту, — имеет смысл разложить сильные стороны и интересы на карту траекторий с карьерным консультантом. Год, потраченный не на тот стек, в data science стоит особенно дорого.
Плюсы и минусы
Плюсы:
- Одни из самых высоких зарплат в IT, особенно на senior+ и в генеративном ИИ.
- Интеллектуально насыщенная работа — настоящие задачи, а не рутина.
- Высокий и растущий спрос: ИИ в центре внимания бизнеса.
- Удалёнка и гибкость — норма индустрии.
- Профессия на острие технологий — вы работаете с тем, что меняет мир.
Минусы:
- Высокий порог входа: нужна сильная математика и год-полтора подготовки.
- Конкуренция среди джунов жёсткая — без портфолио и базы тяжело.
- Большая часть экспериментов не даёт результата — нужна устойчивость к неудачам.
- До 70–80% времени уходит на данные, а не на «интересные модели».
- Быстрое устаревание знаний — учиться придётся постоянно.
Кому подходит: людям с сильным аналитическим и математическим складом ума, которым нравится докапываться до сути, выдвигать и проверять гипотезы, программировать и не бояться, что половина идей окажется тупиком. Если вам нравится математика и вы хотите, чтобы машина принимала решения по вашим моделям, — это ваша профессия.
Востребованность и перспективы
Спрос на дата-сайентистов в России высокий и подогревается бумом ИИ: бигтех и финтех соревнуются за специалистов, а зарплаты на senior-уровне за 2025 год заметно выросли. При этом рынок поляризовался так же, как и в аналитике: лёгких вакансий для совсем новичков мало, компании ищут крепких middle и senior с реальным опытом и проектами.
Главный тренд 2025–2026 — раскол между классическим ML и генеративным ИИ. Специалисты, умеющие работать с большими языковыми моделями, дообучать и встраивать их в продукты, получают премию к рынку и нарасхват. Это смещает фокус профессии: всё больше задач связано с LLM, RAG-системами и ИИ-агентами.
Не вытеснит ли ИИ самих дата-сайентистов? Парадокс в том, что именно они ИИ и создают. Инструменты вроде ассистентов-кодеров ускоряют рутину (написание кода, EDA), но не отменяют главного — умения корректно поставить задачу, выбрать подход, честно оценить модель и встроить её в бизнес. Ценность смещается с механического обучения моделей на проектирование систем и научную строгость. Тех, кто это понял, ИИ делает производительнее и дороже, а не лишним.
FAQ
Сколько зарабатывает data scientist в России в 2026 году? Медиана по профессии — около 240 000 ₽ в месяц. Junior получает в среднем ~120 000 ₽, middle — около 230 000 ₽, senior — около 360 000 ₽, а lead и head of data science — от 450 000 ₽ и до 1 000 000 ₽+ в бигтехе и финтехе. Суммы указаны до вычета налогов.
Чем data scientist отличается от дата-аналитика? Дата-аналитик описывает прошлое: отвечает на вопрос «что произошло и почему» с помощью SQL и дашбордов. Data scientist прогнозирует будущее и автоматизирует решения: строит ML-модели, которые предсказывают отток, мошенничество, спрос. У дата-сайентиста выше порог входа (нужна математика и машинное обучение) и выше зарплата.
Можно ли стать data scientist с нуля? Можно, но это сложнее и дольше, чем войти в аналитику: нужна сильная математика, Python и год-полтора подготовки. Самые надёжные пути — ШАД, профильный вуз (ВШЭ, МФТИ), курсы (Практикум, Stepik) плюс портфолио и соревнования по ML. Часто проще прийти в data science из смежной роли — дата-аналитика или разработки.
Что учить первым, чтобы стать дата-сайентистом? Сначала Python (pandas, NumPy) и математику со статистикой — это фундамент. Затем классический ML на scikit-learn и CatBoost. Нейросети (PyTorch) и глубокое обучение — позже, когда освоена база. SQL нужен на всём пути, чтобы доставать данные.
Какой стек у data scientist в России? Python с библиотеками pandas, scikit-learn, PyTorch; CatBoost от Яндекса для табличных данных; SQL (PostgreSQL, ClickHouse); статистика и A/B-тесты; из платформ — Yandex DataSphere и Yandex Cloud. Главные работодатели — Яндекс, Сбер, Т-Банк, VK, Wildberries, Ozon.
Куда можно вырасти из data science? Вертикально — в lead data scientist и head of data science (стратегия и команда). Горизонтально — в ML-инженера (вывод моделей в продакшн), продакт-менеджера по AI-продуктам или назад в бэкенд-разработку.
Куда двигаться дальше
Data science — одна из самых высокооплачиваемых профессий в данных, но и одна из самых требовательных на входе. Самое сложное — не выучить очередной фреймворк, а понять, ваша ли это дорога вообще: тянет ли вас к математике и моделям, или ближе инженерия, продукт, бизнес-аналитика.
Если вы выбираете профессию или планируете переход в data science из аналитики, разработки или смежной области, эксперты Эйч помогут собрать персональную карьерную траекторию: оценят ваш бэкграунд и математическую базу, подскажут, что докрутить под целевую роль, и помогут подготовить резюме под российский рынок. Это быстрее и дешевле, чем год учить не то. Записаться на карьерную консультацию →
Данные о зарплатах и спросе актуальны на 2025–2026 год по источникам: Хабр Карьера, getmatch, hh.ru. Цифры зависят от специализации, компании, города и формата работы.