Содержание

29 июня 2026 г. · 12–14 мин чтения

Data scientist (специалист по data science)

Data scientist (дата-сайентист, специалист по data science) — это человек, который учит компьютер предсказывать будущее по данным прошлого: кто из клиентов уйдёт, какой товар стоит порекомендовать, является ли транзакция мошеннической. Если дата-аналитик отвечает на вопрос «что произошло», то data scientist отвечает на вопрос «что произойдёт и что с этим делать». Это одна из самых высокооплачиваемых и одновременно самых требовательных к подготовке профессий в данных. Ниже — честная карта: чем дата-сайентист отличается от аналитика, сколько реально платят в России в 2026 году, какой стек нужен и как в профессию войти.

Кто такой data scientist

Data scientist — это специалист на стыке трёх дисциплин: математики и статистики, программирования и предметной области бизнеса. Его задача — не просто описать данные, а построить из них модель, которая делает прогноз или принимает решение автоматически.

Классическая иллюстрация ценности. Банк хочет понять, кто из заёмщиков не вернёт кредит. Дата-аналитик посмотрит на исторические данные и скажет: «В прошлом году не вернули кредит вот такие клиенты, у них были такие-то признаки». Data scientist пойдёт дальше: он построит ML-модель, которая по 200 параметрам нового заявителя выдаёт вероятность дефолта в момент подачи заявки — и банк на основе этой цифры одобряет или отклоняет кредит. Первый описывает прошлое, второй автоматизирует решение о будущем. Именно эта разница и определяет разрыв в зарплатах и в пороге входа.

В российском бигтехе дата-сайентисты стоят за вещами, которыми вы пользуетесь каждый день: рекомендации товаров на Wildberries и Ozon, лента и поиск Яндекса, антифрод и кредитный скоринг Сбера и Т-Банка, ранжирование контента во ВКонтакте. За каждой из этих систем — модели, которые кто-то спроектировал, обучил и вывел в продакшн.

Чем data scientist отличается от дата-аналитика

Это главная развилка, которую важно понять до того, как вы выберете путь обучения.

	Дата-аналитик	Data scientist
Главный вопрос	Что произошло и почему	Что произойдёт и что делать
Основной результат	Дашборд, отчёт, рекомендация	Обученная ML-модель в продакшене
Ядро навыков	SQL, BI, бизнес-логика	Python, статистика, машинное обучение
Порог входа	Низкий (6–9 месяцев)	Высокий (год-полтора и сильная база математики)
Математика	Базовая статистика	Линейная алгебра, матанализ, теорвер

Если коротко: аналитик — это про интерпретацию, дата-сайентист — про моделирование. Многие приходят в data science именно из аналитики, докрутив математику и ML (об этом подробно в блоке про траектории).

Чем занимается: обязанности

Расхожий миф гласит, что data scientist целыми днями обучает нейросети. На практике, по известному правилу, до 70–80% времени уходит на работу с данными, и лишь оставшееся — на собственно модели.

Базовые задачи

Постановка задачи в терминах ML. Перевести бизнес-запрос («хотим меньше оттока») в формальную задачу машинного обучения (бинарная классификация: уйдёт клиент или нет, с такой-то метрикой качества).
Сбор и подготовка данных. Выгрузить данные через SQL, очистить, разметить, собрать признаки (feature engineering) — это самая трудоёмкая часть.
Исследовательский анализ (EDA). Изучить распределения, выбросы, корреляции, проверить гипотезы статистически.
Обучение и валидация моделей. Подобрать алгоритм (от логистической регрессии до градиентного бустинга и нейросетей), обучить, честно проверить на отложенной выборке, не допустить переобучения.
Оценка качества и A/B-тесты. Доказать, что модель работает не только на бумаге: вывести её в A/B-тест и измерить реальный эффект на бизнес-метрику.
Вывод в продакшн. Передать модель в эксплуатацию — часто совместно с ML-инженером, который отвечает за инфраструктуру.

Специализации

Classic ML / табличные данные — скоринг, прогноз спроса, рекомендации, антифрод. Основной хлеб финтеха и e-commerce.
NLP — обработка естественного языка: чат-боты, классификация обращений, поиск. На подъёме из-за больших языковых моделей.
Computer Vision — распознавание изображений и видео: модерация контента, медицина, беспилотники.
Generative AI / LLM — дообучение и применение больших языковых моделей. Самая дорогая и горячая специализация 2025–2026: такие специалисты получают на 25–30% больше коллег из классического ML.

Сколько зарабатывает data scientist в России

Data science — профессия с высоким порогом входа и, как следствие, высокой оплатой. Стартовые джуны получают скромнее из-за конкуренции и долгого обучения, зато потолок сеньоров и лидов один из самых высоких в IT. Ниже — ориентиры по медианам и рыночным вилкам на 2025–2026 год по данным калькуляторов Хабр Карьеры, getmatch и hh.ru (суммы до вычета налогов, gross).

Грейд	Опыт	Вилка по рынку, ₽/мес	Ориентир (медиана грейда)
Junior	0–1 год	80 000 – 150 000	~120 000
Middle	1–3 года	180 000 – 300 000	~230 000
Senior	3–6 лет	300 000 – 500 000	~360 000
Lead / Head	5+ лет	450 000 – 1 000 000+	~500 000

Общая медиана по профессии — около 240 000 ₽ (Хабр Карьера, начало 2026), что заметно выше медианы дата-аналитика (~171 000 ₽). Это плата за более высокий порог входа.

Что влияет на цифру:

Специализация. Инженеры, работающие с LLM и генеративным ИИ, получают на 25–30% больше специалистов классического ML — это главный разгоняющий фактор 2025–2026.
Компания. Топ-офферы делают бигтех и финтех. В Сбере и Т-Банке сильные сеньоры выходят на 350 000–500 000 ₽, а позиции уровня Lead AI Engineer / AI Solutions Architect в Сбере доходят до 700 000–1 000 000 ₽ на руки. В Яндексе вилки для middle/senior — заметные, у ведущих экспертов офферы превышают 300 000 ₽ net.
Город и удалёнка. Москва платит выше, но дата-сайентистов часто берут на удалёнку, и региональный специалист может получать московский оклад.
Математическая база. Кандидаты с сильным профильным образованием (МФТИ, ВШЭ, выпускники ШАД) на старте котируются выше.

Какие навыки нужны

Профессия техничная и математичная — это не «аналитик с курсами», а отдельный уровень подготовки.

Навык	Junior	Middle	Senior
Python	уверенный синтаксис, pandas, NumPy	чистый код, ООП, оптимизация	архитектура ML-пайплайнов
SQL	SELECT, JOIN, агрегации	оконные функции, оптимизация	проектирование витрин
Математика и статистика	базовая статистика, теорвер	проверка гипотез, A/B-тесты	дизайн экспериментов
Машинное обучение	основные алгоритмы, scikit-learn	бустинги (CatBoost), подбор моделей	выбор подхода под задачу
Deep Learning	базовое понимание нейросетей	PyTorch, типовые архитектуры	NLP/CV/LLM на уровне эксперта
Бизнес-контекст	понимает метрику задачи	связывает модель с бизнесом	влияет на продуктовую стратегию

Soft skills, без которых не вырасти:

Научное мышление — формулировать и честно проверять гипотезы, не обманывать себя метриками.
Коммуникация — объяснить нетехническому менеджеру, что делает модель и чему можно доверять.
Продуктовое чутьё — понимать, что красивая модель без эффекта на бизнес-метрику бесполезна.
Упорство — большая часть экспериментов не даёт результата, и это норма.

Инструменты и стек (российские реалии)

Python — главный язык data science. Ключевые библиотеки: pandas и NumPy (данные), scikit-learn (классический ML), matplotlib/seaborn (графики).
CatBoost — библиотека градиентного бустинга от Яндекса, де-факто стандарт для табличных данных в российском бигтехе. Знание CatBoost — большой плюс в резюме.
PyTorch — основной фреймворк для глубокого обучения (нейросети, NLP, CV). Нужен с уровня middle при работе с DL.
SQL — без него не выгрузить и не собрать данные. Базы: PostgreSQL, ClickHouse (любимая БД бигтеха для аналитики), Greenplum.
Yandex DataSphere — отечественная ML-платформа в Yandex Cloud для обучения моделей, работы с GPU и совместной разработки. Альтернатива западным облачным ML-сервисам, всё чаще встречается в требованиях.
Облака. Вместо AWS/GCP — Yandex Cloud, Cloud.ru (SberCloud), VK Cloud.
Статистика и A/B. Проверка гипотез — обязательная часть работы: без статистики модель невозможно честно оценить.
Трекеры и документация. Задачи ведут в Yandex Tracker или Kaiten, заметки и описания экспериментов — в Yandex Wiki, Yonote.

Как стать data scientist

Главное, что нужно честно понять: это профессия с высоким порогом входа. Войти «за три месяца с нуля» здесь не получится — нужна математика, программирование и реальные проекты. Зато и отдача выше.

Пути входа:

ШАД — Школа анализа данных Яндекса. Самый престижный и сложный путь. Это бесплатная двухгодичная программа с очень жёстким отбором (математика и алгоритмы), фактически кузница кадров для Яндекса и всего бигтеха. Выпускник ШАД — топовый кандидат на рынке. Подходит тем, у кого сильная математическая база.
Профильные вузы. ВШЭ (факультет компьютерных наук), МФТИ, ИТМО, МГУ дают сильнейший фундамент. Многие совмещают вуз с ШАД.
Онлайн-курсы. Яндекс Практикум (профессия «Специалист по Data Science»), Нетология, Stepik (много бесплатных курсов по Python и ML, в том числе от вузов). Курсы дают за 9–12 месяцев структуру, но требуют от вас серьёзной самостоятельной работы над математикой.
Переход из смежной роли — самый реалистичный массовый путь, об этом ниже.

С чего начать практически:

Освойте Python и pandas до уверенного уровня, параллельно подтягивая математику (линейная алгебра, статистика, теорвер) — без неё ML останется «магией».
Изучите классический ML на scikit-learn и CatBoost, прежде чем браться за нейросети.
Соберите портфолио: участие в соревнованиях по машинному обучению (Kaggle и российские аналоги), 2–3 проекта с честной постановкой задачи, обучением модели и оценкой качества. Для российского рынка живое портфолио и соревновательный рейтинг весят больше любого сертификата.
Ищите первую работу на hh.ru, Хабр Карьере, getmatch и в профильных Telegram-каналах. Стажировки в Яндексе, Сбере, Т-Банке и VK — отличный вход: там быстро растёшь рядом с сильными командами.

Карьерные траектории

Data science — это не тупик и не вершина сама по себе, а развилка с дорогими дорогами в обе стороны. Сюда приходят из нескольких профессий и отсюда уходят в ещё более узкие и оплачиваемые роли.

Откуда приходят в профессию

Дата-аналитики. Самый частый и логичный вход. У аналитика уже есть SQL, Python, статистика и бизнес-чутьё — остаётся серьёзно докрутить математику и машинное обучение. Переход занимает от года, доход в перспективе растёт на 40–70%. См. дата-аналитик.
Разработчики (бэкенд и не только). Сильны в программировании и архитектуре, им нужно добрать математику, статистику и ML. Часто приходят через бэкенд-разработку.
Математики, физики, выпускники технических факультетов. Идеальная база: у них уже есть аппарат, остаётся освоить Python и прикладной ML. Для них data science — естественное приложение знаний.
Выпускники ШАД и профильных программ. Классический вход через стажировку или junior-позицию в бигтехе. Самые конкурентные кандидаты на рынке.

Куда растут вертикально

Внутри профессии путь предсказуемый и денежный:

Junior (~120 000 ₽) → Middle (~230 000 ₽) → Senior (~360 000 ₽) → Lead DS / Head of Data Science (450 000–1 000 000+ ₽).

Junior → Middle обычно занимает 1,5–2 года; здесь дата-сайентист начинает решать задачи самостоятельно, доход почти удваивается.
Middle → Senior — ещё 2–3 года; сеньор сам выбирает подход к задаче и отвечает за результат моделей в продакшене.
Senior → Lead Data Scientist — управление командой дата-сайентистов и техническими решениями, прирост дохода 30–60%.
Lead → Head of Data Science / Head of AI — стратегический уровень: отвечает за всё ML-направление компании, бюджеты и найм. Здесь компенсации в бигтехе доходят до миллиона и выше.

Куда уходят горизонтально (смежные профессии)

ML-инженер — самый близкий переход. Если вам интереснее не строить модели, а выводить их в продакшн, масштабировать и держать в эксплуатации (MLOps), это ваша дорога. Срок 6–12 месяцев, нужно докрутить инженерию и DevOps; доход сопоставим или выше.
Бэкенд-разработчик — для тех, кто в процессе понял, что любит код и системы больше, чем математику. Переход назад в инженерию, обратный одному из путей входа.
Дата-аналитик — реже, но бывает: если хочется ближе к бизнесу и меньше математики. Технически это «шаг вниз» по порогу входа, но иногда осознанный выбор по образу жизни.
Продакт-менеджер (особенно AI/ML-продакт) — для тех, кто хочет управлять продуктом, а не моделями. Сильное преимущество: продакт с DS-бэкграундом редок и дорог. Срок 6–12 месяцев, нужно добрать работу со стратегией и командой.

Если вы не уверены, какая из этих дорог ваша — оставаться в моделировании, уходить в инженерию или к продукту, — имеет смысл разложить сильные стороны и интересы на карту траекторий с карьерным консультантом. Год, потраченный не на тот стек, в data science стоит особенно дорого.

Плюсы и минусы

Плюсы:

Одни из самых высоких зарплат в IT, особенно на senior+ и в генеративном ИИ.
Интеллектуально насыщенная работа — настоящие задачи, а не рутина.
Высокий и растущий спрос: ИИ в центре внимания бизнеса.
Удалёнка и гибкость — норма индустрии.
Профессия на острие технологий — вы работаете с тем, что меняет мир.

Минусы:

Высокий порог входа: нужна сильная математика и год-полтора подготовки.
Конкуренция среди джунов жёсткая — без портфолио и базы тяжело.
Большая часть экспериментов не даёт результата — нужна устойчивость к неудачам.
До 70–80% времени уходит на данные, а не на «интересные модели».
Быстрое устаревание знаний — учиться придётся постоянно.

Кому подходит: людям с сильным аналитическим и математическим складом ума, которым нравится докапываться до сути, выдвигать и проверять гипотезы, программировать и не бояться, что половина идей окажется тупиком. Если вам нравится математика и вы хотите, чтобы машина принимала решения по вашим моделям, — это ваша профессия.

Востребованность и перспективы

Спрос на дата-сайентистов в России высокий и подогревается бумом ИИ: бигтех и финтех соревнуются за специалистов, а зарплаты на senior-уровне за 2025 год заметно выросли. При этом рынок поляризовался так же, как и в аналитике: лёгких вакансий для совсем новичков мало, компании ищут крепких middle и senior с реальным опытом и проектами.

Главный тренд 2025–2026 — раскол между классическим ML и генеративным ИИ. Специалисты, умеющие работать с большими языковыми моделями, дообучать и встраивать их в продукты, получают премию к рынку и нарасхват. Это смещает фокус профессии: всё больше задач связано с LLM, RAG-системами и ИИ-агентами.

Не вытеснит ли ИИ самих дата-сайентистов? Парадокс в том, что именно они ИИ и создают. Инструменты вроде ассистентов-кодеров ускоряют рутину (написание кода, EDA), но не отменяют главного — умения корректно поставить задачу, выбрать подход, честно оценить модель и встроить её в бизнес. Ценность смещается с механического обучения моделей на проектирование систем и научную строгость. Тех, кто это понял, ИИ делает производительнее и дороже, а не лишним.

FAQ

Сколько зарабатывает data scientist в России в 2026 году? Медиана по профессии — около 240 000 ₽ в месяц. Junior получает в среднем ~120 000 ₽, middle — около 230 000 ₽, senior — около 360 000 ₽, а lead и head of data science — от 450 000 ₽ и до 1 000 000 ₽+ в бигтехе и финтехе. Суммы указаны до вычета налогов.

Чем data scientist отличается от дата-аналитика? Дата-аналитик описывает прошлое: отвечает на вопрос «что произошло и почему» с помощью SQL и дашбордов. Data scientist прогнозирует будущее и автоматизирует решения: строит ML-модели, которые предсказывают отток, мошенничество, спрос. У дата-сайентиста выше порог входа (нужна математика и машинное обучение) и выше зарплата.

Можно ли стать data scientist с нуля? Можно, но это сложнее и дольше, чем войти в аналитику: нужна сильная математика, Python и год-полтора подготовки. Самые надёжные пути — ШАД, профильный вуз (ВШЭ, МФТИ), курсы (Практикум, Stepik) плюс портфолио и соревнования по ML. Часто проще прийти в data science из смежной роли — дата-аналитика или разработки.

Что учить первым, чтобы стать дата-сайентистом? Сначала Python (pandas, NumPy) и математику со статистикой — это фундамент. Затем классический ML на scikit-learn и CatBoost. Нейросети (PyTorch) и глубокое обучение — позже, когда освоена база. SQL нужен на всём пути, чтобы доставать данные.

Какой стек у data scientist в России? Python с библиотеками pandas, scikit-learn, PyTorch; CatBoost от Яндекса для табличных данных; SQL (PostgreSQL, ClickHouse); статистика и A/B-тесты; из платформ — Yandex DataSphere и Yandex Cloud. Главные работодатели — Яндекс, Сбер, Т-Банк, VK, Wildberries, Ozon.

Куда можно вырасти из data science? Вертикально — в lead data scientist и head of data science (стратегия и команда). Горизонтально — в ML-инженера (вывод моделей в продакшн), продакт-менеджера по AI-продуктам или назад в бэкенд-разработку.

Куда двигаться дальше

Data science — одна из самых высокооплачиваемых профессий в данных, но и одна из самых требовательных на входе. Самое сложное — не выучить очередной фреймворк, а понять, ваша ли это дорога вообще: тянет ли вас к математике и моделям, или ближе инженерия, продукт, бизнес-аналитика.

Если вы выбираете профессию или планируете переход в data science из аналитики, разработки или смежной области, эксперты Эйч помогут собрать персональную карьерную траекторию: оценят ваш бэкграунд и математическую базу, подскажут, что докрутить под целевую роль, и помогут подготовить резюме под российский рынок. Это быстрее и дешевле, чем год учить не то. Записаться на карьерную консультацию →

Данные о зарплатах и спросе актуальны на 2025–2026 год по источникам: Хабр Карьера, getmatch, hh.ru. Цифры зависят от специализации, компании, города и формата работы.

Полезное на Эйч

Сопроводим до оффера

Умножим шансы на каждом этапе поиска и поможем получить выгодный оффер

Узнать больше