Специалисты по Data Science нужны везде, где хранят и обрабатывают большие объёмы данных
Ещё их называют дата-сайентистами — Data Scientist
Есть базовый и расширенный форматы
Освоите профессию с нуля за 13 месяцев

Мощный набор навыков и инструментов

Это сейчас действительно актуально и требуется во всех вакансиях.

Python
Jupyter Notebook
Git
SQL
Командная строка
Pandas
NumPy
Matplotlib
Seaborn
SciPy
Scikit-learn
CatBoost
LightGBM/XGBoost
Shap
Optuna
AirFlow
MLFlow
Spark
Hugging Face
PyTorch

Прозрачный карьерный рост

Вот средние зарплаты Data Scientist. Вы начнёте с junior позиции.

Источник данных: Хабр Карьера
119 000 ₽
Junior — опыт до 1 года
224 000 ₽
Middle — опыт 1–3 года
365 000+ ₽
Senior — опыт от 3 лет
Регулярно обновляем программу, чтобы вы проходили только актуальное
Есть базовый и расширенный форматы — со вторым вы быстрее вырастете до уровня middle
7 тем・1 проект・~8 часов
Бесплатно
Основы Python и анализа данных
Узнаете основные концепции анализа данных и поймёте, чем занимается Data Scientist. А после бесплатной части выберете подходящий формат курса: базовый или расширенный.
  • Python
  • Pandas
  • Seaborn
  • Переменные
  • Типы данных
  • Гипотезы
  • Ошибки
  • Тепловые карты
  • Базовый и расширенный формат
Moscow Catnamycs
Вывод данных на экран. CSV-файлы. Работа с таблицами. Тепловые карты. Умножение столбца на целое число.
Ошибки в коде
Синтаксические ошибки. Ошибки наименования. Ошибки при делении на ноль. Ошибки при импорте модуля.
Переменные и типы данных
Переменные. Типы данных. Арифметические операции с числами и строками.
Как выдвигать гипотезы
Гипотезы. HADI-циклы. Аналитическое мышление. Чтение графиков.
Работа в области данных
Задачи аналитика. Уточнение задач. Декомпозиция. Стадии проекта.
Машинное обучение
Модель. Обучающая и тестовая выборки. Объект и признак. Метрика Евклида. Алгоритм K‑ближайших соседей (KNN). Библиотека Scikit-learn.
Примените методы группировки и суммы, сегментируете пользователей и решите задачи классификации
1
3 спринта・3 темы・7 недель
Основы анализа данных с помощью SQL
  • Базы данных
  • СУБД
  • SQL
  • PostgreSQL
  • Предобработка данных
  • EDA
  • Ad-hoc-задачи
Извлечение данных
Структура баз данных и язык SQL. Извлечение данных из таблиц, их фильтрация, сортировка и агрегация. Базовые конструкции SELECT, WHERE, GROUP BY и ORDER BY. Получение данных по техническому заданию. Формирование простых аналитических выборок.
Обработка данных
Соединение таблиц (JOIN). Подзапросы. Обработка пропущенных значений и дубликатов. Преобразование данных. Создание столбцов. Работа с датой и временем. Множественные операции. Сложные SQL‑запросы для подготовки данных к анализу.
Анализ данных и ad‑hoc‑задачи
Оконные функции: агрегирующие, ранжирующие, смещения. Аналитические приёмы для проведения исследовательского анализа данных (EDA). Решение ad‑hoc‑задач от бизнеса через оконные функции и комбинацию SQL‑инструментов.
Научитесь извлекать и обрабатывать данные с помощью SQL‑запросов. Будете решать ad‑hoc‑запросы разной сложности в исследовательском анализе данных
1 проект・2 недели
Проект по модулю о SQL
Закрепите навыки извлечения данных с помощью SQL. Очистите и подготовите их для анализа, а потом соберёте витрину данных для решения ad‑hoc‑задачи бизнеса. Оформите отчёт с результатами.
2
4 спринта・4 темы・8 недель
Анализ данных с помощью Python
  • Python
  • Pandas
  • NumPy
  • Matplotlib
  • Seaborn
  • Jupyter Notebook
  • ООП
  • Терминал
  • Виртуальное окружение
  • Git
Основы Python
Базовый синтаксис. Простые алгоритмы. Переменные и типы данных. Работа со строками и списками. Логические выражения и условные операторы. Циклы и списковые включения. Вложенные конструкции, функции, множества и словари.
Предобработка данных
Ключевые техники подготовки данных к анализу. Основы библиотеки Pandas. Работа с датафреймами: индексация, фильтрация, обработка пропущенных значений и дубликатов. Преобразования. Категоризация. Работа с датой и временем.
Исследовательский анализ данных и визуализация
Выявление закономерностей и формулирование рекомендации на основе данных. Объединение датафреймов. Описательная статистика. Анализ взаимосвязей переменных. Построение сводных таблиц. Создание графиков для исследований.
Основы ООП и инструменты разработки для Data Science
Основы объектно ориентированного программирования (ООП). Классы для предобработки данных. Профессиональная среда разработки. Организация проектов на Python. Командная строка и терминал. Настройка виртуального окружения. Установка библиотек. Работа с Git и GitHub.
Подготовите данные для исследовательского анализа и проведёте его с помощью Python. Напишете скрипт предобработки. Настроите виртуальное окружение и репозиторий
1 проект・2 недели
Проект по модулю о Python
Научитесь очищать и предварительно обрабатывать данные. Проведёте исследовательский анализ и визуализируете результаты. Подготовите рекомендации для бизнеса и презентуете их.
3
3 спринта・3 темы・6 недель
Основы машинного обучения и линейные модели
  • Python
  • Pandas
  • Scikit-learn
  • Регрессия
  • Классификация
  • Jupyter Notebook
  • GridSearchCV
  • Метрики модели
Знакомство с ML и линейная регрессия
Построение и анализ первой модели. Понятие машинного обучения. Устройство данных. Типы задач. Оценка качества модели. Линейная регрессия и её обучение. Метрики и гиперпараметры.
Логистическая регрессия и задачи классификации
Базовый пайплайн построения и оценка моделей классификации. Различия в задачах классификации. Логистическая регрессия. Кросс‑валидация. Метрики Accuracy, Precision, Recall, F1 и другие. Их интерпретация. Выбор метрики для конкретной задачи.
Опорные векторы и техники классификации
Создание устойчивых и интерпретируемых моделей. Метод опорных векторов — SVM. Применение его к задачам бинарной и многоклассовой классификации. Методы отбора признаков и калибровки моделей для повышения точности предсказаний.
Обучите модель линейной регрессии и рассчитаете метрики этой модели. Решите задачу классификации. Напишете пайплайн предобработки данных и построите несколько линейных моделей
1 проект・2 недели
Проект по линейным моделям
Пройдёте полный цикл создания ML-решения: от предобработки данных и EDA до обучения моделей для задач регрессии и классификации, подбора гиперпараметров и определения наилучшего решения с точки зрения метрик.
4
4 спринта・4 темы・8 недель
Модели на основе деревьев
  • KNN
  • Решающее дерево
  • Случайный лес
  • Bias-variance tradeoff
  • Бустинг
  • Градиентный бустинг
  • Optuna
  • LightGBM
  • XGBoost
  • CatBoost
  • SHAP
Решающее дерево и KNN
Метрические алгоритмы — KNN. Решающие деревья: структура, принципы работы и ограничения. Проблемы переобучения. Методы регуляризации деревьев. Подбор гиперпараметров с помощью Optuna. Работа с данными для деревьев.
Ансамблирование моделей и Random Forest
Подходы к ансамблированию: бэггинг и стекинг. Метод случайного леса — Random Forest. Его отличие от бэггинга. Определение важности признаков. Работа с данными с временной структурой. Дисбаланс классов.
Бустинг и градиентный бустинг
Алгоритмы бустинга. Популярные библиотеки: LightGBM, XGBoost, CatBoost. Подбор гиперпараметров и интерпретация результатов моделей. Векторизация текстовых данных для их последующей обработки моделями.
Обучение без учителя
Снижение размерности и кластеризация. Выбор подходящего метода для задачи: PCA, t‑SNE, k‑means, DBSCAN. Оценка качества кластеризации. Исследование структуры данных и поиск закономерностей.
Выполните задачу регрессии с помощью KNN и решающего дерева. Обучите модель с несколькими деревьями решений и данными с дисбалансом классов. Поработаете с классификацией через градиентный бустинг
1 проект・2 недели
Проект по модулю о моделях на основе деревьев
Будете строить решения на основе алгоритмов деревьев. Извлечёте данные с помощью SQL, проведёте их очистку и исследовательский анализ, подготовите признаки для обучения модели и поэкспериментируете с её параметрами, чтобы добиться заданного уровня качества. Освоите валидацию и интерпретацию результатов модели. Оформите решение и логику работы модели в виде технической документации.
5
3 спринта・3 темы・6 недель
Валидация и тестирование моделей
  • Python
  • Pandas
  • NumPy
  • SciPy
  • Statsmodels
  • Scikit-learn
  • Airflow
  • SQL
  • PostgreSQL
  • Jupyter Notebook
  • Git
Внедрение и мониторинг моделей
Этапы жизненного цикла модели — внедрение и мониторинг. Организация пайплайнов расчёта модели в Airflow для инференса моделей. Мониторинг качества. Стабильность признаков и предсказаний. Выявление деградации модели. Переобучение.
Формулировка гипотез и основы статистики
Основы теории вероятностей и статистики. Случайные величины. Законы распределения данных. Нулевые и альтернативные гипотезы. Статистические тесты: t‑тест, множественная проверка гипотез. Оценка статистической значимости.
A/B‑тестирование и анализ экспериментов
Процесс проведения: от выбора метрик и расчёта размера выборки до анализа и проверки результатов с помощью статистических тестов (тест Манна — Уитни, z‑тест пропорций). Интерпретация результатов. Рекомендации для бизнеса.
Реализуете мониторинг качества модели через Airflow: напишете код, который автоматически читает данные за день и рассчитывает метрики. Проведёте A/B‑тест модели и проанализируете его результаты
1 проект・2 недели
Проект по модулю о валидации и тестировании моделей
Пройдёте полный цикл работы с моделью машинного обучения в продакшн-среде: научитесь читать и дорабатывать готовый код, подготовите модель к инференсу и реализуете её запуск на новых данных с помощью Airflow. Закрепите навыки работы с пайплайнами, автоматизацией процессов и системой контроля версий Git.
2 недели
Подготовка к собеседованиям по Data Science
Узнаете, как проходит техническая часть собеседований. Разберёте примеры задач, которые предлагают соискателям. Потренируетесь отвечать на вопросы, которые часто задают нанимающие менеджеры. Всё это позволит чувствовать себя уверенно на реальном интервью.
1 проект・3 недели
Итоговый проект базового курса
Пройдёте через весь жизненный цикл проекта по Data Science: от анализа данных и проблематики бизнеса до презентации результатов и внедрения решения.
+5 спринтов・+4 проекта・+15 недель
Расширенный курс «Специалист по Data Science»
У этого курса есть расширенный формат: стоит дороже, но включает в себя больше тем и проектов — чтобы усилить портфолио и повысить шансы на быстрое трудоустройство.
  • PySpark
  • MLflow
  • PyTorch
  • Hugging Face
  • Implicit
  • Scikit-learn
  • LightFM
  • Word2vec
Обработка больших данных
Работа с большими данными с помощью Apache Spark. Обработка распределённых датасетов. Оптимизация производительности. SQL в PySpark.
Трекинг экспериментов в MLflow
MLflow для логирования экспериментов и управления жизненным циклом моделей.
Введение в глубинное обучение и нейросети для изображений
Архитектура нейронных сетей: полносвязные, свёрточные. Цикл обучения и валидации модели на фреймворке PyTorch для изображений.
Нейронные сети для текстов
Модели на архитектуре трасформеров: BERT, GPT. Работа с векторным представлением текстов. Адаптация предобученной модели из Hugging Face.
Рекомендательные системы
Устройство контентных, коллаборативных и гибридных подходов. Выбор метрик. Реализация рекомендаций, готовых к внедрению в продакшн.
Дополнительный проект в Мастерской
В условиях, которые максимально приближены к реальным, выполните задачу бизнеса от настоящего заказчика. Поработаете с сырыми данными и обучите модель.
Погрузитесь в продвинутые темы: работу с большими данными, логирование экспериментов с параметрами модели, архитектуру нейросетей. Узнаете подходы к построению рекомендательных систем и научитесь разрабатывать решения, готовые к запуску в продакшн
1 проект・3 недели
Итоговый проект расширенного курса
Тоже пройдёте весь жизненный цикл проекта по Data Science, но столкнётесь с новыми техническими задачами: обработкой больших данных на PySpark и управлением экспериментами через MLflow. У вас будет выбор из двух датасетов, на которых можно выполнять проект.
Карьерный центр・1 месяц
Карьерный трек: подготовка к трудоустройству
Составите резюме, которое привлечёт внимание рекрутеров, и напишете сопроводительное письмо для откликов на вакансии. Узнаете, как правильно оформлять портфолио, и построите стратегию поиска работы.

Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет карьерного трека.
Карьерный центр・До 6 месяцев
Карьерный трек: акселерация
Акселерация — активный поиск работы с поддержкой HR‑экспертов. Будете откликаться на вакансии, делать тестовые и ходить на собеседования, а мы вас дистанционно поддержим. Например, расскажем, какие ошибки бывают в общении с работодателем и как их избежать. Акселерация может продолжаться до 6 месяцев — обычно этого достаточно, чтобы получить первую работу в IT.
Получите диплом о профессиональной переподготовке
Это официальный документ установленного образца, который принимают работодатели. Образовательная лицензия № Л035-01298-77/00185314 от 24 марта 2015 года.
Очень много практики
Ещё 7 месяцев после выпуска бесплатно помогаем с поиском работы — для этого у нас целый карьерный центр
10 000+ выпускников Практикума уже нашли новую работу
И сделали это в первые 4 месяца после учёбы. Это подтверждено исследованием, которое мы провели вместе с Высшей школой экономики. Вот в каких компаниях работают выпускники:
Как устроена учёба
В программе есть модуль по YandexGPT
Работодатели ценят специалистов, которые умеют работать с нейросетями
Увидите возможности нейросетей, научитесь использовать их в работе, поймёте, когда это безопасно и этично, а когда нет
С чем YandexGPT может помочь специалисту по Data Science:
  • с генерацией и проверкой гипотез
  • ответами на вопросы о методах и инструментах анализа
  • ведением документации
Эти выпускники уже стали специалистами по Data Science. Большинство — без опыта в IT
4,7
TutorTop
4,5
IRecommend
4,3
Отзовик

Попробуйте любой формат курса бесплатно — выбрать один-единственный можно позже

  •                                        
Отвечаем на вопросы
Подойдёт ли мне эта профессия?
Для тех, кто сомневается, мы спроектировали бесплатную часть, которая поможет получить ответ на этот вопрос. Если вы убедитесь, что выбранная профессия вам не подходит, — это тоже положительный результат.
Можно ли освоить профессию Data Scientist с нуля за 13 месяцев?
На курсе вы получите всё, чтобы стать специалистом по Data Science. Но результат зависит от вас. Уделяйте курсу не меньше 15 часов в неделю, выполняйте практические задания, общайтесь с экспертами, и всё получится.
Каким требованиям нужно соответствовать?
Вам не понадобятся специальные навыки или опыт — мы обучим всему с нуля. Главное — иметь компьютер и достаточно времени для занятий. Выше можно посмотреть программу обучения, чтобы оценить количество учебного материала и свои возможности.
Кто будет меня учить?
Все наставники — практикующие специалисты: сотрудники Яндекса и других крупных российских и международных компаний. Программу составляют опытные преподаватели и методисты, а ещё действующие специалисты Яндекса, Школы анализа данных и других лидеров технологической и образовательной индустрий.
Смогу ли я найти работу после обучения?
Конкуренция в IT среди новичков высокая, но не экстремальная. А обучение в Практикуме помогает быстрее найти работу: наши выпускники получают на 38% больше приглашений на собеседования по сравнению с кандидатами, которые не проходили онлайн-курсы.

Вот исследование hh.ru.
А если я хочу работать в Яндексе?
Наши студенты стремятся работать в Яндексе, ведь это одна из крупнейших IT-компаний России. Многим из них удаётся попасть в разные сервисы Яндекса, в том числе и в Практикум. Но с нашей стороны было бы нечестно что-либо гарантировать и завышать ваши ожидания.

Без опыта попасть в крупную IT-компанию возможно, хотя и сложно. Программа составлена так, чтобы вы могли начать карьеру после выпуска и набраться первого опыта. С ним вам будет значительно проще претендовать на позицию в крупных компаниях.
Вы поможете мне найти работу?
Да. В Практикуме лучшая программа трудоустройства в онлайн‑образовании по версии «Сравни». Найти работу поможет наш карьерный центр, если вам уже исполнилось 18 лет.

Сначала при поддержке HR‑экспертов вы составите резюме и научитесь писать сопроводительные письма. Потом начнёте активно откликаться на вакансии, а мы будем рядом и минимизируем стресс: проведём тренировочные собеседования, ответим на вопросы, познакомим с карьерным трекером — нашим инструментом для отслеживания вакансий и организации ваших откликов.

Ещё мы предложим вам партнёрские вакансии. В нашей базе 4 000+ компаний, которые регулярно приглашают выпускников Практикума на собеседования.

Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет программы трудоустройства.
Что делать, если я не справлюсь с нагрузкой?
В программе предусмотрены каникулы, во время которых можно отдохнуть или повторить сложные темы.

Если случилось непредвиденное или понадобилось больше времени на закрепление материала, напишите своему куратору. Он поможет перенести дедлайн сдачи проекта или перевестись в более поздний поток. На общую стоимость курса это не повлияет.
Если не понравится, я могу вернуть деньги?
Конечно. Если поток ещё не стартовал, вернём всю сумму. Если учёба уже началась, придётся оплатить прошедшие дни со старта вашего первого потока — но мы вернём деньги за остаток курса. Более подробно рассказываем об этом в 7 пункте оферты.
Получу ли я какой-то документ после курса?
Да, для этого нужно закончить курс и успешно выполнить итоговый проект.

Тогда вы получите диплом о профессиональной переподготовке, если у вас есть среднее профессиональное или высшее образование. Если нет, отправим вам сертификат о прохождении курса в электронном виде.

А если не получится пройти курс целиком и выполнить итоговый проект, по запросу выдадим вам электронную справку об обучении — с перечнем модулей, которые вы освоили.
Как можно оплатить?
Банковской картой: внести всю сумму сразу или платить ежемесячно.

Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Обучение будет стоить меньше, если оплатить весь курс сразу.

Через компанию, если она налоговый резидент РФ. Условия для юридических лиц и ИП отличаются — чтобы узнать подробнее, оставьте заявку или уточните у вашего менеджера.
Можно ли оплатить курс за счёт работодателя?
Да, работодатель может оплатить учёбу полностью или разделить сумму с вами, например 50/50 или 75/25.

Такая оплата пройдёт по счёту или двустороннему договору, а ИП могут оплатить с бизнес-счёта. Если работодатель купит обучение сразу 10 сотрудникам или больше, сделаем скидку 10%.

Условия для юридических лиц и ИП отличаются — чтобы узнать подробнее, оставьте заявку или уточните у вашего менеджера.
Что такое налоговый вычет на обучение и как его получить?
Налоговый вычет может получить тот, кто работает по трудовому договору и является налоговым резидентом Российской Федерации, то есть 183 дня в году находится на территории страны.

Вот инструкция, которая поможет всё оформить.

Давайте поможем

Мы перезваниваем в течение 30 минут каждый день с 10:00 до 19:00. Если оставите заявку сейчас, то перезвоним уже в рабочее время.

Как планируете учиться?