Что делают специалисты по Data Science

Такие специалисты анализируют данные и на их основе строят модели, которые помогают принимать решения в науке, бизнесе и обычной жизни.

Data Science — это применение научных методов в работе с данными.

В целом естественные науки основаны на Data Science. Например, биолог проводит эксперименты, чтобы проверить гипотезы: он должен обобщать частные наблюдения, исключать случайности и делать верные выводы.

Какой может быть ваша карьера

Должность

Специалист по Data Science

Навыки и инструменты

Мы регулярно обновляем программу вместе с практикующими экспертами и надёжными работодателями — так вы учитесь только тому, что актуально

Python
Jupyter Notebook
GitHub
SQL
Keras
Catboost
Scikit-learn
Pandas
Pytorch
Spark

Средняя зарплата специалистов по Data Science

Начнёте с junior-позиции, а дальше только вперёд — будете шагать по карьерной лестнице и расти в цене

Источник: Хабр Карьера
60 000 ₽
Junior
120 000 ₽
Middle
210 000 ₽ +
Senior

Почему этот курс «‎с плюсом»

В Практикуме три курса по Data Science: базовый, расширенный и ускоренный

Как мы учим, чтобы вы освоили Data Science за 16 месяцев

Что говорят выпускники

78% выпускников Практикума находят работу после учёбы

Поможем найти работу, а если не получите предложений через 6 месяцев после курса — вернём деньги

Программа курса по Data Science

Мы развиваемся вместе с индустрией и постоянно обновляем программу — поэтому она всегда актуальна. Курс идёт 16 месяцев, учёбе нужно будет посвящать минимум 10 часов в неделю.
Вводный модуль2 недели
Бесплатный вводный курс: основы Python и анализа данных
Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики данных и специалисты по Data Science. Решите пять кейсов по работе с данными из разных областей:

- выясните причину массовой поломки гаджетов;
- проверите окупаемость рекламы мобильного приложения;
- найдёте лучшее место для нового магазина;
- поможете выбрать стратегию развития ИИ-стартапа;
- оцените эффективность роботов в службе поддержки.

Решая кейсы, вы изучите азы Python и библиотеки pandas, научитесь строить некоторые графики и верно их трактовать.
1 модуль12 недель
Введение в анализ данных
Спринт 1. Базовый Python
Глубже погрузитесь в язык программирования Python и работу с библиотекой pandas.

Спринт 2. Предобработка данных
Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных.

Спринт 3. Исследовательский анализ данных
Изучите основы теории вероятностей и статистики. Примените их для исследования свойств данных, поиска закономерностей, распределений и аномалий. Познакомитесь с библиотеками SciPy и Matplotlib. Создадите диаграммы, поупражняетесь в анализе графиков.

Спринт 4. Итоговый проект первого модуля
Проведёте сложный исследовательский анализ датасета с информацией о фильмах: показы в кинотеатрах, сборы, государственная поддержка. Потренируетесь в предобработке, вычислениях и построении визуализаций. В этой работе вы сами принимаете решения по обработке и выбору способов визуализации данных. В конце проекта вы проведёте самостоятельное исследование по фильмам с государственной поддержкой и найдёте интересные закономерности.
Проект
Сравните данные пользователей Яндекс.Музыки по городам и дням недели
Проект
Проанализируете данные о клиентах банка и определите долю кредитоспособных
Проект
Исследуете архив объявлений о продаже объектов недвижимости в Санкт-Петербурге и Ленинградской области
Проект
Сделаете сборный проект по итогам всего модуля — исследование фильмов с государственной поддержкой
2 модуль15 недель
Основы машинного обучения
Спринт 5. Статистический анализ данных
Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы.

Спринт 6. Введение в машинное обучение
Освоите базовые концепции машинного обучения. Познакомитесь с библиотекой Scikit-Learn и примените её для создания первого проекта с машинным обучением.

Спринт 7. Обучение с учителем
Углубитесь в самую востребованную область машинного обучения — обучение с учителем. Оно предполагает обучение на заранее размеченных данных. Ещё вы узнаете, как обращаться с несбалансированными данными.

Спринт 8. Машинное обучение в бизнесе
Примените свои знания о машинном обучении к задачам бизнеса. Узнаете, что такое бизнес-метрики, KPI и A/B-тестирование.

Спринт 9. Итоговый проект второго модуля
Объедините навыки, полученные во всех пройденных курсах.
Проект
Проверите гипотезы и оптимизируете работу отдела маркетинга
Проект
Разработаете систему рекомендации тарифов для оператора мобильной связи
Проект
Спрогнозируете вероятность ухода клиента из банка
Проект
Обучите модель для предсказания добычи нефти с наименьшим риском убытков
Проект
Сделаете сборный проект по итогам всего модуля
3 модуль11 недель
Машинное обучение для больших объемов данных
Спринт 10. Базовый SQL
Изучите основы структурированного языка запросов SQL и операции реляционной алгебры. Познакомитесь с PostgreSQL — популярной системой управления базами данных (СУБД). Научитесь писать запросы разного уровня сложности и переводить бизнес-задачи на язык SQL.

Также вы познакомитесь с PySpark — библиотекой с открытым исходным кодом, которая применяется для распределённой обработки больших объёмов данных.

Попрактикуетесь на базе данных онлайн-магазина, который специализируется на фильмах и музыке.

Спринт 11. Командная строка и Git
Научитесь пользоваться командной строкой — интерфейсом, благодаря которому разработчики управляют компьютером и выполняют действия, вводя текстовые команды с клавиатуры. Разберётесь с Git — распределённой системой контроля версий, которая помогает хранить информацию о всех изменениях в вашем коде, а также упрощает командную работу над проектом.

Спринт 12. Мастерская
Мастерская — это возможность попрактиковаться в решении задач по машинному обучению. В этом спринте вы либо поработаете над проектом от реального заказчика, либо поучаствуете в соревнованиях на Kaggle.

Kaggle — это популярный сервис конкурсов по исследованию данных и машинному обучению. Тысячи специалистов по Data Science со всего света участвуют в соревнованиях Kaggle, чтобы получить опыт и награды.

Работа с заказчиками и участие в соревнованиях дают преимущество при трудоустройстве, ведь эти проекты пойдут в ваше портфолио.

Спринт 13. Системы обработки больших данных
Познакомитесь с PySpark — Python-фреймворком Apache Spark, который представляет собой систему с открытым исходным кодом, применяемую для распределённой обработки больших данных.

Узнаете про концепцию обработки MapReduce: большие данные распределяют между кластерами и обрабатывают параллельно, а потом собирают результаты вместе.
Проект
Напишите ряд запросов разной сложности к базе данных, в которой хранятся данные по венчурным инвесторам, стартапам и инвестициям в них
Проект
Разместите проекты в своём аккаунте на сервисе Github с помощью командной строки и системы контроля версий Git
Проект
Проект даёт преимущество при трудоустройстве, ведь он пойдёт в ваше портфолио
4 модуль12 недель
Продвинутое машинное обучение
Спринт 14. Линейная алгебра
Заглянете внутрь нескольких изученных ранее алгоритмов и лучше поймёте, как их применять. На практике освоите главные концепции линейной алгебры: линейные и евклидовы пространства, линейные операторы.

Спринт 15. Численные методы
Разберёте ряд алгоритмов и приспособите их к решению практических задач с использованием численных методов. Освоите приближённые вычисления, оценки сложности алгоритма, градиентный спуск. Узнаете, что такое градиентный бустинг.

Спринт 16. Мастерская
Мастерская — это возможность попрактиковаться в решении задач по машинному обучению. В этом спринте вы либо поработаете над проектом от реального заказчика, либо поучаствуете в соревнованиях на Kaggle.

Kaggle — это популярный сервис конкурсов по исследованию данных и машинному обучению. Тысячи специалистов по Data Science со всего света участвуют в соревнованиях Kaggle, чтобы получить опыт и награды.

Работа с заказчиками и участие в соревнованиях дают преимущество при трудоустройстве, ведь эти проекты пойдут в ваше портфолио.

Спринт 17. Продвинутый SQL
Пройдёте дополнительный курс по работе с базами данных и станете ещё ближе к бизнесу. С помощью языка SQL разберёте подсчёт основных бизнес-метрик, с которыми вы познакомились в курсе «Анализ бизнес-показателей». Рассмотрите работу с таким сложным инструментом, как оконные функции. Научитесь изменять содержимое баз данных локально, без тренажёра, используя специальные программы-клиенты и библиотеки для Python.

Спринт 18. Модели и алгоритмы машинного обучения
Познакомитесь с ранее не изученными алгоритмами машинного обучения и нейронными сетями.

Спринт 19. Итоговый проект третьего и четвёртого модулей
Объедините в проекте навыки, полученные в третьем и четвёртом модулях.
Проект
Методом преобразования данных защитите личную информацию клиентов страховой компании
Проект
Разработаете модель для определения стоимости автомобиля с пробегом
Проект
С помощью Python и SQL подключитесь к базе данных, посчитаете и визуализируете ключевые метрики сервис-системы вопросов и ответов о программировании
Проект
Сделаете сборный проект по итогам третьего и четвёртого модулей
5 модуль15 недель
Машинное обучение в прикладных задачах
Спринт 20. Временные ряды
Научитесь анализировать временные ряды. Узнаете, как создавать табличные данные из временных рядов и решать для них задачу регрессии.

Спринт 21. Обработка естественного языка
Научитесь предобрабатывать тексты и решать для них задачи классификации и регрессии. Узнаете, как с помощью различных подходов вычислять эмбеддинги — векторные представления слов. Научитесь пользоваться state-of-the-art моделями, основанными на трансформерах, — современной архитектуре нейронных сетей.

Спринт 22. Компьютерное зрение
Научитесь решать простые задачи компьютерного зрения с привлечением готовых нейронных сетей. Познакомитесь с классическими подходами в компьютерном зрении. Заглянете в мир Deep Learning.

Спринт 23. Итоговый проект пятого модуля
Примените навыки, полученные в предыдущих модулях. Выполняя проект, подведёте итоги вашего знакомства со специализациями Data Science.
Проект
Построите модель и спрогнозируете пиковые нагрузки в службе такси
Проект
Ускорите модерацию комментариев в сообществе, автоматизировав оценку их токсичности
Проект
Построите модель для определения приблизительного возраста человека по фотографии
Проект
Сделаете сборный проект по итогам всего модуля
Финишная прямая2 недели
Выпускной проект
В последнем проекте вы подтвердите, что освоили новую профессию: уточните задачу заказчика, пройдёте все стадии анализа данных и машинного обучения. Теперь без уроков и домашних заданий — как на реальной работе.
Дополнительные курсы
Это необязательные спринты. Значит, каждый студент сам выбирает один из вариантов прохождения:
- Освоить дополнительный курс из нескольких коротких уроков, освежить в памяти теорию и решить задачи;
- Пропустить курс совсем или вернуться к нему, когда будет время и необходимость.

Теория вероятностей
Вспомните или узнаете базовые термины в теории вероятностей: независимые, противоположные, несовместные события и т.д.
На простых примерах и забавных задачах потренируетесь работать с числами и выстраивать логику решения. После попробуете себя в решении задач для собеседований.

Практика SQL
Несколько десятков дополнительных задач на отработку навыка работы с SQL.
Карьерный трек
Программа трудоустройства
В дополнение к основной образовательной программе вы можете пройти трек трудоустройства, чтобы быстрее найти новую работу. Программа включает руководства, вебинары, домашние задания. Каждая секция трека длится 2 недели и занимает около 10 часов.

Что ещё важно

Есть академический отпуск
Если жизненные обстоятельства осложнились или темп учёбы нужно снизить, вы можете уйти в академический отпуск
Вернём деньги, если не понравится
Вы можете вернуть деньги за оставшееся время обучения: для этого не нужно ничего доказывать
У вас будет диплом установленного образца
После курса мы выдадим документ о профессиональной переподготовке
Сможете получить налоговый вычет
Чтобы вернуть 13% от стоимости курса, надо быть налоговым резидентом РФ и работать по трудовому договору

Отвечаем на вопросы