Анализ данных • 01 апреля 2025 • 5 мин чтения

Топ книг по машинному обучению и искусственному интеллекту для новичков

Со старшим экспертом направления Data Science Евгением Арзамасцевым обсудили, с чего начать изучение машинного обучения. Делимся рекомендациями и списком книг по машинному обучению и искусственному интеллекту.

С чего начать изучение машинного обучения

Специалисту по Data Science нужно знать высшую математику, разбираться в статистике и теории вероятностей и уметь программировать на Python. Разберёмся по порядку, как и в какой последовательности стоит начинать изучение этой обширной области.

Шаг 1. Пройти профориентацию, чтобы погрузиться в тематику. Как показывает практика, новички по-разному понимают, чем им предстоит заниматься в Data Science.

Уяснить основные составляющие этой области знаний и понять, насколько она тебе интересна, помогут мини-курсы, например на платформе Яндекс Практикума.
Также можно познакомиться с другими обзорными курсами, вводными лекциями и книгами, которые расскажут, из чего состоит Data Science и чем занимаются работающие в этой сфере специалисты.

Евгений Арзамасцев, Старший эксперт направления Data Science, Яндекс Практикум
Прекрасные вводные уроки, с которыми будет полезно ознакомиться новичкам, можно найти у Константина Воронцова, создателя курса лекций «Машинное обучение». Также на платформе Яндекс Образование доступен онлайн-учебник по машинному обучению с замечательно описанной вводной частью. Как минимум начать изучение ML советую с него: узнаете, что такое Data Science и машинное обучение в целом и чем занимаются дата-сайентисты.

Шаг 2. Понять, с каким инструментарием предстоит иметь дело. Практически все действия — примерно 90% функционала — в Data Science реализуются с использованием языка Python, поэтому нужно быть готовым разбираться в нём. Дата-сайентист должен знать язык на уровне базового программирования на нём и уметь писать код. В зависимости от дальнейшего развития, возможно, потребуется углубить знания в Python.

Глубина изучения Python зависит от профессиональных устремлений конкретного студента, но базовые вещи, безусловно, знать необходимо. В этом помогут бесплатные курсы по введению в Python — такие есть у Практикума, в том числе «Основы Python-разработки», и на других платформах. Прохождение этих курсов занимает в среднем 2–3 недели (максимум — месяц) при высокой мотивации и наличии свободного времени и даёт хорошую фундаментальную базу. Следующий шаг в изучении — это книги по Python, их перечислим и прокомментируем ниже.

Шаг 3. Погрузиться в теорию вероятностей и в математическую статистику. Скорее всего, большинство студентов в работе будут использовать готовые наработки, а не заниматься разработкой собственных алгоритмов и улучшением существующих, но понимать основы всё-таки нужно.

Дата-сайентисту нужна базовая математика, чтобы понять, как «под капотом» работают алгоритмы машинного обучения. Глубина освоения, как и глубина погружения в Python, будет зависеть от конкретных задач в профессии. Для сопровождения и развёртывания готовых решений достаточно общего понимания основных принципов и матаппарата. Начинающий специалист может познакомиться с терминами и овладеть единым понятийным аппаратом в среднем за один-два месяца.

Крайне желательно освоить базовые элементы теории вероятностей, математического анализа и линейной алгебры. У Константина Воронцова есть отдельные лекции по матану и по линейной алгебре.

Что касается книг, здесь всё очень сильно все зависит от фундамента. Людям с техническим образованием будет просто восстановить знания, прослушав ряд лекций. Сегодня в интернете при желании можно найти много конспектов лекций известных университетов. Как правило, в них нет подробных объяснений: чаще сразу дают основные формулы и графики. В большинстве случаев бывшим студентам технических вузов этого достаточно, чтобы вспомнить базу.

Людям, которые закончили гуманитарные вузы, придётся выделить время на изучение этих основ. Обычно они включены в большинстве курсов, в том числе в Практикуме. Хорошим подспорьем станут книги общего характера по линейной алгебре и матанализу.

Подытожим: Python, теория вероятностей и статистика — база в Data Science. Освоить эти и другие необходимые знания с поддержкой опытных экспертов можно на курсе «Специалист по Data Science». Вводные уроки доступны бесплатно.

Базовые книги для успешного старта

Что почитать по Python

«Python и машинное обучение», Себастьян Рашка

Классная книга про машинное обучение, в которой сложные вещи описываются очень простым языком, а подача материала идёт по нарастающей и с соблюдением внутренней логики. Автор приводит очень много живых примеров, которые применяются в реальной жизни и реализованы как практические кейсы. Код, который показывает Рашка, теоретически и практически можно использовать в своих проектах.

Где купить: Ozon

«Изучаем Python», Марк Лутц

Этот двухтомный учебник с теорией и упражнениями после каждой главы может показаться новичкам сложноватым для освоения, в том числе из-за слога. Но, как считают эксперты, это основа основ для изучения «Питона». Альтернатива — проходить курсы или использовать книгу в качестве справочника.

Где купить: Литрес

«Основы Python. Научитесь думать как программист», Дауни Аллен Б.

Хороша понятным языком и подачей материала от простого к сложному. Автор приводит много примеров для закрепления материала.

Где купить: Читай-Город

Что почитать по статистике и теории вероятностей

«Статистика и котики», Владимир Савельев

Отличная книга, в простой и доступной форме знакомит с такими понятиями, как статистика, теория вероятностей, проверка гипотез и т. д. В ней нет практики, но приводится масса понятных примеров с пушистиками.

Где купить: Литрес

Что почитать по Data Science

«Аналитика и Data Science», Никита Сергеев

Введение в тему для неаналитиков и даже 100-процентных гуманитариев, как иронично подчёркивает сам автор. Книга хорошо подходит тем, кто хочет не только разобраться с машинным обучением, но и понять, что такое аналитика, как работать с данными и проводить исследования на основе данных. Здесь мало формул и много объяснений простыми словами — идеально для начинающих.

Где читать: Яндекс Книги

«Глубокое обучение на Python», Франсуа Шолле

Отлично подойдёт тем, кто хочет с нуля разобраться, что такое глубокое обучение и нейронные сети. Поможет освоить один из самых популярных фреймворков для работы с глубокими нейронными сетями — TensorFlow. Но читателям желательно иметь фундаментальную базу, быть знакомым с математикой и статистикой, хорошо знать Python и быть готовыми глубже погружаться в тему Data Science.

Где купить: Ozon

Евгений Арзамасцев
Лично мне очень понравилась книга Франсуа Шолле. Исследователь и создатель библиотеки Keras не только рассказывает про работу самой библиотеки и применение методов этой библиотеки для решения реальных задач из практики, но и, по сути, полностью воссоздаёт курс по глубокому обучению.
На глубоких нейронных сетях строятся практически все современные алгоритмы искусственного интеллекта, в том числе языковые модели, генеративные сети для создания музыки, изображений и видео. Понимание работы глубоких нейронных сетей — важный шаг вперёд для дата-сайентиста.
Книга Шолле позволит усвоить, что такое глубокие нейронные сети и как они работают, как происходит создание, обучение и использование глубоких нейронных сетей. Также она познакомит с фреймворком TensorFlow, с которым уже получится разрабатывать свои собственные нейронные сети и решать конкретные задачи в продакшене.

«Data Science. Наука о данных с нуля», Джоэл Грас

Несмотря на привлекательное для новичков название, эта книга предполагает минимальное знакомство читателя с машинным обучением. Здесь описаны все ключевые навыки, которыми должны обладать дата-сайентисты, — от Python и его базовых библиотек до моделей машинного обучения.

Отлично подойдёт как следующий этап развития новичка или для самопроверки.

Где купить: Ozon

«Грокаем Машинное обучение», Луис Серрано

Простой практический подход к изучению машинного обучения. Книга подходит новичкам и тем, кто хочет освежить знания. Маловато практики, довольно много примеров, в целом подходит для ознакомления.

Где читать: Яндекс Книги

«Машинное обучение с PyTorch и Scikit-Learn», Себастьян Рашка

Одно из лучших учебных пособий для начинающих дата-сайентистов. Тут есть буквально все — концепции, инструкции, примеры и практика. Также Рашка рассматривает наиболее популярные инструменты, такие как библиотека Scikit-Learn и PyTorch. Книга объединяет классическое ML и глубокое обучение.

Где купить: Ozon

«Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными», Андреас Мюллер и Сара Гвидо

Подходит для новичков: в книге мало теории, зато много практических примеров. Рассматриваются библиотеки Scikit-Learn и Keras, что позволяет вкатываться в профессию с нуля.

Где подождать: Литрес

Надеемся, что наша подборка и советы помогут тебе максимально комфортно погрузиться в мир Data Science. Если что-то будет непонятно, приходи на курсы Практикума — всё объясним, подскажем и поддержим.

Статью подготовили:
Евгений Арзамасцев
Яндекс Практикум
Старший эксперт направления Data Science
Мария Вихрева
Яндекс Практикум
Редактор
Полина Овчинникова
Яндекс Практикум
Иллюстратор

Дайджест блога: ежемесячная подборка лучших статей от редакции

Поделиться
Угадайте, где правда, а где фейк про IT, и получите скидку на курсы Практикума
Mon Apr 14 2025 12:06:02 GMT+0300 (Moscow Standard Time)