Анализ данных • 24 апреля 2026 • 5 мин чтения

Линейная регрессия (linear regression): определение модели, формула, примеры

Рассказываем, для чего нужна линейная регрессия в аналитике и машинном обучении, в каких сферах применяется и как оценивать коэффициенты.

Что такое линейная регрессия

Линейная регрессия — это способ найти прямую линию, которая лучше всего описывает связь между разными величинами. Например, с её помощью можно понять, как расходы на рекламу влияют на продажи или как уровень ключевой ставки повлияет на бизнес. Этот метод используют в финансах, маркетинге и других сферах, где нужны прогнозы, в машинном обучении и т. д.

Линейная регрессия выглядит на графике как прямая линия. Источник

Линейную регрессию применяют в машинном обучении. Научиться этому можно на курсе «ML-инженер с опытом». На нём за четыре месяца можно освоить полный жизненный цикл модели машинного обучения и научиться строить продвинутые ML-модели. После обучения студенты получают диплом о профессиональной переподготовке.

Зачем она нужна: практическое применение в аналитике и ML

Линейную регрессию применяют в аналитике и ML. Она помогает решать множество задач. Расскажем про основные.

  • Прогноз чисел. Например, сколько товара продадут на следующей неделе, если известны прошлые показатели продаж и сезон.
  • Поиск главных факторов. Например, что сильнее влияет на цену квартиры — площадь или близость к метро.
  • Тренды. Например, растут ли продажи компании из года в год или падают.
  • Проверка идей. Например, стоит ли вообще углубляться в сложные алгоритмы или хватит и прямой линии.

Прежде чем использовать этот метод, нужно убедиться, что данные действительно похожи на прямую линию. Если связь между величинами изогнутая или скачкообразная, линейная регрессия ошибётся. Поэтому всегда сначала рисуют график точек и смотрят на разброс.

Определение модели линейной регрессии и её формула

Модель линейной регрессии — это формула, которая превращает известные данные в предсказание. Например, с помощью неё можно рассчитать цену дома, если известна его площадь. Вот формула модели линейной регрессии:

Формула линейной регрессии

  • y — это то, что мы хотим предсказать (например, цена).
  • x1, x2... — это известные данные (площадь, этаж, год постройки).
  • w0, w1... — это веса, которые модель сама подбирает, чтобы ошибка была минимальной.
  • ε означает случайную погрешность. То есть то, что мы не можем объяснить.

Линейную регрессию применяют в машинном обучении. Научиться этому можно на курсе «ML-инженер с опытом». На нём за четыре месяца можно освоить полный жизненный цикл модели машинного обучения и научиться строить продвинутые ML-модели. После обучения студенты получают диплом о профессиональной переподготовке.

Методы оценки коэффициентов

Коэффициенты в линейной регрессии — это числа, на которые умножаются входные данные, чтобы получить предсказание. Каждый коэффициент показывает, насколько сильно соответствующий признак влияет на итоговый ответ. Чтобы подобрать коэффициент в линейной регрессии, используют разные методы. Мы расскажем про основные.

  • Метод наименьших квадратов (МНК). Он находит такую прямую, чтобы сумма квадратов расстояний от всех точек до этой прямой была минимальной. МНК работает быстро и даёт точный ответ, если данных не очень много и они аккуратные.
  • Градиентный спуск. Если данных миллионы или они поступают непрерывным потоком, прямой расчёт становится слишком сложным. Градиентный спуск постепенно, шаг за шагом поправляет коэффициенты, пока ошибка не станет маленькой.
  • Регуляризованные методы (гребневая регрессия и лассо). Когда признаков слишком много, модель может начать выдумывать лишнее. Гребневая регрессия и лассо добавляют специальные «штрафы», которые помогают отбросить неважные факторы или уменьшить их влияние.

На практике часто комбинируют подходы: сначала пробуют метод наименьших квадратов на маленькой подвыборке, чтобы понять, работает ли линейная связь. Если данных очень много, градиентный спуск с регуляризацией даёт наиболее устойчивый результат. Любой метод нужно проверять на данных, которые не участвовали в подборе коэффициентов, иначе будет сложно узнать, насколько модель хороша на самом деле.

Примеры использования линейной регрессии

Линейная регрессия применяется в разных сферах — в банках, продажах, рекламе и т. д. Расскажем об этом подробнее.

  • Прогнозирование спроса и управление запасами. В розничной торговле с помощью линейной регрессии можно предсказывать будущие продажи на основе исторических данных. Модель учитывает сезонность, рекламные акции и ценовые изменения.
  • Прогнозирование цен на недвижимость. Линейная регрессия помогает оценить цену квартиры или дома на основе таких факторов, как площадь, этаж, удалённость от метро и год постройки. Такие модели помогают агентствам недвижимости, оценщикам и покупателям быстро получать справедливую рыночную стоимость.
  • Анализ эффективности рекламных бюджетов. Компании используют регрессионный анализ для оценки того, как различные каналы рекламы влияют на продажи.

На практике линейную регрессию часто используют как базовую модель для сравнения с более сложными алгоритмами. В некоторых задачах, например при прогнозировании спроса, сложные модели могут давать более высокую точность, но требуют больше данных и вычислительных ресурсов. Однако в ситуациях, где важна интерпретируемость, линейная регрессия остаётся основным инструментом.

Статью подготовили:
Валентина Бокова
Яндекс Практикум
Редактор
Анастасия Павлова
Яндекс Практикум
Иллюстратор

Подпишитесь на наш ежемесячный дайджест статей —
а мы подарим вам полезную книгу про обучение!

Поделиться
Помогите Алисе попасть в страну IT и получите в подарок гайд, полезные книги и скидку 10%