Анализ данных • 31 октября 2024 • 5 мин чтения

Теория вероятностей: как научиться предсказывать случайные события

Рассказываем, что такое теория вероятностей и как рассчитывать зависимые, независимые и другие события, на понятных примерах.

Что такое теория вероятности

Теория вероятностей — это раздел математики, который позволяет нам анализировать события и предсказывать их логически обоснованным образом. Например, она помогает предсказывать погоду или оценивать риски в бизнесе. Эту теорию используют в разных сферах, таких как страхование, IT, сельское хозяйство, азартные игры и даже психология.

Вероятность события отражается в виде числа, которое всегда находится в диапазоне от нуля до единицы: ноль указывает, что событие не произойдёт, а единица — что оно точно произойдёт. Любое событие с вероятностью от 0 до 0,5 — маловероятно, а с вероятностью от 0,5 до 1 — вероятно. Вероятности могут быть выражены в дробях, десятичных дробях или процентах. Например, если событие имеет вероятность 1/2 — это то же самое, что 0,5 или 50%.

Событие с вероятностью ближе к нулю будет считаться маловероятным, ближе к единице — вероятным

Предсказывать случайные события учат на курсе «Специалист по Data Science». За 8 месяцев студенты изучают и осваивают теорию вероятностей, статистику, языки программирования и программы, которые нужны для работы с машинным обучением. По окончании курса выпускники получают портфолио с 15 работами и диплом о профессиональной переподготовке.

Основные понятия в теории вероятности

Для понимания задач по теории вероятностей нужно знать основные термины. 

  • Случайный эксперимент — это процесс, в ходе которого случается что-то неопределённое (например, результат вытягивания карты из колоды, подбрасывания монеты или игрального кубика). 
  • Пространство выборки — набор всех возможных результатов случайного эксперимента (например, выборочное пространство подбрасывания монеты — орёл или решка). 
  • Событие — набор результатов эксперимента, который образует подмножество выборочного пространства. 
  • Вероятность — возможность определить числовую вероятность возникновения события. 
  • Случайная переменная — переменная, которая принимает значения всех возможных результатов эксперимента. Существует два типа случайных переменных: 
  1. Дискретная случайная переменная — может принимать точное значение, например 0, 1, 2.
  2. Непрерывная случайная переменная — может принимать бесконечное количество значений.
Случайная переменная может быть точной или иметь большое количество значений

Формула и виды событий в теории вероятности

Перечислим основные шесть видов событий и соответствующие формулы. 

  1. Независимые события — когда первое событие не влияет на вероятность второго события, и наоборот. Рассчитывается по формуле: P(A/Б) = P(A) × P(Б). Например, выпадение из колоды карт дамы или туза — независимые события. Другими словами, исход предыдущего события не влияет на следующее. 
  2. Зависимые события — когда оба события влияют друг на друга. Рассчитывается по формуле: P(A/Б) = P(A) × P(Б затем А) с использованием множества P(A∩Б) = P(A) × P(Б|А). 
  3. Взаимоисключающие события — не имеют общего результата, поэтому не могут происходить вместе. Например, выпадение орла или решки при подбрасывании монеты — взаимоисключающие события, поскольку вы не можете получить и то, и другое одновременно. Рассчитывается по формуле P(A или Б) = P(A) + P(Б) или P(A или Б) = P(A) + P(Б) – P(A и Б).
  4. Комбинированные (составные) события — состоят из двух или более экспериментов, проводимых вместе. Рассчитывается по формуле P(A∩Б) = P(A) × P(Б). 
  5. Условная вероятность — вероятность первого события при условии, что произошло второе событие. Рассчитывается по формуле P(A | B) = P(A∩B) / P(B). 
  6. Теорема Байеса — принцип в теории вероятностей, который позволяет обновлять вероятность гипотезы на основе новых данных. Она основана на условной вероятности и названа в честь математика Томаса Байеса. Рассчитывается по формуле P(A | B) = P(B | A) × P(A) / P(B). 
  7. Дополнительное событие — рассматривается не как невероятное событие, а как отрицающее событие. Например, при подбрасывании монеты выпадение решки будет считаться как «не орёл», а вытягивание туза из колоды карт будет считаться вытягиванием «не дамы». Рассчитывается по формуле Р(Ас) = 1 – Р(А) или P(A) + P(Ac) = 1.

Как решать задачи по теории вероятности

Для решения задачи по теории вероятностей нужно понять, к какому виду относится событие, и подробно записать условия. Рассмотрим шесть примеров решения задач.

1. Вычислим вероятность вытягивания туза из колоды карт. При этом достать можно только две карты без замены.
В стандартной колоде 52 карты, из них четыре туза. Значит, при выборе одной карты из колоды вероятность вытягивания туза равна 4/52. Вероятность вытягивания туза по второй карте будет меняться в зависимости от того, что произошло при первом событии:

● Первой картой был туз, в колоде остались три туза и 51 карта. Значит, вероятность получить ещё один туз равна 3/51.
● Первая карта не была тузом, в колоде остались четыре туза и 51 карта. Значит, вероятность получить ещё один туз равна 4/51.

Если результат второй карты зависит от результата первой карты — это зависимые события. Вычислим вероятность вытягивания двух тузов по формуле P(A∩Б) = P(A) × P(Б|А):

● P(A∩Б)= 4/52 × 3/51.
● P(A∩Б)= 12/2652 = 0,004 = 0,4% — вероятность вытягивания двух тузов из колоды карт без замены карт.

2. Вычислим вероятность выпадения орла при подбрасывании монеты, где A — монета упала орлом, Б — решкой. Монета одна, у неё две стороны. Значит, шансы выпадения орла и решки одинаковые — ½.
Монета не может упасть сразу двумя сторонами — это взаимоисключающие события. Поэтому рассчитывать вероятность будем по формуле P(A или Б) = P(A) + P(Б):
P(A или Б)= ½ + ½ = 1 — вероятность, что монета упадёт орлом.

3. Вычислим вероятность вытягивания из колоды чёрной карты или шестёрки. Известно, что в колоде 52 карты, из них четыре шестёрки и 26 карт чёрных мастей. Результат вытягивания и в том и другом случае будет зависеть друг от друга, так как шестёрки могут быть чёрными. Значит, это задача на взаимоисключающие события, которая будет решаться по формуле: P(A или Б) = P(A) + P(Б) – P(A и Б). Вероятность выбора как чёрной карты, так и шестёрки = 2/52:
P(A или Б) = 26/52 + 4/52 – 2/52 = 28/52.

4. Вычислим вероятность того, что студент будет изучать естественные науки. При этом нужно учесть, студент уже изучает математику. В классе 40% учеников изучают математику и естествознание, 60% — только математику.
Студент изучает математику. Значит, одно из событий уже произошло — это условная вероятность. Формула будет такой: P(A | B) = P(A∩B) / P(B). Условия задачи заданы в процентах, переведём их в цифры: Р(М и S) = 0,40; Р(М) = 0,60.
P(S|M) = P(M и S) / P(S) = 0,40/0,60 = 2/3 = 0,67, или 67% — студент с высокой вероятностью начнёт изучать естественные науки.

5. Вычислим вероятность того, что из упаковки можно вытащить наугад две синие и одну чёрную ручку. При этом нужно учесть, что в упаковке девять ручек: четыре синие, две красные и три чёрные. Ручку нужно вытащить и повторить процесс ещё два раза.
Вероятность выпадения такого количества ручек с определённым цветом не зависит от предыдущего события — это независимые события. Значит, рассчитывать будем по формуле P(A/Б) = P(A) × P(Б). Вероятность вытянуть одну синюю ручку = 4/9, ещё одну синюю ручку = 4/9. Вероятность вытянуть одну чёрную ручку = 3/9.
Вероятность вытянуть две синие ручки и одну чёрную = 4/9 × 4/9 × 3/9 = 48/729.

6. Вычислим вероятность заболевания сердца у пациента. При этом нужно учесть, что пациент — курильщик. 10% поступивших в клинику пациентов страдают заболеваниями сердца, 5% пациентов в клинике курят, а 7% — курят и страдают заболеваниями сердца. Значит, Р(А) = 0,10; Р(В) = 0,05; B|A = 0,07. Решим задачу с помощью теоремы Байеса по формуле P(A | B) = P(B | A) × P(A) / P(B).

P(A|B) = (0,07 × 0,1) / 0,05 = 0,14 — вероятность события меньше 0,5. Значит, возникновение заболевания сердца у пациента маловероятно.

Примеры и задачи

Для самопроверки решите три задачи по поиску зависимого и дополнительного события.

1. Задача. Есть пять зелёных и семь красных шаров. Два шара выбираются по одному без замены. Найти вероятность того, что первый шар будет зелёным, а второй — красным. 

Решение. От выбора первого шара будет зависеть выбор второго шара — это зависимые события. Решение ищем по формуле: P(A/Б) = P(A) × P(Б). 

P(A) × P(Б) = (5/12) × (7/11) = 35/132 = 3/7.

2. Задача. В колоде 52 карты — по 13 карт каждой масти (черви, бубны, трефы, пики). Найти вероятность того, что выпадет или не выпадет карта червовой масти. 

Решение. В колоде 13 червовых карт — значит, вероятность выпадения масти черви = 13/52, или ¼. Решим задачу через дополнительное событие по формуле: Р(Ас) = 1 – Р(А). 

Р(Ас) = 1 – 1/4 = ¾ — вероятность, что карта червовой масти не выпадет. 

3. Задача. У игрального кубика шесть граней. Нужно вычислить вероятность того, что не выпадет грань с единицей. 

Решение. Эта задача с дополнительным событием. Всего у кубика шесть сторон — грани от 1 до 6. Вероятность выпадения однёрки равна ⅙. Вероятность того, что однёрка не выпадет, рассчитаем по формуле Р(Ас) = 1 – Р(А):

Р(Ас) = 1 – 1/6 = ⅚.

Статью подготовили:
Валентина Бокова
Яндекс Практикум
Редактор
Анастасия Павлова
Яндекс Практикум
Иллюстратор

Дайджест блога: ежемесячная подборка лучших статей от редакции

Поделиться
Вакансии, зарплаты, навыки в 2025 году: бесплатный вебинар с экспертами ведущих IT-компаний 28 января в 19:00
Wed Jan 15 2025 08:50:27 GMT+0300 (Moscow Standard Time)