● Если H — множество упражнений, укрепляющих руки, и L — множество упражнений, укрепляющих ноги, то H ∩ L — множество упражнений, укрепляющих руки и ноги.
● Если A — множество яблок и G — множество зелёных предметов, то A ∩ G — множество зелёных яблок.
● Если E — множество песен на английском языке и J — множество песен Дженнифер Лопес, то E ∩ J — множество песен Дженнифер Лопес на английском языке.
В математике главное — практика. Поэтому знание правил лучше закреплять решением задач. Сделать это можно на курсе «Математика для анализа данных». На нём вы сможете решить больше 1000 практических задач.
● Если B — множество книг по здоровому питанию и A — множество статей по здоровому питанию, то B ∪ A — множество книг и статей по здоровому питанию.
● Если O — множество апельсинов и M — мандаринов, то O ∪ M — общее множество апельсинов и мандаринов вместе.
● Если F — множество уроков с первого по пятый и L — множество уроков с третьего по шестой, то F ∪ L — множество уроков с первого по шестой.
Набор данных — это множество. Операции пересечения и объединения — самые базовые из возможных операций над данными. Для примера возьмём два множества: первое — клиентов, звонивших в колл-центр, второе — клиентов, писавших в чат. Найти клиентов, которые и звонили в колл-центр, и писали в чат — это пересечение. Собрать базу клиентов, которые обращались через любой из этих каналов, — объединение.
Операции пересечения и объединения используются во всех языках программирования. В том числе в тех, которые чаще всего применяют аналитики. Например, в SQL операции пересечения множеств соответствует оператор INTERSECT, а операции объединения — UNION. В Python эти операции называются intersection и union.
В SQL для объединения таблиц также используют оператор JOIN, но у него другие свойства. Операции объединения множеств полностью соответствует UNION: этот оператор соединяет таблицы, но оставляет только уникальные значения.
А что со свойствами? Коммутативность, ассоциативность, дистрибутивность — эти свойства операций над множествами используются и в языках программирования. Когда аналитик понимает, как взаимодействуют множества, он быстрее решает связанные с ними рабочие задачи и делает меньше ошибок.
Операции над множествами, как и действия с числами, обладают рядом свойств. Пересечение можно соотнести с умножением, а объединение — со сложением. Тогда получатся свойства, знакомые со школы.
Повторить свойства пересечения и объединения множеств можно в модуле «Множества» тренажёра «Основы математики для цифровых профессий». В нём есть и другие уроки из темы «Множества»:
● Разность множеств.
● Мощность. Правила суммы и произведения.
● Формула включений-исключений.
Они помогут аналитику данных разобраться в операциях, где нужно фильтровать, группировать, сортировать и обсчитывать данные. Это базовый навык для работы, его часто проверяют на собеседованиях. Знание теории множеств помогает освоить теорию вероятностей и статистику, разобраться в операции Except и научиться без ошибок определять размер объединяемых дата-сетов.
Свойство коммутативности: вне зависимости от порядка множеств элементы их пересечения и объединения неизменны.
A ∩ B = B ∩ A
A ∪ B = B ∪ A
Свойства пересечения и объединения для пустого множества: при пересечении любого множества с пустым получается пустое множество, при объединении — исходное множество.
A ∩ ∅ = ∅ A ∪ ∅ = A
Дистрибутивность пересечения относительно объединения. Чтобы пересечь A с объединением B ∪ C, можно пересечь A ∩ B и A ∩ C, а потом найти объединение получившихся множеств.
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
Дистрибутивность объединения относительно пересечения. Чтобы объединить A с пересечением B ∩ C, можно объединить A ∪ B и A ∪ C, а потом найти пересечение этих множеств.
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
Пример. Найдём элементы множества C ∪ (A ∩ B) по диаграмме.
Если множества заданы общим свойством, их пересечение и объединение также можно найти.
Пример.
Пусть R — множество чисел из первой сотни, кратных 30;
D — множество чётных чисел от 85 до 100;
E — множество двузначных чисел, кратных 10.
Найдём элементы множества (R ∪ D) ∩ E.
Решение. Используем свойство дистрибутивности: (R ∪ D) ∩ E = (R ∩ E) ∪ ( D ∩ E).
В пересечении R ∩ E будут числа, которые делятся и на 10, и на 30. Число 30 делится на 10, значит, R ⊆ E, тогда R ∩ E=R.
В пересечении D ∩ E будут двузначные чётные числа от 85 до 100, которые делятся на 10. Такое число одно — 90.
D ∩ E = {90}.
В объединении R ∪ (D ∩ E) будут кратные 30 числа первой сотни или число 90.
Число 90 является одним из кратных 30, значит, R ∪ (D ∩ E) = R.
R = {30, 60, 90}.
И ещё один пример.
Возьмём те же три множества и добавим к ним одно новое:
R — множество чисел из первой сотни, кратных 30;
D — множество чётных чисел от 85 до 100;
E — множество двузначных чисел, кратных 10;
P — множество простых чисел от 70 до 99.
Теперь найдём элементы множества (R ∩ D) ∪ (E ∩ P).
Решение. Тут подойдёт только решение по действиям.
В пересечении R ∩ D будут числа, кратные 30, которые находятся в промежутке от 85 до 100. Это только число 90. R ∩ D = 90.
В пересечении E ∩ P будут простые числа от 70 до 99, которые делятся на 10. Таких чисел нет, значит, E ∩ P = ∅.
При объединении любого множества с пустым получается исходное множество. (R ∩ D) ∪ ∅ =R ∩ D.
Полина Нестеренко
Математика может пугать строгостью формулировок и странными значками. На самом деле, это алфавит, который делает записи понятными для всех, кто его знает. Соседи по лифту — пересечение жителей разных этажей, а пассажиры автобуса — объединение людей, которые сели на разных остановках. Просто нужно переводить свойства на язык примеров, искать их вокруг себя и использовать математику как способ записать это коротко и понятно.
Читать также: