Анализ данных  •  02 марта  2023  •  5 мин чтения

Следить за осями и не только: что нужно знать для грамотной работы с данными

Количество данных в мире постоянно растёт, и взаимодействуют с ними не только IT‑специалисты. Рассказываем, из чего состоит Data Literacy и кому без неё не обойтись.

Что такое Data Literacy

Data Literacy (англ. «информационная грамотность») — это навык, который помогает получать данные и использовать их для решения разных задач. Задачи необязательно должны быть из профессиональных сфер типа Data Science или машинного обучения. Цифровая грамотность пригодится и для привычного взаимодействия с информацией, например чтения новостей или подготовки презентации для совещания.

Специалисты, владеющие этим навыком, понимают, как данные хранятся и в каком виде передаются. Зная возможности и ограничения данных, можно находить в них взаимосвязи и погрешности, принимать решения и убеждать других в правильности этих решений. На курсе «Визуализация данных и введение в BI-инструменты» сможете разобраться в особенностях работы с данными, научитесь строить графики и дашборды.

Зачем нужна дата‑грамотность

Информационная грамотность — обязательный профессиональный навык для аналитиков и программистов. Это так же важно, как и знать, что такое репозиторий и какие есть фреймворки для работы над новым продуктом.

Для специалистов, чья работа напрямую не связана с данными, информационная грамотность — это гибкий навык‎. Например, трафик-менеджеру для карьерного развития нужно не просто уметь настраивать рекламные кампании и выгружать отчёты по ним из систем аналитики, но и находить в отчётах причины успехов и провалов кампаний.

Грамотность при работе с данными нужна не только в цифровых профессиях. Врачу она поможет оценить качество исследований лекарств и диагностических методов, бухгалтеру — не ошибиться в расчётах зарплат и налогов, предпринимателю — понять, о чём говорит заказанный анализ рынка.

Информационная грамотность помогает:

1. Находить и понимать данные.
Состояние рынка, информация о конкурентах, результаты научных исследований, экономические прогнозы, социологические опросы — это данные, которые нужны для решения рабочих и личных задач. Чтобы данные действительно помогали, в первую очередь нужно уметь оценивать их достоверность и корректность. Например, если не знать, как правильно читать графики, можно пропустить полезную информацию или не заметить манипуляцию данными.

Источник: книга Карла Бергстрома и Джевин Уэст «Полный бред! Скептицизм в мире больших данных»

2. Принимать решения на основе данных.
Без информационной грамотности сложно анализировать данные и делать выводы. Например, чтобы понять тенденции развития рынка и использовать их в стратегии развития компании, нужно уметь находить в данных закономерности между разными событиями. Чтобы определить KPIs сотрудников, нужно спрогнозировать выручку компании, а перед этим подсчитать возможные доходы и расходы.

3. Профессионально развиваться.
Навык грамотной работы с данными обязателен для любого менеджера. Например, чтобы презентовать и защищать результаты команды перед руководителями или заказчиками.

В современных компаниях развивают подход Self-Service BI, то есть организуют работу так, чтобы сотрудники разных отделов могли получать и использовать нужные им данные без привлечения аналитиков. Для этого внедряют специальные инструменты для работы с данными — BI-системы, например Yandex DataLens. В таких условиях без дата-грамотности карьерный рост практически невозможен.

BI-системы помогают визуализировать данные. Такую систему можно подключить к любой базе данных, настроить дашборды и доступы к ним для команды. Сотрудники будут видеть только нужные им данные

Компетенции для грамотной работы с данными

Информационная грамотность состоит из набора знаний и навыков:

1. Знание основ математики и статистики.
Нужно на базовом уровне знать основы статистики и математических вычислений, чтобы понимать данные, их интерпретации, видеть намеренные и случайные манипуляции. Например, чтобы читать и понимать экономическую прессу, нужно знать, в чём разница между процентом и процентным пунктом.

На двух картах представлена визуализация одних и тех же данных за 2018 год о смертности в ДТП по регионам. Сверху цветом закодировали абсолютные величины, а снизу — количество жертв на 10 000 человек. Получились разные картины. Источник: «‎Графики, которые убеждают всех»‎

Для объективного сравнения и достоверной визуализации статистические данные нужно нормировать, например приводить к количеству населения или площади.

2. Дата-мышление.
Это умение рассуждать внутри данных ― находить взаимосвязи между данными и реальным миром, формулировать гипотезы, проверять их с помощью других данных и делать выводы. Например, можно найти и подтвердить взаимосвязь между выручкой магазина и погодой, если в дождливые дни его посещают меньше людей.

3. Навык визуализации данных.
Часто данные — это тысячи записей в таблицах. В таком виде с ними трудно работать. Допустим, при планировании маркетинговой стратегии нужно составить портрет целевой аудитории. Информацию о покупателях можно найти в таблицах с данными о заказах через интернет-магазин. Для презентации и защиты стратегии больше подойдут графики, диаграммы и дашборды, а не ссылка на таблицу с большим количеством строк и столбцов.

С помощью визуализации можно передавать основную информацию коллегам и наглядно представлять результаты аналитики на совещаниях. Чтобы не искажать данные, нужно знать правила построения графиков. Например, на графике должны быть понятны оси, подписаны единицы измерения и источник данных, иначе он может только запутать слушателей.

Чтобы наглядно сравнить два показателя, например возраст, можно построить столбиковую диаграмму. Такие диаграммы всегда нужно строить от нуля. Если снизу обрезать часть оси, визуализация создаст неверное впечатление

4. Дата-сторителлинг.
Для того чтобы понятно доносить данные до коллег, заказчиков или читателей, важно уметь создавать из них сообщения и выбирать форматы передачи этих сообщений. От этого зависит, получится ли добиться цели передачи данных: объяснить, убедить или заинтересовать их получателей. Например, навык дата-сторителлинга пригодится, чтобы превратить многостраничный годовой отчёт по всем направлениям работы компании в 10-минутную презентацию для инвесторов.

5. Умение искать ответы.
В работе с данными могут возникать сложности и вопросы. Например, можно часами пытаться открыть файл или не понимать, как объединить данные в одну таблицу, ничего не потеряв. Чувствовать себя комфортно поможет исследовательский навык. Решения проблем можно искать в разных источниках: на профессиональных форумах и в чатах, в научной литературе, у коллег или на курсах.

6. Этика работы с данными.
При работе с данными нужно понимать круг возможных проблем и последствий, которые связаны с безопасностью. Например, нельзя публиковать персональную информацию о пользователях без их согласия. Если при публикации больших датасетов, или наборов данных для анализа или машинного обучения, можно вычислить конкретного человека по косвенным признакам, то информация должна быть зашифрована с помощью специальных алгоритмов.

Совет эксперта

Александр Богачёв
Чтобы разбираться в данных, делать на их основе правильные выводы, грамотно визуализировать и транслировать их, важны совсем не технические навыки. Нужно быть любопытным. Результат, полученный с желанием выяснить, как всё устроено и почему, будет в разы полезнее, чем механический анализ данных с помощью программ.

Статью подготовили:

Александр Богачёв
Яндекс Практикум
Курлид курса «Визуализация данных и введение в BI‑инструменты», преподаватель и автор книги‑бестселлера «Графики, которые убеждают всех‎»
Яндекс Практикум
Редактор

Дайджест блога: ежемесячная подборка лучших статей от редакции

Поделиться
Идеи новогодних подарков от нейросети + промокоды на курсы Практикума и акции от партнеров
Tue Jul 16 2024 18:32:49 GMT+0300 (Moscow Standard Time)