Анализ данных  • 28 сентября 2023 • 5 мин чтения

С чего начать изучение анализа данных и где найти идеи для первых проектов

Рассказываем, какие источники использовать при изучении анализа данных, как развиваться в аналитике и сколько можно зарабатывать.

Чем занимается аналитик данных

Вывод нового продукта на рынок, разработка сайта или приложения — на всё это нужны ресурсы, деньги и время. А вдруг это не принесёт необходимого результата? Чтобы не работать вслепую, компания нанимает аналитиков данных. Эти специалисты собирают, обрабатывают, исследуют информацию, проверяют гипотезы, например проводят A/B-тесты. Их выводы помогают бизнесу принимать решения, прогнозировать результат и снижать риски.

Материал по теме:

Чем занимается аналитик данных, почему он всем так нужен
и как освоить эту профессию
Аналитики требуются везде, где необходимо обрабатывать большие объёмы информации и использовать этот анализ для улучшения бизнес-процессов. Например, в банках или маркетинговых агентствах. При этом начинающий специалист может быть не погружён в особенности бизнеса той компании, в которой собирается работать.

Александр Вальд,
старший наставник на курсе «Аналитик данных» в Яндекс Практикуме

Хорошо, если аналитик данных разбирается в сфере, в которой он работает, но в аналитических навыках это преимущества не даёт. В разных сферах будут разные метрики, специализированные инструменты, терминология, контекст и задачи, но ядро везде одинаковое.

С чего начать изучение

Чтобы стать аналитиком данных с нуля, нужно владеть инструментами программирования. С их изучения и стоит начать. Вот некоторые из них:

Python. Язык программирования с простым синтаксисом. Подходит для начинающих разработчиков. Через Python можно подключиться к базам данных и обработать большие объемы информации, систематизировать её и автоматически обновлять. Документация современных инструментов анализа данных написана на английском языке, поэтому владение им на уровне B1 будет хорошим плюсом.

Александр Вальд

Аналитики данных используют Python не так, как программисты, которые пишут код: «упаковывают» его и видят результат, только когда код полностью готов. Аналитики работают в интерактивной среде, где результат виден сразу на всех промежуточных этапах работы.

Jupyter notebook. Работу в приложении Jupyter Notebook можно сравнить с работой с Microsoft Word или даже с общением с ChatGPT. Здесь есть специальные ячейки, в которые аналитик пишет код и сразу получает результат работы этих фрагментов.

Библиотеки Python. Например, Pandas — это набор заранее подготовленных методов и функций, которые позволяют использовать уже созданные и протестированные алгоритмы. Pandas помогает аналитикам группировать данные по определённым признакам, создавать сводные таблицы из нескольких, очищать информацию от дубликатов, выводить определённые значения по фильтрам или уникальности. После такой работы данные удобно визуализировать с помощью других инструментов — например, графиков.

SQL. Это язык запросов, который применяют для работы с базами данных. Главная задача SQL — быстро находить среди большого объёма информации нужную, сортировать её, структурировать и представлять в понятном виде. Чтоб стать аналитиком данных с нуля, важно знать SQL хотя бы на минимальном уровне.

Часто начинающие аналитики не знают, в каком направлении двигаться и какие инструменты для работы освоить. В этом поможет курс «Аналитик данных» — за 7 месяцев студенты научатся анализировать большие объёмы данных, строить гипотезы и под руководством опытных специалистов создадут собственные проекты для портфолио.

Какими источниками пользоваться

Несколько источников, которые помогут новичку в изучении анализа данных:

Бесплатные курсы. Например, от Coursera или Яндекс Практикума — здесь есть обучающие программы, за которые не нужно платить.

Книги. Начать обучение в аналитике данных можно с книг, однако многие из них на английском. Но есть версии учебников на русском — например, «Python и анализ данных» Уэса Маккинни, создателя Pandas.

Статьи. Много статей об анализе данных публикуют в IT-сообществах на Хабре, VC. Почитать про профессию аналитика и инструменты, которыми он пользуется, можно и в блоге Практикума.

Александр Вальд

Можно самостоятельно освоить навыки вроде программирования и SQL, но научиться аналитике данных без погружения в работу почти невозможно. Аналитика — это в первую очередь взаимодействие с людьми и с бизнесом. Python, SQL и прочее — всего лишь инструменты для работы.

Идеи для первых проектов

Проекты, которые аналитик данных создает для своего портфолио бесплатно, называют пет-проектами (pet — англ. «домашний питомец, любимец»). Они могут быть трёх видов:

1. Тренировочные, построенные на открытых данных. Идеи для таких проектов можно почерпнуть на Kaggle — платформе, где собираются специалисты по обработке данных и где для них проводят конкурсы.

Александр Вальд

Существуют открытые базы данных, на которых можно потренироваться. Но надо иметь в виду, что там размещена уже обработанная информация, поэтому проект может получиться неактуальным.

2. Для решения собственной задачи. Аналитик может использовать собственный опыт для создания пет-проекта. Например, проанализировать доходы и расходы своей семьи.

Александр Вальд

Такие проекты больше ценятся, потому что человек всё сделал сам, в том числе сбор данных. Знакомый аналитик, увлекающийся музыкой, исследовал звуковые волны в гитарных педалях. Его потом с руками оторвали в популярный сервис музыки. А студент моего курса — геймер — сделал систему анализа собственной игры, чтобы повышать её эффективность.

3. Для решения задачи внешнего заказчика. Например, можно обратиться к знакомым или в некоммерческие организации (НКО) и попросить предоставить необходимые данные для анализа.

Александр Вальд

Друг захотел открыть новую кофейню. Аналитик может провести исследование: изучить конкурентов, проходимость места, удалённость от других кофейных точек, стоимость аренды помещений и отзывы клиентов.

Публиковать пет-проекты лучше на GitHub — крупнейшем веб-сервисе для хостинга IT-проектов и их совместной разработки. Также можно участвовать в соревнованиях на платформе Kaggle. Проходят они так: ведущий конкурса — обычно это крупная коммерческая организация — готовит данные и описание проблемы, а участники экспериментируют с различными методами и соревнуются друг с другом, чтобы вывести лучшее решение.

От качества пет-проектов часто зависит решение работодателя, нанимать специалиста или отказать ему

Как развиваться в аналитике

Карьера аналитика начинается с позиции джуна или стажёра, потом можно дорасти до мидла или даже сеньора.

Александр Вальд

Бесплатная стажировка подойдёт молодому специалисту, остальным я рекомендую искать полноценную работу джуна в небольшой фирме — это проще, чем попасть на стажировку в крупную компанию. Аналитик не может развиваться вне контекста карьеры. В любом случае придётся отработать джуном 1―2 года, а затем уже перейти на уровень мидл.

Можно развиваться и горизонтально — то есть в разных направлениях профессии: если надоели однообразные задачи, можно перейти в смежную сферу. Вот некоторые из них.

Маркетинговый аналитик
Помогает бизнесу привлечь или удержать клиентов. Исследует данные, связанные с поведением пользователей, например дочитываемость статей или количество кликов, и рекомендует, как лучше продвигать продукт и корректировать маркетинговую стратегию.
Продуктовый аналитик
Занимается развитием продукта — например, мобильного приложения банка. Анализирует взаимодействие пользователей с продуктом, находит проблемы и предлагает решения по улучшению.
BI-аналитик (Business Intelligence аналитик)
Работает с информацией о результатах деятельности компании. Тестирует гипотезы, автоматизирует отчётность, моделирует ситуации, помогая бизнесу принимать правильные решения и снижать риски.
Гейм-аналитик
Анализирует поведение игроков, а затем даёт рекомендации о том, как увеличивать заинтересованность пользователей и прибыльность компании.

Перспективы карьеры

На всех позициях — младшего, продвинутого и старшего специалиста — аналитик данных остаётся исполнителем: получает задачу от заказчика и выполняет её. Более высокие менеджерские позиции мало связаны с аналитикой данных. Руководитель отдела зачастую кодит и анализирует хуже, чем сеньор-специалист. Ему важнее навыки менеджера, чтобы объединить и направить команду, организовать процесс, проговорить цели и задачи.

Александр Вальд

Чтобы подниматься по карьерной лестнице, нужно развивать не только хард- и софтскилы: аналитику часто приходится уточнять запросы от заказчика, и нужно уметь правильно это делать. Например, поступает запрос: «Упал трафик на сайте». Неопытный аналитик сразу начнёт разбираться, а нужно сначала провести интервью: откуда информация, что трафик упал, как упал, насколько, где получить данные и так далее.

По данным «Хабр Карьеры», аналитики данных в среднем получают 155 тыс. рублей. Зарплата зависит и от направления, в котором работает специалист. Так, бизнес-аналитик получает в среднем 168 тыс. рублей, а продуктовый аналитик — 221 тыс. рублей.

Александр Вальд

На поиск работы нужно закладывать 3―4 месяца: отправлять резюме, откликаться, писать сопроводительные письма, рекламировать себя. Можно напрямую позвонить в компанию и спросить, нужны ли аналитики, или познакомиться с кем-то на LinkedIn. При этом нужно параллельно делать пет-проекты. Каждое проваленное тестовое задание или неудачное собеседование — шаг к тому, чтобы найти работу.

Совет эксперта

Александр Вальд

Миссия аналитика данных — помогать бизнесу принимать решения. Хороший аналитик проведёт грамотное интервью с заказчиком, выяснит проблему, разберётся в задаче, отстоит свою точку зрения, как провести анализ, и проведёт его. Аналитик данных, как хороший дипломат, помогает клиентам изучить отчёт и принять решение.
Статью подготовили:
Александр Вальд
Яндекс Практикум
Старший наставник на курсе «Аналитик данных»
Надежда Низамова
Яндекс Практикум
Редактор
Полина Овчинникова
Яндекс Практикум
Иллюстратор

Дайджест блога: ежемесячная подборка лучших статей от редакции

Поделиться
Вакансии, зарплаты, навыки в 2025 году: бесплатный вебинар с экспертами ведущих IT-компаний 28 января в 19:00
Tue Jan 14 2025 22:13:20 GMT+0300 (Moscow Standard Time)