Суть аналитики в том, чтобы визуализировать данные и делать выводы на их основе. Data Science включает в себя оба эти этапа плюс машинное обучение (англ. Machine Learning) и глубокое обучение (англ. Deep Learning), с помощью которого специалисты строят и запускают модели для прогнозов.
Обе области пытаются предсказать, как данные повлияют на показатели компании, и предложить лучшие гипотезы, как корректировать поведение пользователей, чтобы достичь результатов. Например, какому сегменту клиентов точно стоит отправлять рассылку, какой отклик планируется получить и окупится ли вложенный в это бюджет. Аналитика данных и Data Science являются разными этапами одного процесса.
Главное отличие аналитика данных от специалиста по Data Science в том, что аналитик не владеет навыками машинного обучения, поэтому сам обрабатывает данные. Например, собирает у маркетологов все данные по прошлым рассылкам компании и сегментирует пользователей по возрасту, полу, локации, предпочтениям. Затем выявляет в данных закономерности и влияние параметров друг на друга.
Аналитик занимается ретроанализом, то есть анализом прошлого поведения пользователей, и на его основе ищет связи между эффективностью рассылки и показателями компании, предлагает рекомендации. Для специалиста по Data Science и для аналитика критически важны продвинутые знания доменной области — индустрии, в которой они работают, будь то ретейл, промышленность или финансы.
Аналитика данных и Data Science помогают быстро и правильно принимать решения только при условии, что специалист понимает, как выбор влияет на результаты. Поэтому он должен уметь сочетать инструменты машинного обучения с пониманием причинно-следственных связей, стоящих за данными.
У них разные методы и подходы решения одной задачи — правильно повлиять на менеджерское решение, чтобы увеличить продажи. Например, спрогнозировать сезонный спрос на товары, которые производит клиент. Для этого можно было бы поставить аналитику задачу провести ретроанализ продаж и сделать сезонную кривую. Либо попросить специалиста по Data Science проанализировать частотность запросов в семантическом ядре и произвести другую сезонную кривую.
Эти данные будут отличаться, потому что алгоритм чаще всего находит закономерности лучше, чем человек вручную, и быстрее собирает данные. Результаты работы аналитика и специалиста по Data Science в деталях будут разными: корреляцию, которую нашёл Data Scientist, может не найти аналитик, потому что у него не хватает для этого инструментов.
В зависимости от того, какие данные используются, можно принимать разные решения в бизнесе. Например, юзабилити сайта можно улучшать на основании данных о поведении пользователей, и увеличить средний чек, провоцируя их покупать больше или чаще.
Поэтому аналитику гибкие навыки нужны больше, чем специалисту по Data Science. Например, руководитель ставит задачу проанализировать результаты маркетинговой кампании. Аналитик данных пойдёт к маркетологам, соберёт и обработает их данные, затем сведёт в отчёт и проведёт презентацию перед руководством для принятия решения.
На этапе сбора данных Data Scientist тоже обратится к маркетологам, но потом 60% времени будет занят программированием и работать с данными, а не с людьми.
Эти примеры характерны для маленьких компаний или стартапов. В больших компаниях специалисты по данным работают в кросс-функциональных командах, где есть ML-инженер, Data Scientist и аналитики данных. За глубокими знаниями доменной области Data Scientist сможет обратиться к коллеге-аналитику, а ML-инженер будет следить, чтобы созданный специалистом по Data Science алгоритм работал без ошибок.
Аналитику данных и специалисту по Data Science нужно математическое или техническое образование. Для обоих важны знания доменной области. Различие в том, что у аналитика, который обрабатывает и интерпретирует данные сам, эти знания должны быть глубже. А Data Scientist должен знать языки программирования, чтобы обучать алгоритмы.
Для получения опыта у специалистов по Data Science есть хакатоны и курсы. Для аналитиков — образование и работа в проектах, потому что соревнований, где можно набить руку в решении задач по аналитике данных, немного.
По данным «Хабр Карьеры», средняя зарплата начинающего аналитика — 100 тыс. рублей, мидла — 176 тыс. рублей, сеньора — 289 тыс. рублей, а ведущего аналитика — 349 тыс. рублей. Специалисты по Data Science зарабатывают больше: средняя зарплата специалиста — 210 тыс. рублей, при этом ведущий специалист может зарабатывать 430 тыс. рублей и больше.
Читать также: