Какие инструменты и методы освоите

Продвинутый SQL
Pandas
Визуализация данных
Продуктовые метрики
Apache Superset
A/B-тестирование
Статистика
Bootstrap
Каузальный анализ
Scikit-learn
Машинное обучение
Промпт-инжиниринг
DWH
Apache Airflow
ClickHouse
Apache Spark
RAG-ассистенты
Приватность данных
Аргументация
Регулярно обновляем программу, чтобы вы проходили только актуальное
Курс рассчитан на 4, 6 или 7 месяцев, нагрузка — до 15 часов в неделю
2 часа
Бесплатно
Знакомство с курсом
Это бесплатный модуль, чтобы вы освоились на платформе и определились, подходит ли вам курс
  • Метрики
  • Гипотезы
  • Нагрузка
Как устроен курс
Узнаете, что вас ждёт, какая будет нагрузка, кто поможет освоить программу
Формализация задачи
Научитесь декомпозировать задачи, строить гипотезы и формулировать аналитические выводы
Познакомитесь с программой и поймёте, подходит ли вам курс
1
Базовый тариф・1 проект・2 недели
Продвинутый SQL
  • JOIN
  • CTE
  • Оконные функции
  • PostgreSQL
  • EXPLAIN
  • ANALYZE
Сложные JOIN
Освоите выбор типа JOIN для объединения нескольких таблиц. Научитесь писать корректные условия соединения и устранять дубликаты строк.
CTE и вложенные запросы
Познакомитесь с общими табличными выражениями и подзапросами, чтобы структурировать сложные SQL‑запросы и улучшать их читаемость.
Оконные функции
Поймёте, как применять агрегатные оконные функции для накопительных сумм, ранжирования и функций смещения. Сможете настраивать окна.
Оптимизация запросов
Научитесь анализировать план выполнения, выявлять узкие места и использовать индексы для повышения производительности запросов при росте данных.
Сначала построите аналитическую витрину в PostgreSQL с помощью сложных JOIN, CTE и оконных функций, а затем оптимизируете запросы
2
Базовый тариф・1 проект・2 недели
Продвинутый Python для аналитики
  • Pandas
  • NumPy
  • Matplotlib
  • Seaborn
  • Jupyter Notebook
  • Python
Работа с Pandas
Загрузите данные в библиотеку, исследуете, отфильтруете и сгруппируете их. Объедините таблицы и рассчитаете скользящие метрики.
Исследовательский анализ данных (EDA) и их очистка
Визуализируете распределения и зависимости. Найдёте пропуски, дубликаты и выбросы. Обработаете и задокументируете их.
Автоматизация аналитических расчётов
Напишете функции для повторяющихся задач. Организуете код в скрипты. Добавите проверки данных.
Презентация результатов
Структурируете отчёт, оформите графики, сформулируете выводы и рекомендации. Обеспечите воспроизводимость расчётов.
Проведёте полный аналитический цикл на Python: загрузите и очистите данные о продажах, рассчитаете метрики, автоматизируете повторяющиеся расчёты и подготовите отчёт для бизнеса
3
Базовый тариф・1 проект・1 неделя
Стратегическое понимание продукта
  • Дерево метрик
  • Funnel Analysis
  • ICE
  • RICE
  • Python
Построение дерева метрик
Переведёте запрос бизнеса в целевую метрику и разложите её на управляемые подметрики.
Анализ пользовательской воронки
Построите воронку событий. Рассчитаете конверсии, выявите этапы с наибольшими потерями. Оцените их влияние на целевую метрику.
Генерация и приоритизация продуктовых гипотез
Сформулируете проверяемые гипотезы. Приоритизируете их методами ICE/RICE. Оформите выводы в аналитической записке.
Построите дерево метрик, изучите пользовательскую воронку, сформируете продуктовые гипотезы для обоснования бизнес‑решений
4
Базовый тариф・1 проект・2 недели
BI‑инструменты
  • Superset
  • Dashboard Canvas
  • SQL
  • Jinja
Знакомство с Superset
Изучите интерфейс. Сможете загружать данные из CSV, создавать датасеты и строить простые линейные и столбчатые графики.
Продвинутый уровень в Superset
Разработаете дашборд с визуализацией разных типов и интерактивным фильтром по области действия (scoping). Примените настройки и опубликуете дашборд.
Dashboard Canvas
Научитесь формулировать цели дашборда, определять ключевых пользователей, выбирать метрики и срезы по этой методологии. Сможете проектировать макеты и фиксировать решения в Canvas.
Презентация аналитических выводов
Будете представлять результаты анализа в виде презентаций. Потренируетесь отбирать графики, формулировать выводы, оформлять слайды и выступать перед бизнесом.
Спроектируете интерактивный дашборд в Superset для мониторинга бизнес‑показателей, настроите фильтры и подготовите презентацию с выводами
5
Базовый тариф・1 проект・2 недели
Статистика и эксперименты: полный цикл A/B‑тестов
  • A/B- и A/A-тесты
  • Доверительные интервалы
  • Bootstrap
  • CUPED
  • SciPy
  • Линеаризация
  • Стратификация
  • Python
  • Statsmodels
  • Jupyter Notebook
Планирование эксперимента
Поймёте, как формулировать гипотезы, выбирать целевые и контрольные метрики, определять единицу рандомизации, группы и длительность. Рассчитаете MDE, уровень значимости, мощность и размер выборки.
Валидация эксперимента
Изучите A/A‑тесты и sanity‑проверку корректности метрик и сплитования. Разберётесь, как интерпретировать результаты и принимать решение о доверии к эксперименту.
Классические методы оценки эффекта
Проведёте t‑тест. Построите доверительный интервал. Интерпретируете p‑value. Потренируетесь готовить данные в Pandas.
Продвинутые методы оценки эффекта
Изучите Bootstrap, дельта‑метод, линеаризацию, CUPED и стратификацию. Сможете обоснованно выбирать методы для конкретных задач.
Решение и коммуникация
Сопоставите эффект с MDE. Примете решение по дальнейшим действиям. Подготовите бизнес‑отчёт с описанием ограничений и неопределённости.
Пройдёте полный цикл A/B-тестирования — от формулировки гипотезы и расчёта выборки до анализа результатов разными методами
6
Базовый тариф・1 проект・2 недели
Причинно‑следственный анализ (Causal Inference)
  • Diff‑in‑Diff
  • Python
  • Pandas
  • NumPy
  • Statsmodels
  • Linearmodels
  • Jupyter Notebook
Основы каузального анализа
Познакомитесь с ключевыми понятиями: причинность, контрфактуал, смещение. Сможете отличать корреляцию от причинности и понимать, почему наивные сравнения не дают надёжной оценки эффекта.
Проектирование квазиэксперимента для Diff‑in‑Diff
Научитесь формировать группы и периоды при нерандомизированном воздействии. Выделите treatment и контроль. Проверите, нет ли перекрёстного влияния.
Расчёт эффекта методом Diff‑in‑Diff
Поймёте, как вычислять эффект по формуле «разность разностей» и строить доверительные интервалы Bootstrap. Рассчитаете DiD для метрик приложения с помощью Pandas.
Проверка допущения параллельных трендов
Изучите основные способы: визуальный анализ трендов и статистический тест. Построите графики и сделаете вывод о выполнимости допущения.
Интерпретация результатов и обоснование вывода
Сможете превращать оценки в бизнес‑решения: сравнивать с наивной оценкой, переводить эффект в метрики, описывать ограничения. Подготовите отчёт с рекомендациями и обоснованием выбора DiD.
Оцените эффект редизайна мобильного приложения методом Diff‑in‑Diff: создадите группы, проверите параллельные тренды и рассчитаете causal‑эффект с доверительными интервалами
7
Базовый тариф・1 проект・2 недели
Machine Learning для аналитических задач
  • Линейная регрессия
  • Логистическая регрессия
  • Random Forest
  • Gradient Boosting
  • Python
  • Scikit‑learn
  • Jupyter Notebook
Постановка ML‑задачи и выбор метрик
Поймёте, как переводить бизнес‑запрос в задачу машинного обучения — определять её тип и выбирать целевую метрику для бизнес‑цели.
Построение базовых моделей
Научитесь готовить данные: разделять их на train и test, масштабировать признаки, кодировать категории. Построите линейную и логистическую регрессию. Сможете интерпретировать коэффициенты.
Построение сложных моделей
Познакомитесь с деревьями решений и ансамблями — случайным лесом и градиентным бустингом. Поймёте, как обучать модели и настраивать гиперпараметры.
Оценка и сравнение моделей
Рассчитаете метрики на train и test. Выявите переобучение. Сравните модели и выберете лучшую с учётом требований бизнеса.
Интерпретация модели и выводы для бизнеса
Проанализируете важность признаков. Сформулируете ограничения модели. Подготовите отчёт с выводами и рекомендациями.
Построите модель машинного обучения для прогнозирования оттока клиентов — от EDA и подготовки данных до обучения линейной модели и ансамблей, а также оценки её качества
8
Базовый тариф・1 проект・2 недели
Применение ИИ в аналитике
  • LLM
  • Jupyter Notebook
  • Pandas
  • NumPy
  • Matplotlib
  • Seaborn
  • Plotly
  • Requests
  • BeautifulSoup
  • Selenium
Сбор данных
Научитесь писать промпты для генерации кода на сбор данных. Будете запускать сгенерированный код в Jupyter, сохранять данные в CSV или JSON и оценивать их корректность.
Анализ и обработка данных
Проведёте первичный EDA с помощью ИИ. Выявите пропуски и выбросы, сформулируете гипотезы. Сгенерируете код для расчёта метрик.
Визуализация данных
Научитесь выбирать типы графиков с помощью ИИ. Поймёте, как создавать промпты для генерации кода на визуализацию. Построите диаграммы и оцените их качество.
Валидация и доработка кода
Сможете проверять синтаксис и логику кода от ИИ. Будете выявлять ошибки и галлюцинации, исправлять их через уточнение промптов или ручное редактирование.
Аналитические выводы с ИИ
Начнёте уверенно использовать ИИ для оформления выводов и отчётов.
С помощью ИИ соберёте данные из открытых источников, проанализируете и визуализируете их, сформулируете выводы и рекомендации для бизнеса
9
Расширенный и максимальный тарифы・1 проект・2 недели
Хранилища и DWH‑архитектура
  • Diff‑in‑Diff
  • Causal Impact
  • Propensity Score Matching
Хранилище и моделирование данных
Изучите концепцию хранилища данных (DWH). Поймёте различия OLTP и OLAP. Научитесь выделять факты и измерения, определять гранулярность и проектировать схему «звезда» для витрин.
Историчность данных и Slowly Changing Dimensions
Изучите классификацию SCD. Поймёте, зачем хранить историю. Освоите проектирование измерения с SCD Type 2. Узнаете, как выбирать тип под задачу бизнеса.
Слоирование и организация хранилища
Изучите принципы слоирования. Разберётесь, как использовать представления, временные таблицы и различать физические и виртуальные объекты.
Проектирование витрин данных
Определите факты, измерения и гранулярность на основе бизнес‑требований. Спроектируете таблицы фактов и измерений. Реализуете их через SQL с ключами. Создадите представления для агрегации. Оцените их корректность.
Спроектируете и реализуете аналитическую витрину в PostgreSQL по схеме «звезда» с историчностью измерений SCD Type 2
10
Расширенный и максимальный тарифы・1 проект・2 недели
Оркестрация для аналитиков
  • Docker
  • Apache Airflow
  • PostgreSQL
  • SQL
  • Python
Запуск и настройка окружения
Развернёте Docker‑контейнеры с Airflow и PostgreSQL. Настроите подключение к базе. Освоите команды для управления средой.
Проектирование DAG
Сможете создавать Python‑файлы, определять задачи с операторами, зависимости между ними и параметры для автоматизации пайплайнов.
Реализация ETL‑ и ELT‑трансформаций
Узнаете различия между ETL и ELT. Напишете SQL‑запросы для очистки данных и расчёта метрик. Интегрируете их в Airflow через PostgresOperator.
Проверки качества данных
Добавите в DAG автоматические проверки корректности данных. Настроите их выполнение после расчёта витрины. Реализуете механизм падения задачи при ошибках.
Мониторинг, отладка и продакшн‑практика
Освоите запуск DAG, анализ логов и перезапуск после исправлений. Познакомитесь с контрактами данных, SLA и метриками качества для надёжной эксплуатации.
Разработаете ETL‑ и ELT‑пайплайны в Apache Airflow для авторасчёта метрик продаж и активности пользователей с интеграцией PostgreSQL и проверками качества данных
11
Расширенный и максимальный тарифы・1 проект・2 недели
ClickHouse
  • Docker
  • ClickHouse
  • Materialized Views
  • SQL
  • CSV
Подготовка среды
Развернёте ClickHouse в Docker. Освоите подключение через клиент и загрузите данные из CSV. Познакомитесь с колоночным хранением. Создадите таблицу.
Проектирование таблиц
Научитесь выбирать партиции и ключи сортировки для бизнес‑метрик. Сделаете таблицу на MergeTree. Перенесёте в неё данные. Оцените, как структура влияет на производительность.
Оптимизация производительности
Создадите материализованные представления для предрасчёта агрегатов. Напишете запросы с оконными функциями. Сравните скорость их выполнения. Подготовите архитектурное обоснование с учётом ограничений ClickHouse.
Развернёте ClickHouse в Docker, спроектируете таблицы с ключами сортировки и партиционированием, напишете аналитические запросы для расчёта метрик
12
Расширенный и максимальный тарифы・1 проект・2 недели
Data Lake: архитектура и обработка данных
  • Data Lake
  • Apache Spark
  • Parquet
  • CSV
Проектирование Data Lake
Спроектируете структуру с разделением на слои. Поймёте, как организовывать каталоги для разных типов данных, обеспечивая масштабируемость пайплайнов.
Очистка и объединение в Spark
Научитесь загружать CSV в Spark, обрабатывать пропуски, фильтровать аномалии, преобразовывать типы и объединять данные через join для подготовки staging‑слоя.
Расчёт продуктовых метрик
Рассчитаете DAU, выручку и конверсию. Примените группировки и агрегаты Spark для получения ежедневной статистики.
Parquet и партиционирование
Сохраните витрины в формате Parquet с партиционированием по дате. Поймёте, как обосновывать выбор формата и ключа с учётом влияния на производительность и ресурсы.
Создадите Telegram‑бота с семантическим поиском по документам, реализовав RAG‑пайплайн на no‑code‑платформе с векторным поиском
13
Максимальный тариф・1 проект・2 недели
RAG‑боты и автоматизация LLM
  • RAG
  • Семантический поиск
  • LLM
  • Embeddings
  • Векторные БД
  • Telegram Bot API
  • Python‑Telegram‑Bot
  • Промптинг
Архитектура и принципы работы RAG
Познакомитесь с этой концепцией и её компонентами: LLM, эмбеддингами, векторными БД. Узнаете, как паттерн «поиск — затем генерация» повышает точность ответов.
Создание RAG‑ассистента
Освоите low‑code‑платформу для быстрой сборки RAG‑пайплайна. Научитесь загружать документы, настраивать чанкинг, подключать эмбеддинги и LLM. Протестируете ассистента.
Настройка семантического поиска
Подготовите данные: очистите тексты, выберете стратегию чанкинга, модель эмбеддингов и сгенерируете векторы. Настроите параметры поиска и оцените релевантность результатов.
Разработка логики RAG‑ассистента
Спроектируете промпты. Добавите fallback‑сценарии и обработку ошибок. Составите тестовые вопросы и проанализируете качество ответов.
RAG‑ассистент в Telegram
Создадите бота: напишете код на Python и подключите его к RAG‑пайплайну. Настроите обработку длительных запросов и развернёте бота на хостинге.
Создадите телеграм‑бота с семантическим поиском по документам, реализуете RAG‑пайплайн
14
Максимальный тариф・1 проект・1 неделя
Работа с персональными данными (Privacy Сompliance)
  • GDPR
  • Privacy by Design
  • Python
  • Pandas
  • SQL
Privacy Compliance в аналитике
Узнаете, что такое PII, квазиидентификаторы и чувствительные данные. Познакомитесь с ключевыми требованиями GDPR, регуляторными ограничениями и последствиями их нарушения.
Ответственная работа с данными
Изучите принцип минимизации данных. Поймёте, как оценивать риски деанонимизации. Разберёте типовые ошибки при хранении и передаче данных. Узнаете, как их избегать в повседневной работе.
Privacy by Design: проектирование с учётом приватности
Научитесь перепроектировать витрины: исключать избыточные поля, агрегировать данные, применять псевдонимизацию. Разработаете новую структуру, сохранив бизнес‑ценность для маркетинга.
Аудит аналитических витрин на PII
Загрузите данные в Pandas, идентифицируете PII и квазиидентификаторы. Задокументируете результаты. Подготовите заключение с обоснованием изменений.
Проведёте аудит витрины данных пользователей на наличие PII и перепроектируете её по принципам Privacy by Design
15
Максимальный тариф・1 неделя
Софтскилы («мягкие» навыки) аналитика
  • Аргументация решений
  • Коммуникация с бизнесом
  • Управление неопределённостью
  • Навыки презентации
  • Конфликт‑менеджмент
  • Рефлексия
Работа с данными и неопределённостью
Научитесь выявлять источники неопределённости, оценивать trade‑offs, формулировать выводы с учётом ограничений и принимать решения даже при неполноте данных.
Защита методологии и аргументация
Поймёте, как обосновывать выбор методов для разных бизнес-задач и отвечать на типовые вопросы стейкхолдеров. Изучите структуру убедительной аргументации.
Работа с бизнесом и конфликтные ситуации
Отработаете приёмы конструктивного диалога. Поймёте, как защищать свою позицию и искать компромисс в конфликтах.
Защитите свой аналитический проект перед ментором: сформулируете выводы с учётом неопределённости, обоснуете выбор методологии и ответите на вопросы бизнеса
С наставником
Воркшопы для разбора сложных тем
Получите диплом о профессиональной переподготовке
Это официальный документ установленного образца, который принимают работодатели. Образовательная лицензия № Л035‑01298‑77/00185314 от 24 марта 2015 года.
Как устроен курс
Практикум ИИ помогает учиться
Когда в теории что‑то непонятно, нейросеть ответит на вопросы или объяснит материал другими словами. А в конце каждого урока подготовит краткий пересказ о самом главном.
 
Есть оплата через работодателя, свою компанию или ИП.
  •                                        
Подробное сравнение тарифов
Этот курс может оплатить
ваш работодатель
Полностью или разделив оплату с вами,
например 50/50 или 75/25
  • Расскажем всё про курс
  • Сообщим стоимость
  • Ответим на ваши вопросы
  • Подготовим договор и счёт
Чтобы освоить аналитику с нуля, есть отдельный курс
Научитесь писать SQL-запросы, анализировать данные с помощью Python, создавать дашборды в DataLens, рассчитывать бизнес-метрики, формировать гипотезы, подводить итоги A/B-тестов и давать рекомендации бизнесу

Смотреть курс «Аналитик данных»

Если у вас есть вопросы про учёбу, оставьте заявку — мы позвоним

Как планируете учиться?
Отвечаем на вопросы
Каким требованиям нужно соответствовать?
Этот курс для специалистов с опытом в анализе данных. Чтобы его пройти, нужно писать запросы на SQL и работать с библиотекой Pandas на Python. Плюсом будут также базовые знания в продуктовых метриках, воронках и A/B‑тестах.
Кто будет меня учить?
Все наставники — практикующие специалисты: сотрудники Яндекса и других крупных компаний. Программу составляют опытные преподаватели и методисты, а ещё действующие специалисты Яндекса, Школы анализа данных и других лидеров технологической и образовательной индустрий.
Что делать, если я не справлюсь с нагрузкой?
В программе предусмотрены каникулы, во время которых можно отдохнуть или повторить сложные темы.

Если вам нужно больше времени на выполнение проекта, напишите куратору. Он подскажет, как согласовать новый дедлайн.
Если не понравится, я могу вернуть деньги?
Если курс ещё не начался, вернём всю сумму. Если ваш поток уже стартовал, можно сделать частичный возврат — подробности в 7 пункте оферты.
Получу ли я какой-то документ после курса?
Да, для этого нужно закончить курс и успешно выполнить итоговый проект.

Тогда вы получите диплом о профессиональной переподготовке, если у вас есть среднее профессиональное или высшее образование. Если нет, отправим вам сертификат о прохождении курса в электронном виде.

А если не получится пройти курс целиком и выполнить итоговый проект, по запросу выдадим вам электронную справку об обучении — с перечнем модулей, которые вы освоили.
Вы поможете сменить или найти работу?
На этом курсе не предусмотрена помощь с трудоустройством, поскольку он для действующих специалистов, у которых уже есть навыки поиска работы.

Но если у вас появится вопрос о карьерном развитии, обратитесь в нашу службу поддержки — постараемся ответить.
Как можно оплатить?
Банковской картой: внести всю сумму сразу или платить ежемесячно.

Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Обучение будет стоить меньше, если оплатить весь курс сразу.

Через компанию, если она налоговый резидент РФ. Условия для юридических лиц и ИП отличаются — чтобы узнать подробнее, оставьте заявку или уточните у вашего менеджера.
Что такое налоговый вычет на обучение и как его получить?
Налоговый вычет может получить тот, кто работает по трудовому договору и является налоговым резидентом Российской Федерации, то есть 183 дня в году находится на территории страны.

Вот инструкция, которая поможет всё оформить.

Давайте поможем

Мы перезваниваем в течение 30 минут каждый день с 10:00 до 19:00. Если оставите заявку сейчас, то перезвоним уже в рабочее время.

Как планируете учиться?