Ближайший старт — 15 января, 19 февраля и 26 марта
AI
Освоите ИИ
для работы
и жизни
32 000
профессионалов
уже повысили
свой уровень
86%
студентов используют знания в работе
Программа 2025 года: лучшие практики, инструменты и технологии
Детекция, сегментация, генерация изображений и мультимодальные модели
Архитектуры, loss‑функции, метрики, принципы повышения качества
Глубокое погружение в принципы работы моделей
4 проекта в портфолио и практика на реальных бизнес‑задачах
Удостоверение о повышении квалификации
Computer Vision позволяет нейросетям анализировать изображения и видео
Благодаря этому ИИ может «видеть» и действовать на основе визуальных данных
Это особенно полезно в медицинской диагностике, производстве беспилотного транспорта, систем наблюдения и распознавания лиц и во многих других сферах
Курс подойдёт тем, у кого есть опыт работы с данными, Machine Learning и Deep Learning
Специалистам в области Data Science
Научитесь строить модели на основе информации из изображений, освоите SOTA‑архитектуры и сможете применять CV для решения бизнес‑задач
DL- и ML‑инженерам
Разберёте способы работы с визуальными данными, изучите продвинутые архитектуры и узнаете на практике, как применять CV в ваших проектах
Разработчикам
Поймёте принципы обработки визуальных данных, научитесь применять OpenCV и TensorFlow, сможете интегрировать CV в разработку
Если у вас нет базы в DL, посмотрите курс «Инженер по глубокому обучению нейросетей»
Сначала научитесь работать на фреймоворке PyTorch, строить и обучать нейросети, подготавливать данные, а потом сможете выбрать специализацию — в том числе CV
Узнаете, как организован курс: из чего состоит программа, как устроена платформа, какие активности вас ждут
Введение в нейросети и их роль в решении сложных задач
Поймёте, в каких областях применяются нейросети и какие задачи они решают в реальной жизни
Работа с текстами
Классифицируете тексты с использованием предобученной модели
Работа с изображениями
Классифицируете изображения с помощью предобученной модели
Нейросети на практике
Научитесь использовать нейросети в повседневной практике и для решения профессиональных задач
Научитесь использовать предобученные модели для анализа текста и изображений и интерпретировать результаты их работы
1
1 проект・2 недели
Детекция объектов
PyTorch
YOLO
Faster R-CNN
SSD
TorchVision
Введение и быстрый старт с YOLOv8
Задача детекции объектов. Предсказания модели: координаты, класс, уверенность. Эволюция от YOLO до YOLOv8 (Backbone, Neck, Detection Head). Запуск предобученной YOLO‑модели на изображениях. Интерпретация результатов: рамки, метки, уверенность.
YOLO‑модель: подготовка данных и обучение
Форматы данных и их конвертация. Аугментация данных и её влияние на разметку. Loss‑функции и метрики для детекции. Разметка данных, конфигурации обучения и управление им по логам от модели.
Постобработка и визуализация результатов
Фильтрация по порогу уверенности. Non‑Maximum Suppression (NMS). Визуализация предсказаний (Matplotlib/OpenCV). Написание визуализатора результатов. Вывод top‑N‑предсказаний. Визуальное сравнение с ground truth.
Альтернативные архитектуры: SSD и Faster R‑CNN
SSD. Faster R‑CNN: двухэтапная архитектура. Ключевые отличия от YOLO: области применения, время инференса, сложность настройки и обучения. Различия в loss‑функциях.
Решение задачи на альтернативных архитектурах
Использование SSD или Faster R‑CNN. Подготовка данных. Обучение модели на том же наборе данных. Сравнение результатов: по метрикам (mAP, IoU), по скорости, по визуальному качеству.
Создадите высокоточный детектор на кастомном наборе данных
2
1 проект・2 недели
Сегментация изображений
PyTorch
U-Net
DeepLab
TorchVision
MMSegmentation
Введение и быстрый старт с сегментацией
Задача семантической сегментации: отличие от детекции. Карта классов (mask), формат выхода. Быстрый запуск предобученной модели. Визуализация результатов и интерпретация масок. Запуск инференса на изображениях. Отображение маски и соответствующих цветов для классов.
Подготовка данных и обучение модели
Разметка для задачи сегментации. Форматы масок: индексные, PNG, One Hot Encoding. Связь масок и аугментации. Выбор loss‑функции и метрик для модели. Разбор популярных архитектур и конфигурация обучения для них.
Постобработка и улучшение результатов
Softmax/Argmax и получение финальной маски. Morphological operations: opening, closing. CRF как опция. Визуальное сравнение до и после. Постобработка результата модели и эксперименты. Сравнение метрик до и после.
Альтернативные архитектуры
Обзор Encoder‑Decoder‑архитектур. U‑Net. DeepLabv3+: dilated convolutions, ASPP. SegFormer на основе трансформеров. Ключевые различия: строение, подход к масштабам, скорость и качество, области применения. Сравнение U‑Net, DeepLab, SegFormer.
Решение задачи на альтернативных архитектурах
Обучение U-Net, DeepLabv3, SegFormer. Сравнение: по точности, скорости, качеству масок. Обучение альтернативной модели. Визуальное сравнение и по метрикам. Применимость моделей.
Разработаете модели сегментации для решения бизнес‑задачи
3
1 проект・2 недели
Генерация изображений
PyTorch
GAN
VAE
Diffusion
Введение в генерацию изображений
Зачем нужна генерация изображений. Типы генеративных моделей: Autoencoders, GANs, Diffusion Models. Подходы к обучению и генерации. Предобученный VAE и визуализация латентного пространства.
Autoencoder и VAE
Архитектура: Encoder + Decoder. Ограничения обычных AE (неявное моделирование вероятностей). Variational Autoencoder: обучение распределения + sampling. Обучение VAE, генерация и интерполяция, латентное пространство в 2D.
GAN
Архитектура: Generator + Discriminator. Типичные проблемы: mode collapse, нестабильность. Варианты: DCGAN, Conditional GAN, StyleGAN. Обучение DCGAN на простом датасете, визуализация результатов по эпохам.
Диффузионные модели
Denoising Diffusion Probabilistic Models, Stable Diffusion, Imagen, DALL·E. Преимущества и ограничения diffusion‑архитектур. Использование diffusers от Hugging Face. Генерация по текстовому промпту. Замена параметров: guidance scale, steps, seed.
Файн‑тюнинг и кастомизация diffusion‑моделей
Принципы дообучения: Transfer Learning. Технология LoRA. Дообучение Stable Diffusion, сравнение оригинальных и кастомных промптов, визуализация влияния кастомного обучения.
Кастомизируете генеративную сеть под конкретный запрос
4
1 проект・2 недели
Трансформеры и мультимодальные модели
PyTorch
ViT
CLIP
VQA
Введение в Vision Transformers
Ограничения классических CNN. Архитектура ViT: патчи, позиционные эмбеддинги, self‑attention. Преимущества ViT и примеры использования. Загрузка и применение предобученного ViT. Классификация изображений. Визуализация attention maps.
Файн-тюнинг ViT и гибридные трансформеры
Обучение и файн‑тюнинг Vision Transformer. Гибридные модели: архитектурные особенности и преимущества. Сравнение ViT, гибридов и CNN. Советы по обучению и выбору моделей. Эксперименты.
Мультимодальные модели
Модели Vision + Language. Задачи: image captioning, VQA, image‑text retrieval. Архитектуры Encoder‑Decoder, Dual Encoder, Fusion. Обзор датасетов: COCO Captions, VQA, Flickr30k. Модели CLIP для простых визуально‑текстовых задач.
Текстово‑визуальный поиск и описание изображений
Архитектура моделей для генерации описания: BLIP, GIT. Метрики качества captioning. Модель CLIP для текстово‑визуального поиска: принцип работы и применение. Генерация описаний и поиск изображений по тексту с помощью BLIP или GIT.
Визуальные вопросы и ответы
Архитектуры для VQA: multi‑modal fusion, cross‑attention. Задача grounding: локализация объектов по тексту. Обзор моделей: OFA, LXMERT. Flamingo (DeepMind). Использование LXMERT или OFA для VQA‑задач.
Обучите классификационную модель на трансформерной архитектуре
Получите удостоверение о повышении квалификации
Это официальный документ установленного образца, который принимают работодатели. Образовательная лицензия № Л035‑01298‑77/00185314 от 24 марта 2015 года.
Как устроен курс
Наглядная теория на интерактивной платформе
Материалы подготовлены на основе реальных задач, с которыми работают инженеры по обучению нейросетей. Можно заниматься в своём темпе и совмещать с работой.
Очень много практики
За курс сделаете 4 проекта — закрепите новые навыки и пополните портфолио. Работы важно сдавать в срок, чтобы получить подробную обратную связь от опытных инженеров.
Воркшопы с экспертами по расписанию
На них опытные наставники разберут кейсы из различных индустрий и продемонстрируют, как технологии и навыки из курса можно применять для ваших проектов.
Практикум AI помогает учиться
Когда в теории что-то непонятно, нейросеть объяснит это другими словами. А в конце каждого урока подготовит краткий пересказ о самом главном.
2 формата обучения на выбор
С дедлайнами. Модули открываются по расписанию — их важно проходить за определённое время. Проекты тоже нужно сдавать точно в срок.
В своём темпе. Темы и задания открываются по мере прохождения. Можно завершить курс быстрее или продлить обучение на месяц.
Можно вернуть 13% от стоимости курса — поможем оформить нужные документы.
Отвечаем на вопросы
Каким требованиям нужно соответствовать?
Программа рассчитана на специалистов, у которых уже есть опыт работы с нейросетями.
Для успешного обучения на курсе нужны:
Навыки программирования на Python, включая знание ООП.
Опыт в анализе данных, их визуализации и манипулировании ими.
Опыт использования библиотек по работе с изображениями, например OpenCV, PIL.
Базовые знания в линейной алгебре: о матрицах, их свойствах и типовых операциях с ними, таких как сложение, умножение, транспонирование.
Понимание принципов предподготовки текстов.
Базовое понимание принципов работы свёрточных нейросетей.
Представление о работе с DL‑фреймворками, например PyTorch.
Кто будет меня учить?
Все наставники — практикующие специалисты: сотрудники Яндекса и других крупных компаний. Программу составляют опытные преподаватели и методисты, а ещё действующие специалисты Яндекса, Школы анализа данных и других лидеров технологической и образовательной индустрий.
Что делать, если я не справлюсь с нагрузкой?
Если случилось непредвиденное или понадобилось уделить больше времени закреплению материала, напишите своему куратору. Он поможет перенести дедлайн сдачи проекта или перевестись в более поздний поток. На общую стоимость курса это не повлияет.
Обучение в своём темпе — это как?
Этот курс можно пройти в одном из двух форматов:
• С дедлайнами. Обучение идёт спринтами, модули открываются по расписанию, а задания нужно выполнять точно в срок.
• В своём темпе. Темы и задания открываются по мере их прохождения. Можно регулировать свою нагрузку и проходить курс быстрее или медленнее. Подробнее об обучении в своём темпе.
Обучение в своём темпе подойдёт тем, кому сложно подстроить свой график под расписание курса. Но важно помнить, что такой формат требует самоконтроля и высокой мотивации. С дедлайнами будет проще поддерживать темп занятий и пройти курс до конца.
Если не понравится, я могу вернуть деньги?
Конечно. Если поток ещё не стартовал, вернём всю сумму. Если учёба уже началась, придётся оплатить прошедшие дни со старта вашего первого потока — но мы вернём деньги за остаток курса. Более подробно рассказываем об этом в 7 пункте оферты.
Получу ли я какой-то документ после курса?
Да, для этого нужно закончить курс и выполнить все 4 проекта.
Тогда вы получите удостоверение о повышении квалификации, если у вас есть среднее профессиональное или высшее образование. Если нет, отправим вам сертификат о прохождении курса в электронном виде.
А если не получится пройти курс целиком и выполнить все 4 проекта, по запросу выдадим вам электронную справку об обучении — с перечнем модулей, которые вы освоили.
Вы поможете сменить или найти работу?
На этом курсе не предусмотрена помощь с трудоустройством, поскольку он для действующих специалистов, у которых уже есть навыки поиска работы.
Но если у вас появится вопрос о карьерном развитии, обратитесь в нашу службу поддержки — постараемся ответить.
Как можно оплатить?
Банковской картой: внести всю сумму сразу или платить ежемесячно.
Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Обучение будет стоить меньше, если оплатить весь курс сразу.
Через компанию, если она налоговый резидент РФ. Условия для юридических лиц и ИП отличаются — чтобы узнать подробнее, оставьте заявку или уточните у вашего менеджера.
Что такое налоговый вычет на обучение и как его получить?
Налоговый вычет может получить тот, кто работает по трудовому договору и является налоговым резидентом Российской Федерации, то есть 183 дня в году находится на территории страны.