Чем занимается инженер машинного обучения

Работает с данными и создаёт на их основе алгоритмы машинного обучения, которые помогают решать прикладные задачи.

Инженерная составляющая подразумевает подготовку и вывод модели в работу, поддержка её качества, улучшение эффективности. ML‑Engineer часто работает в паре со специалистами по Data Science, аналитиками данных и инженерами данных.

Читать больше о профессии

Получите мощный набор навыков и инструментов

DVC
MLflow
Airflow
Optuna
Docker
FastAPI
Yandex.Cloud

И прозрачный карьерный рост

Вот средние зарплаты инженеров машинного обучения

Источник: Хабр Карьера
75 000–160 000 ₽
Junior
160 000–300 000 ₽
Middle
300 000+ ₽
Senior

Будете учиться на нашей платформе, а YandexGPT вам поможет

Когда в теории что-то непонятно, нейросеть объяснит это другими словами. А в конце каждого урока подготовит краткий пересказ о самом главном.

Программа курса

Рассчитана на 4 месяца, учёбе нужно уделять по 15–20 часов в неделю
6 тем・~3 часа
Бесплатно
Как стать ML-инженером
1 модуль — бесплатно, чтобы вы познакомились с ролью инженера машинного обучения и поняли, хотите ли развиваться в этом направлении
  • Переменные и типы
  • Циклы и ветвления
  • Функции
  • Библиотеки
  • Протокол HTTP
Кто такой ML‑инженер
Что это за роль и зачем она нужна, задачи ML‑инженера
Навыки ML‑инженера
Что вы уже знаете и чему нужно научиться для успешной карьеры
Отличия от других профессий
В чём разница между ML‑инженером и специалистом по Data Science, инженером или аналитиком данных, DevOps‑ и MLOps‑инженерами
О курсе
Что вас ждёт в каждом из спринтов, какие рабочие инструменты вы освоите, как будете практиковаться, сколько длится обучение
Пройдёте входное тестирование и поймёте, подходит ли вам курс
2
5 тем・1 проект・3 недели
Разработка пайплайнов подготовки данных и обучения модели
  • DVC
  • AirFlow
  • S3
Подготовка и трансформация данных в Airflow
Знакомство с Airflow, первый DAG, подготовка данных для обучение базовой модели
Создание ML‑модели и настройка DVC‑пайплайна
Автоматизация подготовки данных (ETL) с помощью Airflow, обучение базовой модели, создание и запуск DVC‑пайплайна, версионирование артефактов
Для сервиса Яндекс Недвижимость настроите процесс обучения модели, которая должна помочь остановить отток клиентов
3
6 тем・1 проект・3 недели
Улучшение baseline-модели
  • MLflow
  • Optuna
  • Mlxtend
  • Продвинутый EDA
Контроль за экспериментами
Основные сущности MLflow: Tracking, Projects, Models, Model Registry, развёртывание MLflow, логирование ML‑модели, сохранение окружения, визуализация результатов, методы версионирования модели и контроль изменений, доступ к результатам и артефактам моделей через API
Конструирование признаков: Feature Engineering
Продвинутый EDA (Exploratory Data Analysis), работа с разными типами признаков: ускорение обработки, применение автоматической генерации; отбор наиболее важных признаков, организация обработки данных
Подбор гиперпараметров модели
Cтандартные методы подбора: решётчатый поиск (Grid Search) и случайный поиск (Random Search), байесовский подход; фреймворк Optuna, визуализация процесса подбора гиперпараметров — Optuna и MLflow одновременно
Улучшите качество модели с помощью Feature Engineering и оптимизации гиперпараметров
4
6 тем・1 проект・3 недели
Релиз модели в продакшен
  • Docker
  • FastAPI
  • Yandex.Cloud
  • Uvicorn
  • Prometheus
  • Grafana
Создание микросервиса
Архитектура приложений, использование FastAPI для написания микросервиса на базе ML‑модели, его сборка, отладка и запуск
Контейнеризация микросервиса
Настройка изолированного окружения, использование готовых Docker‑образов и запуск Python‑скриптов, Docker‑файл для запуска, оптимизация разработки и запуска приложений — Docker Compose
Мониторинг ML‑модели
Метрики мониторинга в продакшене, их сбор, хранение (Prometheus Server), аналитика (PromQL) и визуализация в Grafana
Создадите сервис на базе ML‑модели и развернёте его в облачной инфраструктуре
1 неделя
Каникулы
5
7 тем・1 проект・3 недели
Создание рекомендательной системы
  • Uvicorn
  • implicit
  • catboost
  • U2U, I2I, ALS
  • S3
Рекомендательные системы
Принципы и алгоритмы персональных рекомендаций, виды рекомендательных систем, «холодный старт», матрица взаимодействий
Базовые рекомендации
Коллаборативная фильтрация (ALS), контентные рекомендации, валидация рекомендательной системы
Двухстадийный подход
Генерация наборов рекомендаций с помощью разных алгоритмов, ранжирование полученных рекомендаций для отбора лучших из них
Архитектура рекомендательных систем
Типовая архитектура, онлайн‑рекомендации, сервис рекомендаций: ASGI‑сервер Uvicorn на базе фреймворка FastAPI
Разработаете рекомендательную систему для улучшения предсказаний в Яндекс Музыке, оформите сервис и выкатите его в продакшен
6
7 тем・1 проект・3 недели
Создание uplift-модели
  • S/T-learner
  • scikit-uplift
  • X/R-learner
  • uplift-деревья
Uplift-моделирование
Концепция, метрики и методы оценки качества, базовые методы, продвинутые подходы, продакшен
Решите задачу uplift‑моделирования: определитесь с аудиторией и оцените финансовый эффект
7
Самостоятельно・2 недели
Итоговый проект
Подтвердите, что освоили новые навыки, и пройдёте полный цикл работы с моделью: от формирования задачи и сбора данных до разработки модели и выкатки её в продакшен. Теперь без уроков и домашних заданий — всё как в реальной работе.

Вернём деньги за курс, если устроитесь ML-инженером в Яндекс в течение 6 месяцев после выпуска

Мы не можем гарантировать трудоустройство, но подготовим к нему так, чтобы у вас были все шансы

Как и другие кандидаты, вы пройдёте несколько этапов собеседований в Яндекс — и в случае успеха получите полную компенсацию за обучение

Подробнее об акции

Этот курс может оплатить
ваш работодатель
Полностью или разделив оплату с вами,
например 50/50 или 75/25
  • Расскажем всё про курс
  • Поделимся презентацией
  • Ответим на ваши вопросы
  • Подготовим договор и счёт

Отвечаем на вопросы

Каким требованиям нужно соответствовать?
Курс рассчитан на специалистов, у которых уже есть начальный опыт в области машинного обучения. Мы ожидаем, что вы уже:
• Знаете язык программирования Python: базовые навыки, Jupyter Notebook, библиотеки Pandas и другие.
• Знаете SQL: базовые запросы и предобработку данных внутри запроса.
• Умеете работать с данными: разбираетесь в подготовке, чистке, описательной статистике.
• Знакомы с принципами классического машинного обучения: выбором алгоритма для модели и её обучением.
Что делать, если я не справлюсь с нагрузкой?
В программе предусмотрены каникулы, во время которых можно отдохнуть или повторить сложные темы.

Если случилось непредвиденное или понадобилось больше времени на закрепление материала, напишите своему куратору. Он поможет перенести дедлайн сдачи проекта или перевестись в более поздний поток. На общую стоимость курса это не повлияет.
Если не понравится, я могу вернуть деньги?
Конечно. Если поток ещё не стартовал, вернём всю сумму. Если учёба уже началась, придётся оплатить прошедшие дни со старта вашего первого потока — но мы вернём деньги за остаток курса. Более подробно рассказываем об этом в 7 пункте оферты.
Получу ли я какой-то документ после курса?
Если у вас есть среднее профессиональное или высшее образование, после курса вы получите диплом о профессиональной переподготовке.

Если нет, выдадим сертификат о прохождении курса и справку об обучении в электронном виде.
Как можно оплатить?
Банковской картой: внести всю сумму сразу или платить ежемесячно.

Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Обучение будет стоить меньше, если оплатить весь курс сразу.

Через компанию: юридические лица — резиденты РФ также могут оплатить обучение в Практикуме. Условия предоставления услуг для юридических лиц могут отличаться — чтобы узнать подробнее, оставьте заявку или уточните у вашего менеджера.
Можно ли оплатить курс за счёт работодателя?
Да, работодатель может оплатить учёбу полностью или разделить оплату с вами: например, поделить сумму 50/50 или 75/25.

Такая оплата пройдёт по счёту или двустороннему договору, а ИП могут оплатить с бизнес-счёта. Если работодатель купит обучение сразу 10 сотрудникам или больше, сделаем скидку 10%.

Условия предоставления услуг для юридических лиц могут отличаться — чтобы узнать подробнее, оставьте заявку или уточните у вашего менеджера.
Что такое налоговый вычет на обучение и как его получить?
Налоговый вычет может оформить тот, кто работает по трудовому договору и является налоговым резидентом Российской Федерации, то есть 183 дня в году находится на территории страны.

Заявление на налоговый вычет нужно подать через личный кабинет на сайте nalog.ru (в него можно войти через аккаунт на Госуслугах).

К заявлению нужно приложить:
  • Справку 2-НДФЛ от работодателя.
  • Договор на обучение, в вашем случае это оферта Практикума.
  • Лицензию на образовательную деятельность. Вот наша.
  • Чек об оплате обучения. Мы отправляем его на электронную почту. Если не найдёте чек у себя в почте, напишите в чат службы поддержки — вышлем копию.
  • Справку о получении образовательных услуг — её тоже нужно запросить в чате поддержки.
Подробнее о налоговом вычете — на сайте Федеральной налоговой службы.

Давайте поможем

Напишите, как вас зовут и по какому номеру можно связываться — позвоним и расскажем всё про курсы