YandexGPT — модель искусственного интеллекта, которая генерирует текст на основе запроса человека. Для пользователя это выглядит как диалог с другом в мессенджере.
Модель можно использовать, чтобы создавать контент в маркетинге, рекламе и журналистике или для личных задач. Например, придумать сказку, рецепт блюда или текст письма. Также в YandexGPT есть Алиса — Яндекс стал первой компанией, которая применила подобную модель в голосовом помощнике.
YandexGPT называется так, потому что работает по аналогии с языковой моделью GPT компании Open AI. Её используют в ChatGPT — чат-боте для генерации текста и кода, который запустили в открытый доступ в декабре 2022 года. За первые два месяца работы ботом воспользовались 100 млн человек.
Чтобы YandexGPT мог поддерживать диалог с человеком, его обучали в два этапа:
1. Pretraining
На этом этапе формируется эрудиция модели. Она изучает структуру языка и факты о том, как устроен мир, на датасетах. Это массивы данных, которые собирают разработчики. Если брать все данные подряд, модель выучит в том числе и неверные факты и будет отвечать неправильно. Поэтому данные для датасета сначала собирают из открытых источников, а затем фильтруют, чтобы осталось как можно больше полезных.
2. Fine-tuning
На этом этапе YandexGPT обучали на датасете из сотен тысяч запросов (инстрактов) и ответов на них. Чтобы в набор данных попало как можно больше разнообразных инстрактов, разработчики проанализировали запросы в поиске, обращения к Алисе и собрали примеры запросов коллег внутри компании. Написать качественные ответы на такие запросы — ещё сложнее. Человеку нужно быть либо экспертом в теме, либо уметь быстро в ней разобраться. Затем важно проверить достоверность информации и грамотно сформулировать мысль. Эти навыки есть у AI-тренеров — специалистов с редакторским опытом, которые помогают готовить ответы на запросы для нейросети. AI-тренеры, сотрудники Яндекса и удалённые асессоры (проводят фактчекинг, оценивают и составляют тексты) составили несколько сотен тысяч ответов на инстракты. Около половины из них стали основой для датасета, на котором обучалась YandexGPT.
Если просто показывать модели примеры хорошего поведения, она будет пробовать его воспроизводить, но всё равно может ошибаться. ChatGPT часто фантазирует вместо того, чтобы честно отвечать, что чего-то не знает. Улучшать ответы в моделях GPT получается с помощью человека. Он указывает, какие ответы хороши, а какие — с фактическими ошибками или неуклюже сформулированы. Такая модель обучения называется обучением с подкреплением на основе отзывов (Reinforcement learning from Human Feedback). «В следующих версиях YaGPT планируют добавить этот этап в обучение модели»
Использовать чат-боты с языковыми моделями GPT можно в любом направлении — от аналитики до дизайна и маркетинга. Например, попросить сгенерировать запрос, по которому нейросеть нарисует иллюстрацию для рекламной кампании, или придумать описание для карточки товара. Во многих IT-профессиях широко используют современные нейросети для решения рабочих задач.
YandexGPT постоянно развивается. Вот что уже умеет модель:
Другой способ прочитать краткий пересказ статьи — добавить ссылку на материал на сайт 300ya.ru
✅ Бесплатна и доступна в России «без регистрации и СМС». ChatGPT не работает в России. Чтобы им пользоваться, придётся менять локацию браузера с помощью специальных сервисов или использовать ботов-посредников. Базовый режим YaGPT доступен всем пользователям в браузере Яндекса и в гаджетах с Алисой.
✅ Свежие данные. Нейросеть быстро обучается и использует новейшую информацию.
✅ Помогает экономить время, когда нужно много прочитать. Суть материала в 20—30 тыс. знаков можно понять меньше чем за минуту, если использовать функцию краткого пересказа.
✅ Голосовой интерфейс. Многие уже привыкли, что можно поболтать с Алисой. Такой формат общения придаёт ещё больше человечности диалогу с искусственным интеллектом. Например, детям гораздо интереснее придумать с ней сказку голосом, чем просить об этом в чате.
❌Обучение нейросети может дать непредсказуемые результаты. Например, разработчики специально не учили YandexGPT сочинять стихотворения, но в какой-то момент оказалось, что она может их придумать. Это не минус, а скорее особенность любой нейросети, в которой происходят миллиарды преобразований. С таким количеством процессов проследить, почему модель ведёт себя так, а не иначе, в большинстве случаев невозможно.
❌ Для обучения нейросети нужно больше экспертов в конкретных нишах. Например, AI-тренеры-физики смогут передать ей специальные знания, в которых неподготовленный тренер быстро разобраться не сможет. Чтобы найти и обучить этих людей работать с ИИ, потребуется время.
В основе диалога с нейросетью — те же принципы, что и в общении людей. Чем более детальный запрос, тем лучше будет результат. Разберём несколько задач, в которых поможет YaGPT:
1. Написать план или чек-лист. Можно написать чек-лист, а затем попросить нейросеть предложить свою версию. Так можно выявить пункты, которые не получилось учесть в первой версии.
2. Побороть страх перед чистым листом. Начинать с какой-то основы проще, чем с нуля. Например, чтобы начать писать статью, можно попросить нейросеть написать план, предложить заголовок, добавить тезисов. Даже ошибки в ответе будут поводом погрузиться в тему и найти фактически верную информацию.
3. Помочь школьникам и студентам. Например, объяснить сложный термин простым языком, если в учебнике написано длинно и запутанно. Пересказать книгу или научную статью.
4. Улучшить текст или изменить стилистику. Допустим, нужно научный текст переписать так, чтобы он был понятен аудитории без академического образования. Прозу в стихи YaGPT тоже пробует перевести, хоть и не всегда получается зарифмовать все строки.
Главный вопрос, который волнует учёных и всех, кому интересны большие языковые модели, — смогут ли эти модели дорасти до уровня общего искусственного интеллекта. Это интеллект, который в разы превосходит человеческий. Встретить его пока можно только в фантастических фильмах и книгах.
На этом пути есть две проблемы:
● Языковые модели много знают о мире, но не умеют использовать эти знания, чтобы анализировать факты, критически мыслить и принимать решения. Человек пока выигрывает не только логическим мышлением, но и жизненным опытом, который может использовать для решения проблемы. Чтобы научить такому большую языковую модель, инженерам, которые работают с ИИ, нужно придумать способ оцифровки практических знаний в разных отраслях. Затем эти данные нужно будет собрать в датасеты и обучить на них ИИ. Получатся модели, каждая из которых будет разбираться в каком-то одном направлении и помогать большой языковой модели принимать решения.
● Интернет стал заполняться контентом, сгенерированным ИИ. Некоторые эксперты говорят, что это может привести к коллапсу модели. В такой ситуации ИИ обучается на сгенерированных данных и от этого ещё сильнее начинает ошибаться. В проекты по развитию искусственного интеллекта вкладывают десятки миллиардов долларов. Чтобы сохранять чистоту данных для обучения, придётся вкладывать ещё больше.
Языковые модели только начали развиваться. Пока рано делать выводы, наступит для них «технологическая зима» или новый скачок в развитии. Но если человечество всё же доведёт их до уровня общего искусственного интеллекта, по масштабу это будет сопоставимо с изобретением электричества или опасного оружия.
Читать также: