Что такое DeepSeek и на что способна китайская нейросеть
Что такое DeepSeek и на что способна китайская нейросеть
В начале 2025 года китайская компания DeepSeek выпустила нейросеть, которая за пару дней стала одной из самых популярных в мире. Разбираемся, в чём её преимущества и недостатки.
DeepSeek — это продвинутая языковая модель искусственного интеллекта, которая работает на основе нейронных сетей и глубинного обучения. Её архитектура основана на технологии трансформеров. Главная особенность трансформеров — это механизм внимания. Он позволяет модели не только анализировать текущее слово в тексте, но и учитывать его связь с остальными словами в предложении. Например, во фразе «Она взяла яблоко и съела его» модель поймёт, что «его» относится к «яблоку».
DeepSeek по основным функциям уже конкурирует с GPT и другими популярными нейросетями
После выхода DeepSeek упали акции крупных технологических компаний — у NVIDIA, например, на 17,8% за сутки. Причина была в отчёте DeepSeek, который показал, что создание нейросети обошлось значительно дешевле, чем в аналогичных проектах. Компания разработала свою модель искусственного интеллекта с затратами около 6 млн долларов США при использовании всего 2048 чипов NVIDIA. Это намного меньше, чем у западных аналогов, — GPT-4 от OpenAI, где затраты превышают 100 млн долларов.
Китайская компания доказала, что разработка ИИ не требует огромных финансовых вложений и вычислительных ресурсов. Инвесторы стали сомневаться в будущей прибыльности компаний, которые полагаются на дорогостоящую инфраструктуру вроде NVIDIA.
Ещё одна особенность DeepSeek, которая выделяет нейросеть на фоне остальных, — открытый исходный код. Это значит, что исходные коды и архитектура моделей искусственного интеллекта компании доступны для публичного просмотра, модификации и использования. Разработчики и компании могут улучшать модели и адаптировать их под свои нужды без ограничений.
Разобраться в том, из чего состоят ML-модели и как их обучать, можно на курсе «Инженер машинного обучения». За четыре месяца студенты изучают теорию и разрабатывают три сервиса. В конце они получают диплом о профессиональной переподготовке и гослицензию.
DeepSeek может выполнять разные задачи, но в основном они связаны с генерацией и обработкой текстовых и числовых данных.
В режиме DeepThink можно увидеть, как рассуждает модель
DeepSeek проста в использовании, у неё интуитивно понятный интерфейс и в веб-версии, и в мобильном приложении. Вот как работать с этой нейросетью:
1. Настроить доступ к DeepSeek. В веб-версии нужно перейти на официальный сайт и нажать кнопку «Start Now». Сервис предложит зарегистрироваться — это необходимо, если нужно сохранять историю генерации.
Мобильное приложение DeepSeek доступно для скачивания в AppStore и Google Play. После установки можно войти в систему с помощью электронной почты или аккаунта Google.
2. Начать работу. После входа появится поле для ввода текста, где можно задавать вопросы или вводить команды. Интерфейс в веб-версии по умолчанию на английском языке, но DeepSeek хорошо понимает запросы на русском.
Есть несколько дополнительных режимов работы DeepSeek:
Нейросеть можно использовать в обучении, в решении бытовых вопросов, в работе. Во что может DeepSeek:
Рассмотрим основные преимущества и недостатки использования DeepSeek:
Посмотрим, какие ответы генерирует DeepSeek в разных запросах. Например, попросим её написать короткий рассказ про студента, который пошёл учиться на программиста и построил успешную карьеру.
Нейросеть неплохо справилась с задачей. Чтобы рассказ был интереснее и детальнее, нужно прописывать более подробный промпт
А вот задача посложнее. DeepSeek должна найти ошибки в фрагменте текста. Справилась на отлично.
DeepSeek хорошо понимает русские запросы и даже может анализировать тексты на наличие ошибок
Теперь попросим нейросеть составить план питания на день с учётом нескольких особенностей. Нужен завтрак, обед и ужин, нельзя есть жирное, сладкое и мучное, суммарное время на приготовление всех блюд — максимум час.
Нейросеть не просто составила список блюд, но и написала рецепт их приготовления
Ещё одна бытовая задача — посоветовать несколько романтических фильмов, в которых героиня начинает всё заново после неудачных отношений.
Наш запрос был про героиню, но DeepSeek предложила и фильмы, в которых главный герой — мужчина
А вот рабочее задание, которое может получить маркетолог. Нужно придумать несколько слоганов для продвижения услуги — персональных тренировок в фитнес-клубе.
Можно взять идеи DeepSeek и адаптировать их под свои задачи. Либо написать подробный промпт с деталями услуги и особенностями аудитории — тогда и ответы будут более релевантными
Задание по программированию — написать код простого калькулятора на Python:
На написание кода у DeepSeek ушло около 15 секунд
И последнее — логическая задачка. Посмотрим, как DeepSeek будет рассуждать и как в итоге справится с ней. Для этого подключим функцию DeepThink.
В режиме DeepThink можно следить за тем, как рассуждает модель
DeepSeek — одна из самых перспективных нейросетей. Она развивается и конкурирует с ведущими мировыми языковыми моделями. Рассмотрим тенденции и возможные направления её развития.
Совет эксперта
Читать также: