Что представляет собой китайская нейросеть DeepSeek и как она изменила сферу ИИ - Hitecher
Что представляет собой китайская нейросеть DeepSeek и как она изменила сферу ИИ

Что представляет собой китайская нейросеть DeepSeek и как она изменила сферу ИИ

написал James B. Hutcherson

В начале 2025 года индустрию искусственного интеллекта и нейросетей поразило неожиданное появление чат-бота DeepSeek от одноимённой китайской компании.

В начале 2025 года индустрию искусственного интеллекта и нейросетей поразило неожиданное появление чат-бота DeepSeek от одноимённой китайской компании.

Ещё несколько месяцев назад лидерские позиции в области инновационных разработок и ИИ оставались за американской научно-исследовательской организацией OpenAl, но сейчас ситуация стремительно меняется. Языковая модель от DeepSeek предоставляет пользователям те же функции, что и привычный нам ChatGPT, при этом совершенно бесплатно. Выясним подробнее, в чём ещё преимущества DeepSeek, каковы особенности новой нейронки и есть ли отличия от моделей OpenAI.

Кто придумал DeepSeek и сколько это стоило

До января 2025 года о DeepSeek мало кто слышал — разработки китайской компании вызывали интерес только настоящих энтузиастов индустрии. Хотя компания DeepSeek, занимающаяся исследованиями в области ИИ, была основана в городе Ханчжоу ещё в 2023 году. А один из её основателей — Лян Вэньфэн — занимался инновационными разработками и созданием экспериментальных моделей ещё с 2015 года. Вместе с другими выпускниками Чжэцзянского университета он основал хедж-фонд High-Flyer, который применял машинное обучение для исследования фондового рынка, покупки и продажи акций. Вскоре появилась и дочерняя компании High-Flyer AI, занимающаяся исключительно разработкой нейросетей. Её в 2023 году переименовали в DeepSeek. Эта же организация финансировала и создание DeepSeek-R1 — большой языковой модели с открытым исходным кодом, которая может быть применима во всех сферах деятельности, а не только финансовом секторе. 

Ещё до нашумевшей модели DeepSeek-R1, компания разработала модель DeepSeek Coder, которая предназначена исключительно для написания и доработки кода. Среди других разработок DeepSeek также популярна нейросеть DeepSeek-Math для решения математических задач. Но с появлением DeepSeek-R1 эти нейронки перестали быть такими востребованными, поскольку новая модель включается в себя все возможности DeepSeek-Coder, DeepSeek-Math и другие функции того же ChatGPT от OpenAI. При этом, на разработку новой версии DeepSeek ушло всего лишь 55 дней и не более 5,6 миллиона долларов. Согласно предварительным оценкам, создание и обучение модели GPT-4, то есть прямого конкурента DeepSeek, обошлось в 100 миллионов долларов. Согласитесь, разница впечатляющая. Пока исследователи пытаются выяснить, как такое возможно, давайте разберёмся в функциях новой нейросети. 

Функционал  DeepSeek

На самом деле, возможности нового китайского ИИ практически такие же, как и у его главного конкурента — ChatGPT. Иными словами, DeepSeek умеет работать с текстами в самых разных форматах, например, генерировать их с нуля, редактировать, вычитывать и исправлять ошибки, дополнять информацией, при этом сохранять единый стиль. Нейросеть без труда напишет по заданным критериям статью, эссе, письмо и даже стихотворение.  

Новый ИИ также способен быстро искать данные, перепроверять их и предоставлять только те, которые соответствуют действительности. DeepSeek умеет работать и с большими данными — анализировать их, структурировать и систематизировать по нескольким классификациям, интерпретировать информацию. 

Кроме того, с нейросетью можно и просто поболтать — DeepSeek способен просто объяснять сложные для понимания темы, помогать в изучении иностранного языка, быстро находить информацию, а ещё давать советы и полезные рекомендации, например, о том, какой фильм вам понравится, какую книгу стоит прочитать или какого исполнителя послушать. Удивительно, но с помощью DeepSeek можно без проблем планировать путешествия и всевозможные поездки. Достаточно описать свои пожелания и уточнить бюджет, на который рассчитываете, а нейросеть подберёт несколько вариантов, которые вам точно понравятся!

ИИ также можно использовать для написания кодов с нуля, их доработки, исправления погрешностей и неточностей. При этом, если у DeepSeek спросить подробнее о допущенной ошибке, нейросеть объяснит, почему в данном случае что-то не работает, как ещё это можно исправить и в дальнейшем не допускать подобного. 

Ещё одна важнейшая функция — DeepThink. Она заключается в том, что нейросеть думает поэтапно, то есть сначала принимает и обрабатывает, анализирует поступивший запрос, далее продумывает свой ответ, разрабатывает его структуру, выискивает и исправлять недочёты, а только потом выдаёт пользователю результат. Интересно, что расшифровка “мыслительного” процесса чат-бота доступна, её можно использовать в случае, если DeepSeek всё-таки допустил ошибку. Тем не менее, настройка DeepThink существенно повышает качество ответов, а время, в течение которого нейросеть ищет, обрабатывает и структурирует информацию, остаётся прежним.

Чат-бот работает не только с текстовыми запросами пользователей и с документами. Хотя такой режим достаточно ограничен, но возможна загрузка документов и изображений для распознавания информации. Например, если инструкция на иностранном языке вызывает затруднения, можно без проблем загрузить её в нейросеть и получить ответы на все вопросы. 

Одна из немногих функций, недоступная в DeepSeek-R1, — это генерация картинок. Нейросеть быстро придумывает идеи и описывает изображения, но создавать их не может, поскольку считается, прежде всего, языковой моделью. Так, она может написать точный промпт, чтобы другой ИИ сгенерировал вам визуальный ряд. Это возможно, например, в Janus-Pro — это ещё одна модель от компании DeepSeek, предназначенная специально для быстрого распознавания картинок и их генерации. 

Как работать с DeepSeek

Интересно, что все разработки по DeepSeek можно найти в свободном доступе, поскольку модель основана на ПО, распространяемом с открытым исходным кодом. Это значит, что все исследователи, энтузиасты индустрии и просто любители могут наглядно убедиться в том, как работает новая нейросеть. Кроме того, все перечисленные выше функции абсолютно бесплатны. 

DeepSeek можно скачать как на телефон, так и ограничиться работой в браузерной версии. В приложениях App Store и Google Play нейросеть появилась в середине января и сразу поставила всех на уши, оказавшись в топе загрузок в Америке, а потом и других странах. 

Для доступа к веб-версии достаточно лишь перейти на официальный сайт, нажать кнопку start и авторизироваться (это совершенно бесплатно и доступно во всех странах мира). Не беспокойтесь также и о том, что сайт доступен только на двух языках — английском и китайском. Сама нейросеть понимает множество языков, на вопрос об этом DeepSeek отвечает: “Я понимаю и могу общаться на множестве языков, включая, но не ограничиваясь: английский, испанский, французский, немецкий, русский, японский, арабский, португальский, итальянский и многие другие”. 

Интерфейс DeepSeek очень прост и аналогичен другим подобным чат-ботам — большую часть экрана занимает диалоговое окно и поле для ввода запросов. Там же есть и две дополнительные кнопки — DeepThink и Search. Нажимая первую, вы получите не только информацию на заданный вопрос, но и полную расшифровку того, как мыслил ИИ прежде чем выдать вам информацию. Иными словами, вы подробно узнаете о ходе его рассуждений. Вторая кнопка — Search — предполагает использование больших источников информации, их анализ и сопоставление. Качество ответов у DeepSeek особенно высоко, однако на это может уйти около 10-20 секунд.

Для различных задач в DeepSeek можно создавать несколько чатов и без проблем перемещаться между ними. Для удобства их можно переименовывать, а те, которые уже не понадобятся, удалять. 

Кроме веб-версии и приложения DeepSeek можно использовать и локально с помощью специальных фреймворков, например, Ollama для запуска и управления большими языковыми моделями. Это обеспечит загрузку и интеграцию в систему выбранной языковой модели, а также доступ к ней через API. Но для этого понадобится специальное оборудование, поскольку нейросетью с огромным количеством параметров и настроек просто невозможно будет запустить на обычном ноутбуке или компьютере. Потребуется много оперативной памяти и мощная видеокарта. 

Как DeepSeek повлияла на индустрию

Популярность и мгновенный успех китайской нейросети спровоцировал падение акций американских компаний в области разработок. Например, серьёзно пострадал NVIDIA — ведущий мировой производитель графических процессоров. Технологическая компания потеряла около 500 млрд долларов капитализации. На фоне успеха китайского стартапа её акции подешевели более, чем на 15%. Общее сокращение капитализации американских технологический гигантов, таких как NVIDIA, эксперты оценивают в более чем триллион долларов. 

В Европе, в свою очередь, существенно упали акции компании-поставщика оборудования для IT-индустрии и разработки ИИ Siemens Energy AG — почти на 20%. Также снизились стоимости акций ASML, ASM International, STMicroelectronics и других.

Тем не менее, появление DeepSeek называют настоящим прорывом в индустрии. Особенно с учётом того, во сколько обошлось обучение новой модели. Это стало возможным в условиях санкций США, которые запрещают продажу чипов Китаю, что побуждает компании, такие как DeepSeek например, искать и с успехом находить более эффективные и менее затратные решения. Однако такая низкая стоимость разработки ИИ, как у DeepSeek, заставляет усомниться в эффективности многомиллиардных инвестиций во всю индустрию инновационных разработок. Так, DeepSeek, используя более доступные и эффективные решения, использует уникальные подходы к обработке данных, требует существенно меньше вычислительных ресурсов и по праву становится угрозой для моделей OpenAI. Ведущие эксперты считают, что такие открытые модели, как DeepSeek-R1 способствуют активному развитию отрасли и делают нейросети более доступными для простых пользователей. 

Поделитесь этим с друзьями!

Будьте первым, кто оставит комментарий