30 января 2025

eur = 102.40 0.81 (0.80 %)

btc = 105 483.00$ 3 478.31 (3.41 %)

eth = 3 197.53$ 73.19 (2.34 %)

ton = 4.93$ 0.08 (1.62 %)

usd = 98.01 0.05 (0.05 %)

eur = 102.40 0.81 (0.80 %)

btc = 105 483.00$ 3 478.31 (3.41 %)

Форум

Как пользоваться революционной нейросетью DeepSeek и в чём её феномен

6 минут на чтение
Как пользоваться революционной нейросетью DeepSeek и в чём её феноменКак видит новость Kandinsky

В последние дни китайская нейросеть DeepSeek произвела настоящий фурор в мире технологий, предлагая конкурентные с OpenAI модели, на которые по меркам рынка были потрачены копейки.

Модель DeepSeek-V3 уже успела обойти ChatGPT в рейтингах популярности и заставить американских технологических гигантов усомниться в собственном лидерстве и целесообразном расходе денежных средств. Рассказываем, как ей пользоваться и чем она так выделяется.

Как пользоваться DeepSeek

Модель бесплатно доступна на официальном сайте. DeepSeek не имеет региональных ограничений для России, поэтому ей можно пользоваться без каких-либо обходных путей. Также можно скачать приложение в Google Play и App Store.
  • Перед использованием необходимо создать бесплатный аккаунт: сделать это можно без номера телефона через авторизацию Google или email. Стоит отметить, что иногда на короткие периоды времени регистрация на сайте выключается. По словам компании, её серверы подвергаются массовым DDoS-атакам.
  • Интерфейс приложения копирует дизайн ChatGPT. Доступно две модели — базовая и думающая (DeepThink R1). Базовая модель быстрее отвечает и является аналогом ChatGPT 4o, думающая модель аналогична o1 от OpenAI и использует продвинутые рассуждения, за счёт чего качество её ответов в узкоспециализированных задачах будет выше.
  • Ключевая особенность DeepSeek — это возможность пользоваться думающей моделью бесплатно, ChatGPT же требует для использование o1 платную подписку за $20, при этом имея жёсткие лимиты — всего 25 сообщений в неделю.
  • Также ассистент поддерживает загрузку файлов и работу с ними, чего нет в бесплатной версии ChatGPT.

Лимиты в DeepSeek на данный момент отсутствуют, но могут появиться позже с ростом популярности ассистента. Пока что нейросеть DeepSeek полностью бесплатна, заплатить разве что придётся разработчикам за использование API, которое при этом намного дешевле, чем у OpenAI.

Единственным заметным ограничением остаётся запрет обсуждения тем, которые считаются политически чувствительными в Китае. Однако этот факт мало повлиял на популярность продукта за рубежом — пользователей привлекают низкая стоимость, высокая производительность и возможность использования относительно дешёвых игровых GPU.

Из недостатков также можно отметить отсутствие возможности создавать изображения, однако для этого потребовалось бы разработать отдельную нейросеть с другой архитектурой. Для сравнения, ChatGPT не генерирует картинки сам, он использует для генерации картинок другую нейросеть от OpenAI – DALLE.


Новое имя в мире ИИ

Мобильное приложение AI Assistant от компании DeepSeek за короткий срок стало самым загружаемым бесплатным приложением в американском App Store, опередив ChatGPT от OpenAI. По данным аналитической компании Sensor Tower, стремительный рост популярности начался сразу после релиза 10 января. Разработчики утверждают, что их модель DeepSeek-V3 «возглавляет список наиболее продвинутых open-source моделей и конкурирует с закрытыми разработками мирового уровня».

Архитектура MLA и «гениальное упрощение»

Одним из ключевых факторов, обеспечивших успех DeepSeek, стала новая архитектура Multi-head Latent Attention (MLA). Благодаря ей модель игнорирует до 95% ненужных данных и тем самым уменьшает стоимость обучения на 90%. Результат поражает: DeepSeek смогла обогнать ChatGPT по всем основным бенчмаркам. Серия моделей R1 обучалась математике методом проб и ошибок и достигла уровня GPT-4, оставаясь при этом на 95% дешевле.

Бенчмарк качества ответов

Этот подход вызывает споры в профессиональном сообществе: а стоили ли того вложения в OpenAI, если китайцы смогли сделать подобное дешевле даже в условиях санкций на видеокарты.

Характеристика от DeepSeek

Судя по цифрам и тестам, DeepSeek действительно предлагает эффективное решение, бросающее вызов устоявшимся представлениям о том, каким должен быть процесс обучения ИИ.

Сам глава OpenAI (разработчик ChatGPT) Сэм Альтман поразился китайскому чат-боту:

«DeepSeek-R1 — впечатляющая модель, особенно с точки зрения того, что они [разработчики] смогли сделать за такую цену. Мы, разумеется, выпустим гораздо лучшие модели, а появление нового конкурента действительно воодушевляет!»

Погоня за мощностями оказалась ошибкой

В последнее время компании активно наращивали количество видеокарт NVIDIA в погоне за разработкой лучшего ИИ, однако успех DeepSeek ставит под вопрос надобность в этом и эффективность экспортных ограничений США.

Стартап добился впечатляющих результатов, используя чипы NVIDIA H800, чьи поставки в Китай были запрещены в рамках санкций. На обучение модели было потрачено всего $5,5 млн — сумма, несопоставимо меньшая по сравнению с бюджетами, которые обычно выделяют на подобные задачи крупные компании вроде OpenAI или Meta (признана в России экстремистской). По некоторым данным, OpenAI потратила на ChatGPT-4о около 100 млн.

В DeepSeek подчёркивают, что использованные чипы менее мощные, чем современные продукты NVIDIA, запрещённые к поставкам в Китай. Это вынудило крупных американских игроков ИИ-рынка серьёзно задуматься о том, насколько действенна система ограничений и действительно ли самые передовые компоненты являются решающим фактором для обучения передовых моделей.

DeepSeek был основан чуть больше года назад миллиардером Ляном Вэньфэном, владельцем хедж-фонда, который заинтересовался нейросетями ещё в 2021 году. Вопреки ожиданиям, что ИИ-прорыв в Китае произойдёт благодаря таким гигантам, как ByteDance и Alibaba, именно небольшой стартап смог за короткий срок создать модель, конкурирующую со свежей версией ChatGPT-4o.

Резонанс на рынке

Вскоре после выхода приложений DeepSeek для iOS и Android фондовые рынки отреагировали бурно.

Акции производителей чипов, в том числе Advantest Corp. и NVIDIA, пошли вниз из-за угрозы снижения спроса на дорогие ускорители. Одновременно выросли котировки китайских технологических компаний, так или иначе связанных с DeepSeek, — например, Iflytek.

Появление DeepSeek повлияло и на курсы криптовалют, которые зачастую реагируют на динамику фондового рынка. С точки зрения инвесторов, успех стартапа является мощным стимулом для переоценки стоимости ИИ-компаний и их технологий.

Реакция конкурентов

Президент США Дональд Трамп увидел в успехе китайского чат-бота DeepSeek стимул для США, он призвал американские компании «сосредоточиться на конкуренции для победы». Он также подчеркнул, что США «всегда первые».

«Я читал о Китае и некоторых китайских компаниях, одна из них разработала более быструю и дешёвую модель ИИ. И это хорошо, потому что на неё не нужно тратить много денег. Я расцениваю это как положительный [момент]», — заявил Трамп.

История успеха DeepSeek вызвала особое беспокойство в Кремниевой долине. Марк Цукерберг создал четыре «штаба экстренного реагирования» из инженеров Meta для изучения и анализа новой технологии:

  • Две команды пытаются разобраться, как High-Flyer Capital Management (хедж-фонд, поддерживающий DeepSeek) смог снизить стоимость обучения и работы модели.
  • Остальные исследуют, какие именно данные использовались для обучения DeepSeek и чем полезна архитектура MLA для совершенствования собственной модели Llama.

Директор по инфраструктуре Meta AI Мэтью Олдхэм даже признался, что DeepSeek может превзойти следующую версию Llama, выпуск которой намечен на начало 2025 года.

Тем временем известные инвесторы и специалисты по ИИ также не скрывают своего удивления. Марк Андриссен назвал DeepSeek «одним из самых впечатляющих прорывов в ИИ», а ведущий специалист по ИИ в Meta Ян Лекун считает, что это «огромный вклад в мировое сообщество», особенно учитывая открытый исходный код модели.

Перспективы для малого и среднего бизнеса

Главная интрига для рынка — насколько глобально DeepSeek изменит правила игры в долгосрочной перспективе. Низкая стоимость обработки токенов (кусков текста) обещает значительную экономию для компаний, использующих ИИ в своих продуктах.

Цена API DeepSeek

Например, если стартап обрабатывает 10 тысяч запросов в день, затраты на использование DeepSeek могут оказаться в 10–30 раз ниже, чем при работе через платные API от OpenAI. Освобождённые средства можно перенаправить на развитие бизнеса, улучшение пользовательского опыта или маркетинг. Фактически DeepSeek предлагает новый стандарт доступности технологий ИИ, который особенно ценен для малых и средних компаний, при этом практически не уступая в качестве своему старшему брату в лице OpenAI.

Переоценка будущего в ИИ-отрасли

Результаты DeepSeek опровергли сразу несколько устоявшихся мнений:

  1. Необязательно покупать самое дорогое оборудование, чтобы получить эффективность на уровне лучших западных моделей.
  2. Существуют альтернативы передовым чипам NVIDIA, которые раньше считались безальтернативными для обучения крупных ИИ-моделей.
  3. Китай не так далёк от США в сфере ИИ, как считалось раньше, и способен создавать продукты мирового уровня, несмотря на санкции и экспортные ограничения.

Многие аналитики считают, что дата выхода DeepSeek (20 января) была выбрана неслучайно: именно в этот день Дональд Трамп (во время своей инаугурации) обещал обеспечить США абсолютное лидерство в области ИИ. Теперь же эта дата может стать точкой отчёта новой ИИ-гонки между двумя мировыми державами.

Безусловно, это не означает конец ИИ-бума в США, но указывает на то, что гонка вышла на новый виток. В ближайшее время мы станем свидетелями жёсткой конкуренции, где будут пересматриваться и рыночные стратегии, и представления об «абсолютном лидерстве» в сфере искусственного интеллекта.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
e6287998-d3af-4425-9b77-9a5dcb7532db-изображение-0

GigaChat Max: коротко о главном

Как киберпреступники используют DeepSeek для кражи криптовалюты

Полная версия 
4d1a6ad1-accf-42c4-8b10-456352aba933-изображение-0

GigaChat Max: коротко о главном

Сборы российского кино за рубежом сократились на $1 млн в 2024 году

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 311
X5 Tech
Газпромбанк
МТС
Т-Банк
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131