21 февраля 2025

eur = 94.08 -1.59 (-1.66 %)

btc = 97 180.00$ - 752.68 (-0.77 %)

eth = 2 668.38$ -64.96 (-2.38 %)

ton = 3.65$ 0.06 (1.54 %)

usd = 90.43 -0.91 (-1.00 %)

eur = 94.08 -1.59 (-1.66 %)

btc = 97 180.00$ - 752.68 (-0.77 %)

Форум

«Умный до жути»: Как пользоваться Grok 3 и чем он смог удивить

7 минут на чтение
«Умный до жути»: Как пользоваться Grok 3 и чем он смог удивитьКак видит новость Kandinsky

Grok — это чат-бот, основанный на технологиях искусственного интеллекта, разработанный компанией xAI под руководством Илона Маска. Впервые он был представлен в ноябре 2023 года и сразу же интегрировался с платформой X (ранее Twitter).

Особенность Grok заключается в его остроумном и саркастическом стиле ответов, а также в способности предоставлять актуальную информацию в режиме реального времени за счёт доступа к данным из X.

Значимость Grok 3

С момента дебюта сервис неоднократно подвергался обновлениям. Уже в марте 2024 года появилась версия Grok-1.5, которая продемонстрировала улучшенные способности к логическому рассуждению и увеличила контекстную длину до 128 000 токенов. Летом того же года, в августе 2024, вышла версия Grok-2 с возможностью генерации изображений, а в декабре 2024 компания xAI представила модель Aurora, обеспечивающую фотореалистичную генерацию графики.

Наконец, 18 февраля 2025 года Илон Маск представил третью версию чат-бота — Grok 3, назвав её «самым умным ИИ на Земле», а также «умным до жути».

Для обучения новой модели были задействованы вычислительные мощности, в 10 раз превышающие возможности её предшественника, что позволило значительно повысить точность анализа и глубину обработки данных.

Grok 3 является третьим поколением семейства ИИ-моделей от xAI и создан в ответ на разработки таких систем, как GPT-4o от OpenAI и Gemini от Google. Новинка привлекла большое внимание в индустрии: усовершенствованные алгоритмы, увеличение объёмов обучающих данных, возможность анализа изображений и интеграция ряда функций в социальной сети X делают Grok 3 выдающимся продуктом.

Grok 3 на порядок мощнее Grok-2. Это максимально правдивый ИИ, даже если эта правда иногда расходится с политически корректной, — отметил Маск во время презентации.

Технические возможности

Следует подчеркнуть, что Grok 3 — это не единичное решение, а целый ряд нейросетей, адаптированных для различных сценариев использования.

  • Grok 3;
  • Grok 3 Mini;
  • Grok 3 Reasoning;
  • Grok 3 Mini Reasoning.

Grok 3 Mini может отвечать на вопросы быстрее за счёт некоторой потери точности и, следовательно, дешевизны использования. Пока доступны не все модели и связанные с ними функции Grok 3, некоторые находятся в бета-версии, но они должны постепенно запуститься в течение недели.

Grok 3 Reasoning и Grok 3 Mini Reasoning могут тщательно «обдумывать» проблемы, аналогично «рассуждающим» моделям, таким как o3-mini от OpenAI, R-1 от DeepSeek и Gemini-2 Flash Thinking.

Например, версия Grok-3 mini Reasoning разработана для быстрой обработки запросов, хотя за это приходится немного уступать точностью. Некоторые функции новой модели пока остаются в режиме бета-тестирования, но их активное развёртывание, по словам самого Маска, должно закончится в течение нескольких дней.

Тест AIME

Компания xAI уверяет, что Grok 3 демонстрирует выдающиеся результаты в сравнительных тестах, опережая, в частности, GPT-4o. В тесте AIME, оценивающем математические способности, и в GPQA, измеряющем уровень знаний в области естественных наук на уровне кандидатских диссертаций, новая модель показала превосходные результаты. Более того, предварительная версия Grok 3 заняла высокие места на платформе Chatbot Arena (LMSYS), где пользователи оценивают качество ответов различных ИИ.

Grok 3 обошёл такие системы, как GPT-4o от OpenAI, Google Gemini, DeepSeek V3 и Anthropic Claude. Разработчики сделали особый акцент на способности нейросети к глубокому рассуждению, благодаря чему её ответы стали точнее и логичнее.

Особое внимание заслуживают специализированные модели Grok 3 Reasoning и Grok 3 mini Reasoning, способные проводить глубокий анализ сложных вопросов. По аналогии с «рассуждающими» системами, такими как o3-mini от OpenAI или R1 от китайской компании DeepSeek, эти нейросети не просто выдают ответы, а предварительно проверяют факты, что существенно снижает вероятность ошибок. Согласно данным xAI, Grok 3 Reasoning смог превзойти o3-mini-high в ряде популярных тестов, включая AIME 2025 Performance.

Ключевые особенности

Новая модель была обучена на базе дата-центра в Мемфисе с использованием примерно 200 тысяч графических процессоров, что позволило ей добиться значительного преимущества перед конкурентами.

Сравнение с другими моделями. Grok-3 здесь chocolate

По словам инженеров, Grok 3 демонстрирует элементы самоанализа, что позволяет ей самостоятельно исправлять ошибки. Для сравнения, её предшественница Grok-2 использовала всего 20 тысяч графических процессоров NVIDIA, что делает вычислительные возможности новой модели в десять раз выше. Такая мощность существенно улучшила её способности в генерации контента, логическом анализе и понимании сложного контекста. Как уже отмечалось, Grok 3 Reasoning превзошёл o3-mini-high в ряде известных тестов, включая AIME 2025 Performance.

Тест AIME 2025 Performance

Пользователи могут взаимодействовать с Grok 3 через специальное приложение, которое предлагает два режима работы. Режим «Think» предназначен для стандартных запросов, а режим «Big Brain» — для решения сложных вычислительных и логических задач. Эти функции делают модель оптимальной для научных исследований, математического моделирования и программирования.

Илон Маск отметил, что в приложении Grok часть «мыслительного процесса» ИИ остаётся скрытой, чтобы избежать явного раскрытия логики рассуждений, что противостоит методу дистилляции, используемому конкурентами для извлечения знаний из нейросетей.

Режим «Big Brain» активирует расширенные вычислительные ресурсы, что позволяет добиться ещё большей точности ответов. С помощью этой функции продемонстрировали также ещё одну впечатляющую возможность – способность Grok 3 создавать игры. В деморолике команда показала, как модель создала игру, сочетающую в себе элементы Tetris и Bejeweled (3-в-ряд).

Big Brain

Ещё одной значимой инновацией стал инструмент DeepSearch, построенный на базе «думающих» моделей ИИ. Этот инструмент выполняет интеллектуальный поиск по открытым источникам в интернете и данным социальной сети X, анализируя огромные массивы информации и формируя компактные аналитические отчёты.

DeepSearch 

По возможностям DeepSearch сопоставим с OpenAI Deep Research, но предлагает более интегрированный подход к обработке данных.

Как получить доступ к Grok 3

Доступ к Grok 3 возможен через фирменное приложение X или браузерную версию соцсети.

  • Для этого откройте соцсеть X и перейдите во вкладку «Grok». Либо просто воспользуйтесь этой ссылкой. Бот доступен бесплатно, однако с ограничениями. Для снятия ограничений потребуется подписка Premium+.
  • На мобильных устройствах доступ к Grok возможен через фирменное приложенеие соцсети X.
  • Помимо этого, существует официальный сайт бота, где можно привязать свой аккаунт X. Однако стоит отметить, что данный ресурс недоступен в российском регионе, и для его использования потребуется смена IP-адреса.

Некоторые пользователи могут пользоваться Grok 3 в режиме бета-теста, если вы попадаете в этот список, то система позволит пообщаться с новым ботом бесплатно.

Если нет, то попросит подождать глобального релиза.

С 18 февраля некоторые версии Grok доступны в режиме бета-тестирования. Пользователи могут воспользоваться Grok 3 через подписку X Premium+, которая предоставляет не только доступ к последним функциям, но и увеличенные лимиты использования, а также DeepSearch и расширенные режимы рассуждения, активируемые кнопками Think и Big Brain.

X удваивает стоимость подписки Premium+ после выпуска Grok 3 от xAI
Соцсеть X (бывш. Twitter) Илона Маска удвоила стоимость подписки Premium+.

Что интересно, на фоне релиза Grok 3 подписка X Premium+ подорожала и теперь стоит $40 в месяц (ранее была $22).

Дальнейшие планы

Кроме того, xAI представила новую подписку под названием SuperGrok, аналогичную ChatGPT Pro, ориентированную на энтузиастов, стремящихся опробовать самые передовые функции.

Хотя стоимость этого плана пока не разглашается, ожидается, что она будет существенно выше, учитывая, что OpenAI Pro обходится пользователям примерно в 200 долларов ежемесячно.

Для самой продвинутой версии ИИ Илон Маск рекомендует подождать около недели — к этому времени ожидается интеграция голосового режима. В ближайшем обновлении приложение Grok получит возможность общаться с пользователями посредством синтезированного голоса, что, безусловно, расширит спектр его применения.

В перспективе, через несколько недель, Grok 3 планируется сделать доступным через корпоративный API xAI, что позволит интегрировать возможности DeepSearch в бизнес-процессы компаний. По словам Маска, компания намерена открыть исходный код Grok-2 после окончательной стабилизации работы Grok 3.

Наш подход заключается в том, что мы выкладываем последнюю версию [Grok] в открытый доступ, когда следующая версия полностью готова. Когда Grok 3 станет зрелой и стабильной, что, вероятно, произойдёт в течение нескольких месяцев, тогда мы откроем исходный код Grok-2, — отметил он.

Это означает, что после стабилизации работы Grok 3 разработчики смогут изучать и анализировать исходный код предыдущей модели.

Мнение экспертов

Андрей Карпатый, сооснователь OpenAI и бывший руководитель ИИ-направления в Tesla, поделился в посте на X своим мнением: по его словам, Grok 3 отлично справляется с поиском сложной информации в обучающих материалах, хотя, как и OpenAI o1-pro, испытывает трудности при решении хитроумных партий в крестики-нолики.

В целом впечатление таково, что модель находится на уровне o1-pro и немного опережает DeepSeek‑r1, однако требуются более детальные испытания, — добавил он, будучи одним из первых, кто получил доступ к Grok 3.

Карпатый отметил, что DeepSearch примерно сравним с DeepResearch от Perplexity — это уже неплохо, хотя уступает недавно запущенному OpenAI Deep Research, который выглядит более детализированным и надёжным.

Итан Моллик, профессор Уортонской школы бизнеса Пенсильванского университета, специализирующийся на исследованиях в области ИИ, считает, что, несмотря на стремительный рост xAI, Grok 3 пока не является явным лидером:

Очень достойная модель на передовой, но она не та, ради которой вы бы отказались от своей текущей системы, — написал он в LinkedIn в понедельник.

Моллик добавил, что Grok 3 действительно опережает некоторые модели OpenAI по отдельным метрикам, однако явного преимущества перед o3 она пока не даёт.

Гэри Маркус, основатель Geometric Intelligence и давний скептик относительно шумихи вокруг ИИ, выразил своё сомнение в отношении новинки:

Илон Маск обещал, что Grok 3 станет самым умным ИИ в истории. Спойлер: этого не произошло.

Он охарактеризовал презентацию как повтор предыдущих демонстраций и подчеркнул, что, несмотря на определённый прогресс, революционного скачка по сравнению с моделями OpenAI не наблюдается.

В свою очередь, Карпатый оценил логические возможности Grok 3 более положительно, отметив их как передовые, и подчеркнул, что модель отлично справляется с решением сложных задач в программировании.

Тем не менее нельзя не отрицать, что Маск успешно присоединился к «гонке вооружений» ИИ. Поэтому следует уделить внимание его дальнейшим инициативам.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
eacff85c-04a0-4864-8f90-55c7ea9ad5d0-изображение-0

GigaChat Max: коротко о главном

Инсайдер Microsoft намекнул на скорый релиз GPT-4.5 и GPT-5

Полная версия 
da5f8801-4bc2-442f-b917-173f7f116c6a-изображение-0

GigaChat Max: коротко о главном

HP уличили в намеренном увеличении ожидания на горячей линии до 15 минут

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 315
X5 Tech
Газпромбанк
МТС
Т-Банк
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131