GigaChat Max кратко объясняет суть статьи
Илон Маск анонсировал новую версию чат-бота Grok-3 от компании xAI, утверждая, что она превосходит предыдущую версию в десять раз. По результатам тестов, модель обошла такие системы, как GPT-4, Claude 3.5 Sonnet, Gemini-2 Pro и DeepSeek-V3 в математике, программировании и научных расчетах. В демонстрационных примерах Grok-3 рассчитала параметры полета на Марс и обратно, а также создала гибридную игру типа «Тетрис» и «Три-в-ряд». Обучение модели проводилось на суперкомпьютере Colossus с использованием 200 тысяч графических процессоров Nvidia H100. Важной функцией стала возможность глубокого анализа интернета (DeepSearch), позволяющая находить точные данные или делать обоснованные прогнозы при недостатке информации. Модель находится на этапе бета-тестирования, голосовой интерфейс временно отключен из-за нестабильности работы.
Илон Маск представил Grok-3 — новую версию чат-бота от xAI, которая, по словам разработчиков, в десять раз умнее Grok-2.
В тестах модель превзошла GPT-4o, Claude 3.5 Sonnet, Gemini-2 Pro и DeepSeek-V3 в областях математики, программирования и научных вычислений.
По словам Маска, Grok-3 обладает развитыми способностями к рассуждению и будет продолжать совершенствоваться. В ходе презентации чат-бот рассчитал окно для полёта на Марс и возвращения на Землю, учитывая все необходимые технические параметры.

Обучение Grok-3 проходило на гигакомпьютере Colossus, использующем 200 000 чипов Nvidia H100.
Одним из ключевых нововведений стал DeepSearch — режим, в котором ИИ анализирует весь доступный интернет для поиска точного и правдивого ответа. Если информации в сети недостаточно, модель формулирует обоснованные предположения, например, прогноз погоды на год вперёд или оптимальную стратегию в новой видеоигре.

Кроме того, Grok-3 может генерировать игры в реальном времени. Во время демонстрации он создал гибрид Тетриса и «Три-в-ряд», что Маск назвал практически игровой ИИ-студией.

В xAI уточнили, что модель рассуждений Grok-3 пока находится на стадии бета-тестирования и продолжает обучение. Также существует облегчённая версия модели, предназначенная для менее ресурсоёмких задач.
Запланированный голосовой режим не был включён в текущую версию, поскольку, по словам разработчиков, он пока не стабилен. Ожидается, что он будет запущен в течение недели.
Читать первым в Telegram-канале «Код Дурова»