Кодик кратко объясняет суть статьи
Google представила новую флагманскую модель Gemini 3.1, которая в тесте ARC-AGI-2 на решение логических задач показала 77,1% — значительно выше среднего человеческого результата (60%) и предыдущей версии Gemini 3 Pro (31,1%). Модель лидирует в большинстве бенчмарков, превосходя Sonnet 4.6, Opus 4.6 и GPT-5.2. Она демонстрирует высокие результаты в научных знаниях (GPQA Diamond — 94,3%), мультиязычных задачах (MMMLU — 92,6%) и агентском программировании (SWE-Bench Verified — 80,6%). Gemini 3.1 доступна в режиме предварительного просмотра через API, Google AI Studio, Vertex AI и Antigravity, а также для подписчиков Pro и Ultra — в приложении Gemini и NotebookLM. Google позиционирует модель как «базовый интеллект» для анализа данных, визуализаций и творческих проектов.
Читайте в Telegram
|
Google официально представила свою новую флагманскую модель Gemini 3.1 — об этом компания рассказала в своём блоге.
В бенчмарке ARC-AGI-2, оценивающем решение незнакомых логических задач, нейросеть набрала верифицированные 77,1%. Это заметно выше среднего человеческого результата, который составляет около 60%.

У предыдущей версии Gemini 3 Pro, вышедшей в ноябре, этот показатель был равен 31,1%. Таким образом, компания добилась роста более чем в 2,5 раза в абстрактном мышлении всего за три месяца.
Согласно опубликованным данным, новинка лидирует в большинстве тестов, обходя такие модели, как Sonnet 4.6, Opus 4.6 и GPT-5.2. Она показывает лучшие результаты в широком спектре задач.
В тесте на научные знания уровня PhD (GPQA Diamond) модель достигла 94,3%, а в мультиязычном тесте MMMLU — 92,6%. В задачах по агентскому программированию (SWE-Bench Verified) результат составил 80,6%.
Сейчас модель доступна в режиме preview через API, Google AI Studio, а также платформы Vertex AI и Antigravity. Подписчики тарифов Pro и Ultra могут воспользоваться ею в приложении Gemini и NotebookLM.
Компания подчёркивает, что 3.1 Pro представляет собой «базовый интеллект». Google рекомендует использовать модель, например, для систематизации большого объёма данных, визуализаций и «творческих проектов».








