11 августа 2025

eur = 92.88 0.22 (0.23 %)

btc = 121 828.00$ 4 642.20 (3.96 %)

eth = 4 315.48$ 64.95 (1.53 %)

ton = 3.40$ 0.01 (0.38 %)

usd = 79.78 0.39 (0.50 %)

eur = 92.88 0.22 (0.23 %)

btc = 121 828.00$ 4 642.20 (3.96 %)

OpenAI выпустила первые открытые модели со времен GPT-2

1 минута на чтение
OpenAI выпустила первые открытые модели со времен GPT-2Как видит новость Kandinsky

GigaChat Max кратко объясняет суть статьи

OpenAI представила открытую версию своей языковой модели GPT-OSS, доступную по лицензии Apache 2.0. Модель представлена двумя вариантами: на 20 млрд и 120 млрд параметров, обе используют архитектуру Sparse MoE для повышения эффективности вычислений. Младшая версия запускается на обычных видеокартах с 16 ГБ памяти, старшая требует профессиональных ускорителей с 80 ГБ. Поддерживается управление глубиной анализа и вызовы внешних инструментов, однако мультимодальность отсутствует. По результатам тестов, GPT-OSS-120B близка по производительности к GPT-4o и превосходит её в отдельных задачах, при этом младшая версия сохраняет высокий уровень качества при значительно меньших аппаратных затратах.

OpenAI неожиданно выпустила модель с открытыми весами — впервые с момента релиза GPT-2.

Новая разработка под названием GPT-OSS распространяется по лицензии Apache 2.0 и доступна на ollama всем желающим.

GPT-OSS включает два варианта:

  • на 20 миллиардов параметров;
  • на 120 миллиардов.

Обе версии построены по принципу Sparse MoE (Mixture of Experts) — то есть при каждом запросе активируются только нужные части модели, что снижает требования к железу и увеличивает эффективность.

Так, младшая версия сможет запуститься на игровых видеокартах с 16 ГБ видеопамяти, а для старшей потребуется профессиональный ускоритель с 80 ГБ видеопамяти.

OpenAI выпустила первые открытые модели со времен GPT-2

Модель поддерживает цепочку рассуждений, которая может быть прозрачной и управляемой: пользователь сам регулирует глубину анализа и скорость генерации. Также поддерживается вызов инструментов (Python, веб-поиск и др.), как в GPT-4o — но мультимодальности (обработка изображений, аудио) нет.

Что особенно впечатляет, так это результаты в бенчмарках. GPT-OSS-120B приближается по качеству к GPT-4o-mini и даже самой GPT-4o в некоторых задачах, а на AIME 2024 и вовсе показывает лучшую производительность. При этом младшая модель демонстрирует почти такой же уровень, оставаясь при этом гораздо более доступной по ресурсам.

Теги:
Материал обновлен|

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
Bloomberg: Siri научится управлять приложениями

GigaChat Max: коротко о главном

Bloomberg: Siri научится управлять приложениями

Полная версия 
На RuTube появился первый ролик в 8K — с HDR и 50 FPS

GigaChat Max: коротко о главном

На RuTube появился первый ролик в 8K — с HDR и 50 FPS

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 391
X5 Tech
OTP Bank
Газпромбанк
билайн
МТС
Сбер
Т-Банк
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы