26 сентября 2025

eur = 98.15 -0.45 (-0.45 %)

btc = 109 038.00$ -4 278.75 (-3.78 %)

eth = 3 878.64$ - 274.21 (-6.60 %)

ton = 2.66$ -0.16 (-5.54 %)

usd = 83.61 -0.38 (-0.46 %)

eur = 98.15 -0.45 (-0.45 %)

btc = 109 038.00$ -4 278.75 (-3.78 %)

OpenAI выпустила первые открытые модели со времен GPT-2

1 минута на чтение
OpenAI выпустила первые открытые модели со времен GPT-2Как видит новость Kandinsky

ГигаЧат кратко объясняет суть статьи

OpenAI представила открытую версию своей языковой модели GPT-OSS, доступную по лицензии Apache 2.0. Модель представлена двумя вариантами: на 20 млрд и 120 млрд параметров, обе используют архитектуру Sparse MoE для повышения эффективности вычислений. Младшая версия запускается на обычных видеокартах с 16 ГБ памяти, старшая требует профессиональных ускорителей с 80 ГБ. Поддерживается управление глубиной анализа и вызовы внешних инструментов, однако мультимодальность отсутствует. По результатам тестов, GPT-OSS-120B близка по производительности к GPT-4o и превосходит её в отдельных задачах, при этом младшая версия сохраняет высокий уровень качества при значительно меньших аппаратных затратах.

OpenAI неожиданно выпустила модель с открытыми весами — впервые с момента релиза GPT-2.

Новая разработка под названием GPT-OSS распространяется по лицензии Apache 2.0 и доступна на ollama всем желающим.

GPT-OSS включает два варианта:

  • на 20 миллиардов параметров;
  • на 120 миллиардов.

Обе версии построены по принципу Sparse MoE (Mixture of Experts) — то есть при каждом запросе активируются только нужные части модели, что снижает требования к железу и увеличивает эффективность.

Так, младшая версия сможет запуститься на игровых видеокартах с 16 ГБ видеопамяти, а для старшей потребуется профессиональный ускоритель с 80 ГБ видеопамяти.

OpenAI выпустила первые открытые модели со времен GPT-2

Модель поддерживает цепочку рассуждений, которая может быть прозрачной и управляемой: пользователь сам регулирует глубину анализа и скорость генерации. Также поддерживается вызов инструментов (Python, веб-поиск и др.), как в GPT-4o — но мультимодальности (обработка изображений, аудио) нет.

Что особенно впечатляет, так это результаты в бенчмарках. GPT-OSS-120B приближается по качеству к GPT-4o-mini и даже самой GPT-4o в некоторых задачах, а на AIME 2024 и вовсе показывает лучшую производительность. При этом младшая модель демонстрирует почти такой же уровень, оставаясь при этом гораздо более доступной по ресурсам.

Теги:

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Представлен компактный Xiaomi 17 с процессором Snapdragon 8 Elite Gen 5Представлен компактный Xiaomi 17 с процессором Snapdragon 8 Elite Gen 5

ГигаЧат: коротко о главном

Представлен компактный Xiaomi 17 с процессором Snapdragon 8 Elite Gen 5

Полная версия 
T2 запустила сервис оформления международных карт в мобильном приложении

ГигаЧат: коротко о главном

T2 запустила сервис оформления международных карт в мобильном приложении

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Цифра в деле
Цифра в деле
Смотреть
Реклама. ПАО Сбербанк. erid: 2Vtzqv3u7MN
Карьера
Блоги 424
Газпромбанк
МТС
OTP Bank
Т-Банк
X5 Tech
билайн
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы