5 июля 2025

eur = 93.01 -0.12 (-0.13 %)

btc = 108 112.00$ -1 456.24 (-1.33 %)

eth = 2 515.10$ -78.06 (-3.01 %)

ton = 2.75$ -0.07 (-2.57 %)

usd = 78.84 0.05 (0.07 %)

eur = 93.01 -0.12 (-0.13 %)

btc = 108 112.00$ -1 456.24 (-1.33 %)

Развитие ИИ-моделей OpenAI замедлилось из-за дефицита данных для обучения

1 минута на чтение
Изображение содержит логотип OpenAI на фоне абстрактного дизайна с синими светящимися линиями и точками.

GigaChat Max кратко объясняет суть статьи

Новая языковая модель Orion от OpenAI показывает умеренный прогресс по сравнению с предыдущими версиями, достигнув примерно уровня GPT-4 после завершения 20% обучения. Несмотря на улучшение результатов, её производительность в написании кода уступает предшественникам. Проблему дефицита данных для обучения решает команда разработчиков, рассматривающая применение синтетической информации, создаваемой другими ИИ. Модель планируют выпустить в декабре 2024 года, ограничив доступ компаниями-партнёрами. В обучении Orion уже используются данные, созданные моделью o1 (Strawberry).

Тестировщики OpenAI выявили, что новая языковая модель под кодовым именем Orion демонстрирует улучшенные результаты по сравнению с предыдущими моделями, но её прогресс оказался менее впечатляющим, чем переход от GPT-3 к GPT-4.

Об этом сообщает издание The Information, на которое ссылается TechCrunch. На текущий момент модель Orion завершила лишь 20% этапа обучения, но уже по ряду показателей приблизилась к уровню GPT-4. Однако её производительность в задачах по написанию кода остаётся ниже, чем у предшественников. Основной проблемой OpenAI называет недостаток данных для дальнейшего обучения модели.

Для решения проблемы нехватки данных компания сформировала специальную команду, которая исследует альтернативные подходы к развитию модели. В частности, рассматривается использование синтетических данных, генерируемых другими ИИ, что может компенсировать дефицит качественных текстов для обучения.

Согласно данным The Verge, OpenAI планирует выпустить Orion в декабре 2024 года, но, в отличие от GPT-4o и o1, новая модель не будет доступна по подписке ChatGPT. В первую очередь доступ к Orion получат компании-партнёры.

Ранее, в августе 2024 года, The Information сообщало, что для обучения Orion используются данные, генерируемые другой моделью — o1, известной также под названием Strawberry. Это позволяет частично решить проблему с недостатком обучающей информации.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
162374ee-128c-4f2d-a73a-c12fd6a96c45-изображение-0

GigaChat Max: коротко о главном

Яндекс запустит биржу Telegram-каналов

Полная версия 
092c73fe-34bf-4ec9-b4ea-0ed50995759c-изображение-0

GigaChat Max: коротко о главном

Ритейлеры выступили против скидок на маркетплейсах

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 371
Газпромбанк
OTP Bank
Т-Банк
X5 Tech
билайн
Сбер
МТС
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы