14 декабря 2024

eur = 109.01 -1.47 (-1.33 %)

btc = 102 201.00$ 2 588.58 (2.60 %)

eth = 3 920.96$ 12.14 (0.31 %)

ton = 6.32$ -0.03 (-0.46 %)

usd = 103.43 -0.52 (-0.50 %)

eur = 109.01 -1.47 (-1.33 %)

btc = 102 201.00$ 2 588.58 (2.60 %)

Форум

OpenAI столкнулась с нехваткой данных для обучения GPT-5

1 минута на чтение
OpenAI столкнулась с нехваткой данных для обучения GPT-5

Разработчики искусственного интеллекта столкнулись с нехваткой качественных данных для обучения моделей, в том числе для будущего GPT-5.

Исследователи выражают обеспокоенность по поводу возможного замедления развития отрасли из-за дефицита текстовых материалов. Особенно это касается данных, блокируемых некоторыми ресурсами для ИИ. Учёные подчеркивают, что обучение ИИ на материалах других моделей может привести к проблемам с качеством.

OpenAI рассматривает возможность использования транскрипций с YouTube для обучения GPT-5. Это становится актуальным на фоне предупреждений о том, что уже к середине 2024 года ИИ может столкнуться с серьёзным дефицитом данных. Для обучения модели GPT-5 потребуется от 60 до 100 триллионов токенов данных, в то время как весь интернет может предоставить на 10-20 триллионов токенов меньше необходимого.

Проблема усугубляется тем, что большинство данных в интернете непригодны для обучения ИИ. Ограничен доступ к информации на крупных платформах, а использование личной переписки людей вызывает опасения по поводу конфиденциальности.

В ответ на эти вызовы, компании исследуют новые методы обучения и возможности создания рынка данных. OpenAI и Anthropic экспериментируют с «высококачественными синтетическими данными», которые могут стать альтернативой для обучения будущих ИИ-моделей. Такие данные уже использовались в последних версиях Claude от Anthropic.

Неопределённость относительно будущего искусственного интеллекта остаётся, но исследователи сохраняют оптимизм, веря в возможность революционных открытий в области обработки и анализа данных для обучения ИИ.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
89556eef-b112-4a98-94f3-c9da3f058331-изображение-0b1b505c4-a199-4c3a-a7e3-acf8a89a681c-изображение-1

GigaChat Max: коротко о главном

В соцсеть X добавили кнопку «Объясни этот пост» с функцией анализа от чат-бота Grok

Полная версия 
4e6ee920-d843-4dbd-b8c5-04d062b4516c-изображение-0

GigaChat Max: коротко о главном

В Москве запустили первую пилотную зону 5G на отечественном оборудовании

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Новости
Карьера
Блоги 301
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131