OpenAI запустила бесплатную модель для создания составных изображений на базе GPT-4o

2 минуты на чтение
OpenAI запустила бесплатную модель для создания составных изображений на базе GPT-4o

GigaChat Max кратко объясняет суть статьи

OpenAI представила новую функцию генерации изображений в ChatGPT на базе GPT-4o под названием 4o Image Generation. Она отличается улучшенным пониманием контекста, точностью обработки сложных инструкций и способностью генерировать читаемый текст на изображениях. Новая система создаёт изображения постепенно, что улучшает контроль над деталями. Улучшена работа с прозрачным фоном и возможностью редактирования загруженных изображений. OpenAI также внедрила меры безопасности, такие как маркировка метаданными и отказ от создания дипфейков и других чувствительных тем.

OpenAI официально представила новую функцию генерации изображений в ChatGPT на базе модели GPT-4o.

В отличие от прежнего DALL·E 3, эта система гораздо лучше понимает контекст, чётко обрабатывает сложные инструкции, правильно связывает атрибуты с объектами и умеет генерировать читаемый текст прямо на изображениях без искажений. Инструмент получил название 4o Image Generation и уже сегодня станет доступен всем пользователям, включая тех, кто пользуется ChatGPT бесплатно — с лимитом до трёх изображений в день, как и в случае с DALL·E.

Главное отличие новой системы в том, что она генерирует изображение постепенно — слева направо и сверху вниз, что позволяет более точно контролировать детали, особенно при работе с надписями и множественными объектами.

Например, если задать сцену с десятком различных фигур и цветов, GPT-4o справится без ошибок, тогда как другие модели начинают путаться уже на пятом-шестом элементе. Также улучшилась работа с прозрачным фоном, что делает модель особенно полезной для генерации логотипов, стикеров и элементов интерфейса.

Ещё одна новинка — возможность редактировать уже загруженные изображения. Пользователь может, к примеру, попросить добавить объект на фото или убрать ненужный элемент, и система корректно выполнит задачу по текстовому описанию.

OpenAI отдельно подчеркнула меры безопасности. Все изображения маркируются метаданными C2PA, указывающими на их происхождение, а система отказывает в генерации дипфейков, сцен с насилием и других чувствительных тем. По словам разработчиков, особое внимание было уделено предотвращению злоупотреблений, на фоне недавних скандалов с дипфейками и фальсификациями.

Таким образом, 4o Image Generation — это шаг вперёд не только в плане качества генерации, но и в плане ответственности. Новый инструмент делает ChatGPT более универсальным и приближает нейросеть к статусу полноценного мультимодального ассистента.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
760f5301-6827-4c49-aa49-7264ecb0a13c-изображение-04db0dcaa-b568-44d9-8ad8-32ca1769e3d6-изображение-19efe06f2-5232-400d-b579-20e8e8c50dc0-изображение-2

GigaChat Max: коротко о главном

Вышло апрельское обновление «Алисы» и умного дома Яндекса. Что нового?

Полная версия 
fb8e45e9-7040-4a0c-be1f-6b158f2e6d9a-изображение-06f16f589-1763-4f81-9ac1-4c94aaf7263e-изображение-151e32fc0-ccef-4d91-9a2d-7952c5c32c4a-изображение-2

GigaChat Max: коротко о главном

билайн усилил надёжность сети, модернизировав Ярославский ЦОД

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 345
билайн
Газпромбанк
Т-Банк
МТС
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан
Банк 131