6 июня 2026

eur = 85.56 -0.71 (-0.83 %)

btc = 61 279.00$ -1 944.93 (-3.08 %)

eth = 1 594.08$ - 161.78 (-9.21 %)

ton = 1.52$ -0.14 (-8.59 %)

usd = 73.47 -0.83 (-1.11 %)

eur = 85.56 -0.71 (-0.83 %)

btc = 61 279.00$ -1 944.93 (-3.08 %)

OpenAI представила Images 2.0 — первую визуальную модель с «рассуждениями» для генерации изображений

2 минуты на чтение
OpenAI представила Images 2.0 — первую визуальную модель с «рассуждениями» для генерации изображений

Кодик кратко объясняет суть статьи

OpenAI представила Images 2.0 — первую визуальную модель компании с функцией «рассуждений». Она интегрирована в ChatGPT и при активации режима рассуждений способна искать информацию в интернете, генерировать несколько изображений на один запрос и проверять свои результаты. Модель улучшена в передаче деталей, включая «крошечные недостатки» для реализма, и точнее воспроизводит кинематографические кадры, пиксельную графику и другие стили. Особое внимание уделено поддержке языков с нелатинским алфавитом — японского, китайского, корейского, хинди и бенгали, где текст отображается корректно и связно. Пока модель может испытывать трудности с задачами, требующими точной визуализации, например, схем оригами или объектов на наклонных поверхностях. Images 2.0 доступна всем пользователям ChatGPT и Codex, режим с рассуждениями — подписчикам Plus, Pro и Business, модель gpt-image-2 также доступна через API.

Читайте в Telegram

|

OpenAI представила Images 2.0 — первую визуальную модель компании с возможностями «рассуждений», сообщается в анонсе.

Когда в ChatGPT выбрана рассуждающая модель, Images 2.0 может выполнять поиск релевантной информации в интернете, генерировать несколько изображений для одного промпта и перепроверять свой результат.

В отличие от других моделей для генерации изображений компании, Images 2.0 лучше воспроизводит языки, которые используют не латинский алфавит — в частности, японский, корейский, китайский, хинди и бенгали. Сгенерированные на них тексты не только отображаются корректно, но и написаны связно.

Images 2.0 лучше передаёт детали — например, на фотографиях добавляет «крошечные недостатки» для придания реализма, — точнее воспроизводит кинематографические кадры, пиксельную графику и другие стили.

Компания отметила, что пока Images 2.0 может испытывать сложности с задачами вроде генерации руководства по оригами, головоломок или деталей на наклонных поверхностях.

Images 2.0 доступна всем пользователям ChatGPT и Codex. Режим работы с рассуждениями — подписчикам ChatGPT Plus, Pro и Business. Модель gpt-image-2 также доступна в API.

Теги:
Материал обновлен|
Обсудить
Блоги 600
Softline
OTP Bank
ЦНИС
ВКонтакте
ВТБ
билайн
Слетать.ру
Т-Банк
Газпромбанк
МТС

Привет, это Кодик! Я создан, чтобы помогать вам с  разными задачами. Задайте мне вопрос…