Содержание
OpenAI представила новую версию ChatGPT Images. Рассказываем, чем она отличается от Sora и как ей пользоваться.
По словам компании-разработчика, модель редактирует изображения с высокой точностью и генерирует картинки до 4 раз быстрее. В ChatGPT появилась отдельная вкладка «Изображения» — там хранятся все сгенерированные изображения.
В API модель доступна как GPT Image 1.5. Новый интерфейс для работы с картинками уже доступен всем, кроме бизнеса и корпоративных клиентов — они получат доступ позднее.
Вариант 1. Генерация картинки с нуля
Чтобы сгенерировать изображение с нуля, сделайте следующее:
Шаг 1. Откройте ChatGPT в веб-версии или в мобильном приложении.
Шаг 2. Нажмите на значок «+» → выберите «Создать изображение».
Шаг 3. Пропишите то, что вы хотите видеть на изображении.
Всё звучит достаточно просто, но промт лучше создавать максимально детально. Например, если вы генерируете человека, опишите задний план, конкретные черты лица, одежду, позу и многие другие нюансы. Так нейросеть лучше поймёт, что вы от неё хотите получить.
Ещё лучше писать запросы на английском языке — так моделям тоже проще изобразить то, что вы хотите. Соотношение сторон или ориентацию также укажите в запросе.
Наш пример:

Вариант 2. Редактирование изображений
Если вы хотите сделать коллаж или изменить что-то на одной фотографии при помощи другой, сделайте так:
Шаг 1. Снова откройте ChatGPT, выберите «Создание изображений».
Шаг 2. Через знак «+» добавьте картинки.
Шаг 3. Текстом опишите, что вы хотите видеть.
Мы решили взять фотографии главы OpenAI и руководителя Nano Banana. Попросили сгенерировать изображение, где они жмут друг другу руки на фоне надписи.

Из примера видно, что модель сохранила даже одежду героев с исходных картинок. Мы решили её изменить, но пропала надпись.

Бывает, можно легко исправить. И ещё одну надпись добавить, но уже на русском языке.

К сожалению, надпись на кириллице немного «поплыла». Можно попросить перегенерировать и указать на этот недостаток. В общем, границы GPT Image 1.5 ограничены только цензурой и вашим воображением.
Вариант 3. Использование готовых пресетов
Если вы новичок в генерации изображений, воспользуйтесь готовыми промтами от OpenAI. Их можно найти на главной ChatGPT → раздел «Изображения».

Полистайте готовые стили и введите свой запрос. Также вы можете прикрепить свою или чужую фотографию. Это неплохой источник вдохновения, чтобы впредь писать запросы самостоятельно с нуля.
Что ещё умеет ChatGPT Images?
- Модель гораздо лучше интерпретирует сложные и длинные запросы. Вам больше не нужно заниматься «промпт-инжинирингом» — можно просто общаться с чат-ботом на естественном языке.
- Одно из главных достижений — способность корректно отрисовывать текст внутри изображений (вывески, этикетки, заголовки), что раньше было слабой стороной нейросетей. Но работает через раз.
- Модель реже игнорирует мелкие детали запроса (например, конкретный цвет глаз или расположение объектов в кадре). Этим часто грешила Sora.
- Вы можете выделить конкретную область на уже созданном изображении и попросить ChatGPT изменить только её. Остальное останется нетронутым.

Пробуйте ChatGPT Images и делитесь результатами своих генераций в комментариях!
Читать первым в Telegram-канале «Код Дурова»
























































