27 апреля 2026

eur = 88.28 0.76 (0.86 %)

btc = 78 038.00$ 633.15 (0.82 %)

eth = 2 347.21$ 38.64 (1.67 %)

ton = 1.31$ -0.02 (-1.30 %)

usd = 75.53 0.69 (0.93 %)

eur = 88.28 0.76 (0.86 %)

btc = 78 038.00$ 633.15 (0.82 %)

Топ-5 нейросетей для изображений: сравнили результаты

3 минуты на чтение
Топ-5 нейросетей для изображений: сравнили результаты

Содержание

Читайте в Telegram

|

Берём одно изображение — девушка в синем металлик-костюме с серебряными вставками, ботфортами и визором — и прогоняем через пять разных нейросетей.

Промпт один и тот же, результаты разные. Смотрим, где что работает.

Базовый промпт для всех пяти ИИ

Это общее описание. Его понимает любая нейросеть (спойлер: кроме одной).

Fashion editorial photoshoot. The same woman from the reference image, same face, same electric blue metallic outfit with silver accents, same thigh-high boots. New scene: abandoned brutalist parking garage at golden hour. Dramatic side lighting, long shadows, cinematic film grain. Vogue editorial aesthetic. Full body shot. Keep character identity and outfit unchanged.

Однако чтобы корректно сравнить модели, мы будем добавлять небольшую приписку к этому запросу и сравнивать плюсы и минусы каждого ИИ.

Seedream 5.0 Lite

Модель от ByteDance с функцией веб-поиска и глубоким reasoning. Лучше всего из пятёрки понимает сложную композицию и удерживает детали одежды — металлический блеск, серебряные молнии на ботфортах она не потеряет.

Топ-5 нейросетей для изображений: сравнили результаты

Промпт оставляем базовый, но добавляем в конце:

Preserve all outfit details: metallic blue fabric sheen, silver lightning bolt details on boots, chrome visor glasses. Hard directional light from the left. Concrete pillars in background, oil stains on floor.

  • Плюс: держит текстуры лучше остальных, хорошо понимает длинные промпты на русском и английском.
  • Минус: иногда чуть «причёсывает» внешность — делает черты мягче, чем в оригинале.

GPT Image 1.5

Самая точная по следованию промпту из всех пяти. Если написать «брутальный паркинг» — будет именно паркинг, а не абстрактный индустриальный фон. Хорошо работает с атмосферой, но с удержанием лица при смене фона бывают проблемы.

Топ-5 нейросетей для изображений: сравнили результаты

К базовому промпту добавляем:

Maintain exact likeness from reference photo. Dramatic chiaroscuro lighting. Concrete ceiling with exposed pipes. Lens flare from the right. Shot on 35mm film.

  • Плюс: лучший промпт-фоллоуинг в сцене, хорошая работа со светом.
  • Минус: лицо между генерациями может немного плыть, если сцена сложная.

Nano Banana Pro

Эта модель сильна в редактировании: вы буквально говорите ей, что изменить, а что оставить. Для фэшн-съёмки это удобно — можно итерировать: сначала поменять фон, потом добавить туман, потом подкрутить свет, и персонаж не расплывется между правками.

Топ-5 нейросетей для изображений: сравнили результаты

К базовому промпту добавляем:

Keep the woman exactly as in the reference. Change only the background to an empty brutalist parking garage, golden hour light coming through concrete gaps.

  • Плюс: итерация без потери персонажа — главная фича. Удобно для тех, кто хочет контроль на каждом этапе.
  • Минус: иногда на первой генерации немного упрощает фактуру одежды, лучше явно прописывать «metallic sheen, reflective surface».

Grok Aurora

Aurora — генератор изображений внутри Grok. Хорошо работает с эстетически нагруженными промптами и понимает отсылки к конкретным визуальным стилям. Если написать «editorial как у Helmut Newton», модель считает контекст правильно. Так что для Aurora лучше написать отдельный промпт.

Топ-5 нейросетей для изображений: сравнили результаты

Промпт:

Same woman from the reference, blue metallic outfit with silver accents. Editorial fashion photography in the style of Helmut Newton. High contrast black and white shadows on concrete walls, but outfit remains in full electric blue color. Parking structure, dramatic pose, full body.

  • Плюс: хорошо работает со стилевыми отсылками и контрастным светом.
  • Минус: хуже остальных держит специфические детали одежды — молнии и вставки может упростить. Стоит явно прописать каждый элемент.

FLUX.1

Работает принципиально иначе: вы не описываете картинку целиком, а говорите модели, что именно поменять. Это самый точный инструмент для замены фона при сохранении персонажа — именно то, что нужно для такой задачи.

Топ-5 нейросетей для изображений: сравнили результаты

Добавление к промпту короткое и конкретное:

Replace the white background with an abandoned brutalist parking garage at golden hour. Keep the woman, her outfit, pose, and lighting on her body completely unchanged. Add only ambient warm light from the environment.

  • Плюс: лучшее удержание персонажа при смене окружения из всей пятёрки. До 8 раз быстрее GPT Image по скорости генерации.
  • Минус: не создаёт изображение с нуля так же богато, как Seedream или GPT Image — лучше работает именно как редактор референса, а не генератор.

Протестировать все 5 нейросетей, не покупая месячные подписки за 20-30$, можно в агрегаторе нейросетей SpeShu AI. 300 нейросетей на русском языке на одном сайте без VPN.

SpeShu AI — флагманский проект ЦНИС. Центр национальных интеллектуальных систем создаёт и развивает сервис, который поможет российскому бизнесу и гражданам внедрить ИИ-технологии в повседневную жизнь.
Обсудить
Блоги 517
ВКонтакте
Слетать.ру
ЦНИС
билайн
OTP Bank
Т-Банк
ВТБ
Газпромбанк
МТС
X5 Tech

Привет, это Кодик! Я создан, чтобы помогать вам с  разными задачами. Задайте мне вопрос…