
Один промпт — 5 новых генераторов: второй раунд AI-сравнения
Один промпт — 5 новых генераторов: второй раунд AI-сравнения
Протестировали ещё 5 AI-моделей на тех же промптах. Могут ли новички конкурировать с лидерами? Результаты удивят.
Раунд 2: Новые участники
После нашего первого сравнения, где мы тестировали FLUX, Ideogram, Stable Diffusion, Seedream и Nano Banana, посыпались вопросы: «А как насчёт Imagen 4?», «Пробовали Recraft?», «Что там с новыми китайскими моделями?»
Справедливо. Мир AI-генерации движется быстро. Топовые модели сегодня — вчерашний день завтра. Поэтому мы взяли ещё 5 генераторов — кто-то совсем свежий, кто-то недооценённый — и скормили им те же три промпта.
Те же правила: никаких подкруток, никакой оптимизации, только честность. Один текст — пять результатов. Посмотрим, что получится.
Знакомьтесь с новой командой
Прежде чем смотреть результаты, давайте быстро познакомимся с сегодняшними участниками.
Z-Image Turbo (Pruna AI)
Оптимизированная модель от Pruna AI с фокусом на скорость без потери качества. «Turbo» — это не просто маркетинг, модель действительно генерирует быстро, сохраняя конкурентное качество. Построена на архитектуре «эффективность прежде всего», разработана для высоконагруженных workflow, где скорость важна. Доступна через Replicate с бюджетными ценами.
Qwen-Image (Alibaba)
Из семейства Qwen (Tongyi Qianwen) от Alibaba приходит эта vision-language модель. Часть китайского прорыва в AI-генерацию, Qwen-Image обладает сильными техническими возможностями, особенно с азиатской эстетикой и культурными референсами. Интересный подход к пониманию промптов с встроенной многоязычной поддержкой.
Recraft V3 (Recraft AI)
Третья итерация Recraft фокусируется на дизайне и иллюстративной работе. В отличие от моделей, заточенных на фотореализм, Recraft V3 превосходен в векторной графике, дизайне логотипов и стилизованных иллюстрациях. Версия 3 добавила поддержку фотореализма, сохранив иллюстративные сильные стороны. Специалист, пытающийся стать универсалом.
Imagen 4 (Google)
Последняя попытка Google в гонке генерации изображений. Imagen 4 привносит исследования DeepMind в продакшн, с акцентом на безопасность, точность и следование промптам. Мощная поддержка от инфраструктуры и исследований Google означает стабильное качество и регулярные обновления. Ответ корпоративного гиганта open-source моделям.
FLUX Schnell (Black Forest Labs)
От создателей оригинального FLUX приходит Schnell (по-немецки «быстро»). Облегчённая версия FLUX, оптимизированная для скорости — меньше шагов диффузии, быстрый вывод, меньше вычислительных затрат. Жертвует небольшим качеством ради скорости, но сохраняет ДНК FLUX. Идеально для итераций и превью.
Тест №1: Простой промпт
Промпт: A golden retriever puppy sitting in a field of sunflowers, golden hour lighting, photorealistic
Начинаем с того же простого промпта из Раунда 1. Щенок в подсолнухах. Должно быть легко, правда?
Что мы ожидаем
Реалистичное фото щенка золотистого ретривера среди подсолнухов, тёплый свет «золотого часа». Просто, понятно, без ловушек.
На что обращать внимание
- Фотореализм: реальное фотокачество или явный рендер
- Освещение: настоящий golden hour или просто «светло»
- Текстура шерсти: дьявол в деталях
- Точность подсолнухов: правильный масштаб и структура
Результаты

Z-Image Turbo выдал удивительно чистые результаты. Хороший фотореализм, приличное освещение. Текстура шерсти чуть мягче, чем у топовых моделей, но для модели, заточенной на скорость, впечатляющее качество. Подсолнухи выглядят натурально. Надёжная базовая производительность.
Qwen-Image создал очень отполированное изображение с отличной композицией. Интересный цветовой баланс — немного холоднее традиционного golden hour, но эстетически приятно. Детализация сильная. Модель явно хорошо «понимает» сцену.
Recraft V3 немного пробуксовал здесь. Результат слегка склоняется к иллюстративности, а не фотореализму — видна его дизайнерская ДНК. Всё ещё приятно смотреть, но не попадает в цель «фотореалистично» так сильно, как конкуренты. Подсолнухи хорошо отрендерены, правда.
Imagen 4 выдал очень гугловский результат: чистый, безопасный, технически правильный. Отличное освещение, хорошая текстура шерсти, всё на своих местах. Возможно, не хватает «характера» по сравнению с другими, но техническое исполнение не упрекнёшь. Вот так выглядит «корпоративный AI» — надёжный и отполированный.
FLUX Schnell показал, почему семейство FLUX уважают. Даже «быстрая» версия сохраняет сильное качество. Отличное атмосферное освещение, хорошая глубина резкости, естественный щенок. Оптимизация скорости, похоже, не жертвует многим. Впечатляющий баланс.
Тест №2: Средний уровень сложности
Промпт: A weathered fisherman in his 60s mending a net on a wooden dock, early morning fog, fishing boats in the background, cinematic lighting, shallow depth of field
Теперь добавляем сложности. Конкретный человек, атмосфера, сторителлинг через окружение. Здесь модели начинают показывать свою личность.
На что обращать внимание
- Лицо и руки: точность возраста, морщины, пальцы
- Атмосфера тумана: натуральный или искусственный
- Текстура сети: повторяющиеся паттерны сложны для AI
- Глубина резкости: правильное размытие фона
- Кинематографичность: похоже ли на кадр из фильма
Результаты
Z-Image Turbo справился с этим разумно. Лицо выглядит состаренным адекватно, руки приемлемы (слабое место многих моделей). Туман присутствует, но немного равномерный. Сеть упрощена, но читаема. В целом компетентный результат, который не выиграет наград, но сделает работу.
Qwen-Image впечатлил здесь. Отличная детализация лица с естественными морщинами и обветренной кожей. Хороший атмосферный туман, приятная цветокоррекция. Сеть обработана лучше большинства конкурентов. Глубина резкости работает хорошо. Сильный кинематографический vibe. Эта модель, кажется, превосходна с человеческими субъектами.
Recraft V3 снова показывает свои иллюстративные корни. Результат больше концепт-арт, чем фотография. Красиво по-своему, но отклоняется от «кинематографической фотографии» к «нарисованной иллюстрации». Если нужен сториборд или концепт-пис, идеально. Для фотореализма — не совсем.
Imagen 4 выдал твёрдое техническое исполнение. Хорошее старение лица, правильный туман, приемлемая глубина резкости. Сцена ощущается немного «постановочной» — очень чисто, очень контролируемо. Меньше песочного реализма, больше эстетики «ТВ-рекламы». Качество высокое, характер умеренный.
FLUX Schnell создал атмосферную, настроенческую сцену. Отличная работа со светом, хорошая детализация лица, туман чувствуется натурально. Сеть упрощена, но общая композиция сильная. Эта модель постоянно пробивает свою категорию «быстрый».
Тест №3: Сложный промпт
Промпт: A tiny astronaut sitting on the edge of a coffee cup, looking up at a galaxy swirling inside the cup like cream in coffee, miniature tilt-shift photography style, dramatic lighting from above, hyperdetailed, 4K
Самый сложный тест. Игры с масштабом, невозможная физика, конкретный фотографический стиль. Это отделяет понимание концепта от сопоставления ключевых слов.
На что обращать внимание
- Масштаб: космонавт действительно миниатюрный или просто маленький
- Эффект tilt-shift: характерное размытие краёв
- Галактика в кофе: слил ли концепты или создал хаос
- Освещение: драматический верхний свет или просто «светло сверху»
- Общая связность: единая фотография или явный композит
Результаты
Z-Image Turbo дал честную попытку. Космонавт есть, чашка есть, какой-то завихрение в кофе. Но концепты не полностью сливаются — больше похоже на отдельные элементы, размещённые вместе. Tilt-shift минимален. Для скоростной модели, атакующей сложный промпт, достойная попытка, но не wow-эффект.
Qwen-Image создал что-то интересное. Хорошая работа с масштабом крошечного космонавта, приятный эффект галактики в кофе. Освещение драматическое. Однако tilt-shift едва заметный. Модель явно поняла концепт и хорошо исполнила большинство элементов. Сильная интерпретация, если не идеальное исполнение.
Recraft V3 ушёл в полную художественную интерпретацию. Создал красивую, стилизованную сцену, которая больше «концепт-арт», чем «tilt-shift фотография». Галактика выглядит потрясающе, космонавт хорошо отрендерен, но это явно иллюстрация, не фотография. Если хотели арт, получили. Если хотели фотореализм, это не оно.
Imagen 4 подошёл к этому методично. Все элементы присутствуют: крошечный космонавт, галактический кофе, верхнее освещение. Исполнение чистое и безопасное. Результат технически правильный, но не хватает «магии» — ощущается сконструированным, а не запечатлённым. Подход Google «безопасность прежде всего» проявляется здесь.
FLUX Schnell нас удивил. Удалось хорошо захватить концепт с хорошей работой масштаба, приятной интеграцией галактики и попыткой tilt-shift эффекта. Освещение драматическое, композиция продуманная. Для «быстрой» модели пробивает намного выше своей весовой категории на сложных промптах.
Общие наблюдения: Раунд 2
После тестирования этих пяти моделей выявляются чёткие закономерности.
Скорость vs Качество — не всегда компромисс
И Z-Image Turbo, и FLUX Schnell оптимизированы для скорости, но оба выдают качество, конкурирующее с более медленными моделями. Категория «быстрые» серьёзно повзрослела. Уже не всегда нужно выбирать между скоростью и качеством.
Региональные различия в эстетике
Qwen-Image (китайская) и Imagen 4 (американская) показывают тонкие, но заметные различия в цветокоррекции, предпочтениях композиции и акценте на деталях. Культурный фон тренировочных данных и выбор разработчиков формируют вывод. Ни одна не «лучше» — просто разные.
Специалистам нужны специфические кейсы
Recraft V3 продолжает пытаться быть фотореалистичным, когда его сердце явно в иллюстрации и дизайне. Это не «плохая» модель — это специалист, которого просят быть универсалом. Используйте его для того, в чём он хорош (векторная графика, стилизованные иллюстрации), и он засияет.
Корпоративные vs Open-Source вайбы
Imagen 4 (Google) имеет отполированный, безопасный, корпоративный feel. Технически отличный, но креативно консервативный. Open-source-ориентированные модели вроде FLUX Schnell идут на большие креативные риски. Оба подхода валидны для разных кейсов.
Понимание промптов становится лучше
Все пять моделей поняли сложные промпты лучше, чем модели даже полгода назад. Концепт «крошечного космонавта в чашке кофе», который запутал бы старые модели, теперь компетентно обрабатывается большинством. Индустрия быстро взрослеет.
Сравнение: Раунд 1 vs Раунд 2
Как наши новые участники сравниваются с составом Раунда 1?
Лучший фотореализм:
- Раунд 1: Ideogram v3 Turbo
- Раунд 2: Qwen-Image
- Преимущество: Ничья — оба превосходны в разных аспектах
Лучшая атмосфера/кинематографичность:
- Раунд 1: FLUX 2 Max
- Раунд 2: FLUX Schnell
- Преимущество: Раунд 1 (Max всё ещё лучше Schnell)
Лучший баланс скорость/качество:
- Раунд 1: Seedream 4.5
- Раунд 2: FLUX Schnell
- Преимущество: Раунд 2 (Schnell впечатляюще быстр)
Лучший для сложных промптов:
- Раунд 1: FLUX 2 Max
- Раунд 2: Qwen-Image
- Преимущество: Раунд 1 (Max лучше справляется со сложностью)
Самый надёжный/стабильный:
- Раунд 1: Stable Diffusion 3.5
- Раунд 2: Imagen 4
- Преимущество: Раунд 1 (SD 3.5 — скучный надёжный выбор)
Шпаргалка: кто для чего
| Задача | Лучший выбор из Раунда 2 | Почему |
|---|---|---|
| Высоконагруженный workflow | Z-Image Turbo | Быстрая генерация, приличное качество, бюджетно |
| Портреты людей, лица | Qwen-Image | Отличная детализация лица и текстура кожи |
| Дизайн, иллюстрации | Recraft V3 | Создан для стилизованной графики, не фотореализма |
| Безопасный корпоративный контент | Imagen 4 | Качество с поддержкой Google, фокус на безопасность |
| Быстрые итерации, превью | FLUX Schnell | Быстрый как Turbo, качество как FLUX |
| Сложные композиции | Qwen-Image | Сильное понимание промптов |
Практические советы: Раунды 1 и 2 вместе
Если вы прочитали обе сравнительные статьи, вот что нужно знать:
Для максимального качества: Используйте FLUX 2 Max (Раунд 1) или Ideogram v3 (Раунд 1), когда качество превыше всего, а скорость не важна.
Для скорости: FLUX Schnell (Раунд 2) или Z-Image Turbo (Раунд 2), когда нужны быстрые итерации или бюджетные ограничения.
Для портретов: Qwen-Image (Раунд 2) или Ideogram v3 (Раунд 1) — оба превосходны с человеческими лицами и текстурой кожи.
Для надёжности: Stable Diffusion 3.5 (Раунд 1) или Imagen 4 (Раунд 2), когда нужны предсказуемые, стабильные результаты.
Для экспериментов: Пробуйте всё через Replicate. При $0.02-0.05 за изображение тестирование разных моделей стоит дешевле кофе.
Осваивайте фундаментальные навыки: Понимание поз, эмоций, освещения и композиции важнее, чем какую модель вы используете. Хороший промпт на «худшей» модели побеждает плохой промпт на «лучшей» модели. Посмотрите наши гайды 500 Poses и 132 Emotions, чтобы прокачать навыки промптинга.
Итоговая линия
Раунд 2 показывает, что ландшафт AI-генерации здоров и конкурентен. Ни одна модель не доминирует во всём. Модели, оптимизированные для скорости, становятся достаточно хороши, чтобы бросить вызов моделям, заточенным на качество. Региональные игроки (Qwen из Китая) привносят разные перспективы.
Лучшая модель — та, что подходит вашему конкретному кейсу, бюджету и workflow. Не следуйте хайпу — тестируйте сами. При ценах Replicate нет оправдания не экспериментировать.
И помните: все эти модели устареют через полгода. Технология движется так быстро. Оставайтесь любопытными, продолжайте тестировать и не привязывайтесь слишком к одной платформе.
Хотите создавать лучшие AI-изображения независимо от того, какую модель используете? Осваивайте фундаментальные навыки с нашими гайдами 500 Poses и 132 Emotions — универсальные навыки, работающие на любом генераторе.

