Операция выполнена!
Закрыть
Хабы: Блог компании BotHub, Искусственный интеллект, Машинное обучение, Будущее здесь, Обработка изображений

Если вы хоть раз пытались сгенерировать картинку в нейросети, вы знаете этот фокус. Пишешь: "Красивый закат на море, девушка с зонтиком, реализм". Получаешь: девушку с шестью пальцами, зонтик, парящий в воздухе, и закат ядерного взрыва. Знакомо?

Последние полгода на рынке генеративных моделей творится что-то невероятное. Сначала Google DeepMind тихо, без лишнего шума, выпустила Nano Banana Pro (она же Gemini 3 Pro Image Preview). А через пару месяцев OpenAI выкатила GPT Image 1.5, пообещав ускорение в 4 раза и прорывное качество.

И началось. В одних обзорах Nano Banana Pro называют королём фотореализма и скорости. В других - ругают за полное непонимание русского языка. Про GPT Image 1.5 пишут, что он наконец-то научился редактировать изображения, но тут же жалуются, что он тормозит и режет текст на полуслове.

Кто врёт? Да никто. Просто модели реально разные. И задачи у них разные.

Я решила не гадать на кофейной гуще, а устроить этим двум художникам полноценный конкурс. Взяла 8 промптов разной степени извращённости, прогнала каждую модель по 3-5 раз, замерила скорость, проверила анатомию, русский язык, редактирование и способность помнить персонажа от кадра к кадру.

Выбрать лучшую не получится. Придётся выбирать под свою задачу. Но после этой статьи вы будете знать точно, какая модель для чего нужна.

Поехали, приятного прочтения!

Читать далее
Читайте также
НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro