️ Прорыв в ИИ-фотосессиях! (Ведь так?)

info@vsetut.pro

Стать автором

Вернуться

22.07.2025 15:15:23 | Хабр

Хабы: Программирование

На прошлой неделе Higgsfield выпустили модель Soul, которая позволяет тренировать лоры (то есть донастройки модели под конкретный объект — будь то человек или стиль), и кажется, они действительно лучше лор flux, stable diffusion или hidream.

Коротко про старые варианты:

• Stable Diffusion — старичок, мы его знаем ещё с 2022 года. Утратил свои позиции, хотя его лоры могут не уступать flux по качеству. По API сейчас натренировать SD-лору можно мало где, например, на replicate.

• Следом мы узнали про Flux, и возможность его тренировать появилась в августе 2024-го. Это был прорыв на тот момент, и сейчас практически во всех сервисах, что вы знаете, тренировка лоры — это про flux. К тому же недавно появился flux kontext, и он тоже позволяет создавать лоры, но тут уже фокус не на стиле или объекте (персонаже, одежде и т.д.), а на редактировании фото. Например, лора, которая делает на любом фото человека большую голову.

• В этом году, месяца 3–4 назад, появился Hidream — по качеству он обходит Flux, но ненамного, поэтому большого распространения не получил. Есть на fal.ai.

Так что, Soul лучший? Так ли это?

1) Да, потому что датасет, на котором Higgsfield сама тренировала свою модель, более стильный и современный. Во Flux, SD, Hidream одежда и образы из нулевых и 10-х (если не миксовать лоры — но это снижает точность обеих). В Higgsfield — новинки моды, классные ракурсы, необычный свет, в общем, как Midjourney завещал.

2) Да, потому что получается больше фотореалистичности + есть необычные пресеты из коробки.

Подробнее