Luma Labs выпистили новую модель для генерации фото

Luma Labs выпустила Uni-1 — генератор изображений, который перед созданием картинки анализирует намерение пользователя. В отличие от большинства популярных инструментов, модель не угадывает результат по вероятности, а сначала решает, где и как расположить объекты в кадре. Luma Labs называет это решением «проблемы намерения» — разрыва между тем, что пользователь имеет в виду, и тем, что модель в итоге генерирует.

Большинство генераторов изображений вроде Stable Diffusion или Flux работают по принципу постепенного проявления картинки из случайного шума. Такие модели хорошо воспроизводят текстуры и стиль, но плохо справляются с пространственными инструкциями: где что стоит, что находится за чем, что левее, а что правее.

В Luma решили эту проблему благодаря новому подходу: теперь модель читает текстовый запрос и изображение как единый поток — слово за словом, фрагмент за фрагментом. Сначала она предсказывает, как должны быть расположены объекты в сцене, и только потом прорисовывает детали.

Компания временно сделала Uni-1 бесплатной. Ее можно протестировать в сервисе Luma Labs. Модель также добавят в API. Стоимость генерации одной картинки составит $0,09, ее редактура — $0,093. Для сравнения: одна генерация Nano Banana 2 стоит $0,101, а Nano Banana Pro — $0,134.

Источник: Luma AI

Luma Labs выпустила рассуждающую модель Uni-1 для генерации картинок