ИИ генераторы картинок

обсуждение арта - анатомия, техника, софт и тд. (artwork discussion - anatomy, software, tutorials etc.)
Ответить
Аватара пользователя
Shnatsel
tech support
tech support
Сообщения: 1996
Зарегистрирован: 16 май 2008, 18:16
FurSpecies: лев
Откуда: Moscow
Контактная информация:

ИИ генераторы картинок

Сообщение Shnatsel »

В этом году появились генераторы картинок на нейронных сетях, которые пытаются нарисовать картинку, соответствующую введённому текстовому запросу. Основные - Midjourney, DALL-E 2 от OpenAI, Imagen и Parti от Google, и Stable Diffusion.

На этой неделе наконец-то один из таких генераторов, Stable Diffusion, вышел в свободный доступ. Уже есть сайт с каталогом запросов и результатов - местами очень впечатляющих: https://lexica.art/

Вы можете попробовать это через веб-интерфейс (но там надо ждать каждой картинки несколько минут), или через Google Colab если вы знаете Python, тогда каждая картинка генерируется 20 секунд. Или можно запустить на собственной видеокарте от Nvidia если есть 8 гигабайт видеопамяти.

Я поиграл с этим сам, мои результаты во вложениях. Stable Diffusion пока не умеет обрабатывать сложные запросы, у Parti с этим получше. Эти технологии появились практически из ниоткуда меньше чем за два года, и скорее всего будут очень быстро развиваться.
Вложения
userpic-maybe.png
lioness.png
lion-in-field.png
It's the Circle of Life
And it moves us all
Through despair and hope
Through faith and love
Аватара пользователя
Shnatsel
tech support
tech support
Сообщения: 1996
Зарегистрирован: 16 май 2008, 18:16
FurSpecies: лев
Откуда: Moscow
Контактная информация:

Re: ИИ генераторы картинок

Сообщение Shnatsel »

У меня не получилось добиться от Stable Diffusion картинки с девочкой, едущей на животном-роботе. А вот Parti понимает такие запросы - в приложении картинка сделанная Parti по моему запросу. К сожалению, у публики доступа к Parti пока нет вообще.
Вложения
a_girl_with_her_back_to_the_camera_is_riding_a_robot_dog_like_a_horse_away_from_the_camera_oil_painting._scifi_film_still.png
It's the Circle of Life
And it moves us all
Through despair and hope
Through faith and love
Аватара пользователя
Shnatsel
tech support
tech support
Сообщения: 1996
Зарегистрирован: 16 май 2008, 18:16
FurSpecies: лев
Откуда: Moscow
Контактная информация:

Re: ИИ генераторы картинок

Сообщение Shnatsel »

Интереснее всего режим перевода из картинки в картинку. Тут тоже можно задавать текстовое описание картинки, включая стиль.

Вот пример, это генератор Stable Diffusion. Это не всегда работает настолько хорошо, к сожалению. Но тем не менее, впечатляюще.
Вложения
img2img.png
It's the Circle of Life
And it moves us all
Through despair and hope
Through faith and love
Аватара пользователя
Kovur
tech support
tech support
Сообщения: 3850
Зарегистрирован: 04 авг 2003, 00:53
FurSpecies: Panthera leo
Откуда: other world
Контактная информация:

Re: ИИ генераторы картинок

Сообщение Kovur »

А если попробовать что-то сложнее?
Львица на шаре
Львенок убегает от стада антилоп
Лев хочет съесть суриката
Лев с черной гривой убегает от гиен
You must take your place in the circle of life.
Аватара пользователя
Shnatsel
tech support
tech support
Сообщения: 1996
Зарегистрирован: 16 май 2008, 18:16
FurSpecies: лев
Откуда: Moscow
Контактная информация:

Re: ИИ генераторы картинок

Сообщение Shnatsel »

Публично доступные модели - Stable Diffusion, DALL-E 2, Midjourney - плохо справляются со сложными запросами. Методы от Google, особенно Parti, справляются с ними куда лучше, судя по статье и по тому одному запросу, который я попробовал, когда их можно было публиковать.

Теперь у меня есть прямой доступ к Parti и Imagen, но к сожалению я не могу публиковать результаты, или даже публично обсуждать их.
It's the Circle of Life
And it moves us all
Through despair and hope
Through faith and love
Ответить