Страница 1 из 1

ИИ генераторы картинок

Добавлено: 27 авг 2022, 16:22
Shnatsel
В этом году появились генераторы картинок на нейронных сетях, которые пытаются нарисовать картинку, соответствующую введённому текстовому запросу. Основные - Midjourney, DALL-E 2 от OpenAI, Imagen и Parti от Google, и Stable Diffusion.

На этой неделе наконец-то один из таких генераторов, Stable Diffusion, вышел в свободный доступ. Уже есть сайт с каталогом запросов и результатов - местами очень впечатляющих: https://lexica.art/

Вы можете попробовать это через веб-интерфейс (но там надо ждать каждой картинки несколько минут), или через Google Colab если вы знаете Python, тогда каждая картинка генерируется 20 секунд. Или можно запустить на собственной видеокарте от Nvidia если есть 8 гигабайт видеопамяти.

Я поиграл с этим сам, мои результаты во вложениях. Stable Diffusion пока не умеет обрабатывать сложные запросы, у Parti с этим получше. Эти технологии появились практически из ниоткуда меньше чем за два года, и скорее всего будут очень быстро развиваться.

Re: ИИ генераторы картинок

Добавлено: 27 авг 2022, 16:26
Shnatsel
У меня не получилось добиться от Stable Diffusion картинки с девочкой, едущей на животном-роботе. А вот Parti понимает такие запросы - в приложении картинка сделанная Parti по моему запросу. К сожалению, у публики доступа к Parti пока нет вообще.

Re: ИИ генераторы картинок

Добавлено: 27 авг 2022, 23:59
Shnatsel
Интереснее всего режим перевода из картинки в картинку. Тут тоже можно задавать текстовое описание картинки, включая стиль.

Вот пример, это генератор Stable Diffusion. Это не всегда работает настолько хорошо, к сожалению. Но тем не менее, впечатляюще.

Re: ИИ генераторы картинок

Добавлено: 28 авг 2022, 09:18
Kovur
А если попробовать что-то сложнее?
Львица на шаре
Львенок убегает от стада антилоп
Лев хочет съесть суриката
Лев с черной гривой убегает от гиен

Re: ИИ генераторы картинок

Добавлено: 03 сен 2022, 16:04
Shnatsel
Публично доступные модели - Stable Diffusion, DALL-E 2, Midjourney - плохо справляются со сложными запросами. Методы от Google, особенно Parti, справляются с ними куда лучше, судя по статье и по тому одному запросу, который я попробовал, когда их можно было публиковать.

Теперь у меня есть прямой доступ к Parti и Imagen, но к сожалению я не могу публиковать результаты, или даже публично обсуждать их.