В этом году появились генераторы картинок на нейронных сетях, которые пытаются нарисовать картинку, соответствующую введённому текстовому запросу. Основные - Midjourney, DALL-E 2 от OpenAI, Imagen и Parti от Google, и Stable Diffusion.
На этой неделе наконец-то один из таких генераторов, Stable Diffusion, вышел в свободный доступ. Уже есть сайт с каталогом запросов и результатов - местами очень впечатляющих: https://lexica.art/
Вы можете попробовать это через веб-интерфейс (но там надо ждать каждой картинки несколько минут), или через Google Colab если вы знаете Python, тогда каждая картинка генерируется 20 секунд. Или можно запустить на собственной видеокарте от Nvidia если есть 8 гигабайт видеопамяти.
Я поиграл с этим сам, мои результаты во вложениях. Stable Diffusion пока не умеет обрабатывать сложные запросы, у Parti с этим получше. Эти технологии появились практически из ниоткуда меньше чем за два года, и скорее всего будут очень быстро развиваться.
ИИ генераторы картинок
- Shnatsel
- tech support
- Сообщения: 1996
- Зарегистрирован: 16 май 2008, 18:16
- FurSpecies: лев
- Откуда: Moscow
- Контактная информация:
ИИ генераторы картинок
It's the Circle of Life
And it moves us all
Through despair and hope
Through faith and love
And it moves us all
Through despair and hope
Through faith and love
- Shnatsel
- tech support
- Сообщения: 1996
- Зарегистрирован: 16 май 2008, 18:16
- FurSpecies: лев
- Откуда: Moscow
- Контактная информация:
Re: ИИ генераторы картинок
У меня не получилось добиться от Stable Diffusion картинки с девочкой, едущей на животном-роботе. А вот Parti понимает такие запросы - в приложении картинка сделанная Parti по моему запросу. К сожалению, у публики доступа к Parti пока нет вообще.
It's the Circle of Life
And it moves us all
Through despair and hope
Through faith and love
And it moves us all
Through despair and hope
Through faith and love
- Shnatsel
- tech support
- Сообщения: 1996
- Зарегистрирован: 16 май 2008, 18:16
- FurSpecies: лев
- Откуда: Moscow
- Контактная информация:
Re: ИИ генераторы картинок
Интереснее всего режим перевода из картинки в картинку. Тут тоже можно задавать текстовое описание картинки, включая стиль.
Вот пример, это генератор Stable Diffusion. Это не всегда работает настолько хорошо, к сожалению. Но тем не менее, впечатляюще.
Вот пример, это генератор Stable Diffusion. Это не всегда работает настолько хорошо, к сожалению. Но тем не менее, впечатляюще.
It's the Circle of Life
And it moves us all
Through despair and hope
Through faith and love
And it moves us all
Through despair and hope
Through faith and love
- Kovur
- tech support
- Сообщения: 3850
- Зарегистрирован: 04 авг 2003, 00:53
- FurSpecies: Panthera leo
- Откуда: other world
- Контактная информация:
Re: ИИ генераторы картинок
А если попробовать что-то сложнее?
Львица на шаре
Львенок убегает от стада антилоп
Лев хочет съесть суриката
Лев с черной гривой убегает от гиен
Львица на шаре
Львенок убегает от стада антилоп
Лев хочет съесть суриката
Лев с черной гривой убегает от гиен
You must take your place in the circle of life.
- Shnatsel
- tech support
- Сообщения: 1996
- Зарегистрирован: 16 май 2008, 18:16
- FurSpecies: лев
- Откуда: Moscow
- Контактная информация:
Re: ИИ генераторы картинок
Публично доступные модели - Stable Diffusion, DALL-E 2, Midjourney - плохо справляются со сложными запросами. Методы от Google, особенно Parti, справляются с ними куда лучше, судя по статье и по тому одному запросу, который я попробовал, когда их можно было публиковать.
Теперь у меня есть прямой доступ к Parti и Imagen, но к сожалению я не могу публиковать результаты, или даже публично обсуждать их.
Теперь у меня есть прямой доступ к Parti и Imagen, но к сожалению я не могу публиковать результаты, или даже публично обсуждать их.
It's the Circle of Life
And it moves us all
Through despair and hope
Through faith and love
And it moves us all
Through despair and hope
Through faith and love