10.7 C
Москва
Вторник, 22 октября, 2024

Вышла новая нейросеть Stable Diffusion. Она генерирует картинки по описанию

Дата:

Вышла новая нейросеть Stable Diffusion. Она генерирует картинки по описанию

Разработчики нейросети Stable Diffusion, ранее доступной только в бета-версии, выложили проект в открытый доступ. Теперь пробовать сервис для преобразования текстовых запросов в изображения может любой желающий.

Проще всего протестировать Stable Diffusion на Hugging Face, но на сайте длинные очереди: один запрос обрабатывается примерно за 5 минут. Через платформу DreamStudio всё работает куда быстрее, но нужен аккаунт (авторизоваться можно через учётную запись Google или Discord).

Кроме того, в DreamStudio каждому пользователю даётся ограниченное число кредитов, которые можно тратить на генерацию. Чем больше картинок и выше разрешение, тем дороже выходит каждая итерация. Чтобы восстановить ранее сгенерированные картинки, тоже нужно тратить кредиты, так что долго развлекаться не получится.

Вышла новая нейросеть Stable Diffusion. Она генерирует картинки по описанию

Также проект выложили на GitHub. Пока что для работы требуется компьютер с видеокартой NVIDIA и 6,9 ГБ VRAM, в будущем планируется добавить поддержку видеочипов AMD, включая Apple M1/M2.

Насколько хорошо всё работает? Зависит от пользователя. Чем сложнее и точнее запросы, тем больше шансов на крутые результаты. Например, вот результаты по фразе «Дейенерис Таргариен в свадебном платье с драконом в стиле Альфонса Мухи»:

Вышла новая нейросеть Stable Diffusion. Она генерирует картинки по описанию

Это — «Волшебник Йода в киберпанк-городе».

Вышла новая нейросеть Stable Diffusion. Она генерирует картинки по описанию

А это — «Гарри Поттер ужасы». Пугать-то оно пугает, но совсем не так, как должно было.

Вышла новая нейросеть Stable Diffusion. Она генерирует картинки по описанию

Иными словами, думать вместо себя нейросеть не заставишь: для внятного результата надо самому продумать, что хочешь получить на выходе.

Stable Diffusion позволяет настраивать точность соответствия запросу, число шагов и прочие параметры. Максимально возможное разрешение — 1024 × 1024 пикселя, одновременно можно вывести до 9 картинок. Увеличивать разрешение нейросеть не умеет, для этого придётся полагаться на сторонние программы.

Если опробуете сервис, делитесь результатами в комментариях!

Читать также:
Когда копать картошку и как лучше это делать

Обложка: Лайфхакер, Stable Diffusion

━ Новое на сайте

Умер российский телеведущий Андрей Егоршев

Умер советский и российский теле- и радиоведущий Андрей Егоршев. Он скончался 19 октября в возрасте 59 лет.Об этом пишет «Российская газета».С 1992 по 1999...