Что такое стабильная диффузия и как максимизировать ее мощность

Лиам Миллер Лиам Миллер
26 июля 2023 г. (Обновлено: 26 июля 2023 г.)Подано в: Инструменты ИИ

Развитие искусственного интеллекта в настоящее время берет верх над некоторыми программами, которые помогут создавать изображения. Вы можете увидеть инструмент «Стабильная диффузия». Но что такое стабильная диффузия? Это инструмент для создания изображений. Его основная цель — создавать изображения с помощью подсказок, и люди находят привлекательным и забавным совместное создание различных персонажей и элементов. Узнайте больше о том, что такое стабильная диффузия, и узнайте, как она работает.

Часть 1: Что такое стабильная диффузия

Это модель глубокого обучения, преобразование текста в изображение, создание изображений путем ввода подсказок для описания основного предмета. Например, вы можете указать «кошка», и инструмент создаст изображение кошки. Тем не менее, он может еще больше подчеркнуть или добавить больше деталей при вводе сложных подсказок. Генеративная нейронная сеть становится больше, чем инструментом искусственного интеллекта, поскольку она также связана с другими задачами, такими как перерисовка, закрашивание и преобразование изображения в изображение с помощью текстовых подсказок.

Stable Diffusion был разработан и профинансирован Stability AI, но группа CompVis из Мюнхенского университета Людвига-Максимилиана имеет техническую лицензию на модель скрытой диффузии. Кроме того, разработку возглавили исследователи Патрик Эссер и Робин Ромбах, которые получили больше обучающих данных от некоммерческих организаций в Германии, поддерживающих проекты. Позже, в октябре 2022 года, компания привлекла $101 миллион долларов США после первоначального представления в августе 2022 года.

Стабильная диффузия

Часть 2. Что такое стабильная диффузия VAE

Возможно, вы сталкивались с этим при использовании генератора фотографий AI, и VAE полезен для этого инструмента. VAE расшифровывается как Variable Auto Encoder и используется для точной настройки декодера для более детальной прорисовки. Это дополнение к инструменту ИИ, поскольку оно может помочь получить более четкие изображения и яркие цвета, а также улучшить генерацию рук и лиц.

Конечно, VAE предназначен не только для стабильной диффузии, потому что все модели имеют встроенные VAE для проработки деталей. Сравнение будет результатом между каждой моделью и тем, как они получатся при сжатии изображений. Более того, есть отдельные файлы VAE, которые вы можете загрузить на свое устройство. Чтобы попробовать один декодер, вы можете использовать следующее:

Вае файлы

Часть 3. Что такое Dreambooth на стабильной диффузии и как установить

DreamBooth — это модель генерации глубокого обучения, которая точно настраивает сгенерированные изображения, особенно для конкретного предмета. Изначально он основан на модели преобразования текста в изображение Imagen, но, к сожалению, Imagen не имеет предварительно обученных весов, таких как Stable Diffusion или других инструментов ИИ. DreamBooth был доработан исследователями Google и некоторыми коллегами из Бостонского университета в 2022 году.

Работа модели заключается в изменении и точной настройке сгенерированных фотографий, но она также способна отображать знакомые объекты в любых условиях и ситуациях. Поскольку большинство предварительно обученных моделей распространения в этой категории все еще нуждаются в улучшении, DreamBooth ускорит обучение моделей распространения. Всего с пятью изображениями модификация изображений может быть выполнена с помощью таких платформ, как Stable Diffusion. Вот краткая инструкция о том, как использовать DreamBooth на стабильной диффузии:

Шаг 1.Во-первых, у вас должны быть обучающие изображения одного объекта для использования в DreamBooth. Убедитесь, что у субъекта есть захваченные изображения. Приступайте к изменению размера изображений до 512x512 пикселей.

Шаг 2.Откройте DreamBooth и введите Подсказка экземпляра а также Подсказка класса. Обработайте изменения, нажав кнопку Играть кнопку в левой части интерфейса.

Подсказка инстанса Dreambooth

Шаг 3.Когда закончите, протестируйте его, и вы получите несколько образцов, сгенерированных моделью. Вы можете загрузить файл контрольной точки модели с вашего Google Диска и установить его в графическом интерфейсе.

Испытание будки мечты

Часть 4. Что такое шкала CFG в стабильной диффузии

Вы можете найти это значение в модели фотогенератора. И поскольку это необходимо, вы должны узнать, что стоит оптимизировать изображения. Шкала бесплатного наведения классификатора позволяет пользователям настраивать близость результата к входному изображению или используемым подсказкам. Например, когда вы настраиваете Масштаб CFG на более высокое значение, выходное изображение будет больше похоже на входное изображение, но ожидается, что оно будет искажено. С другой стороны, более низкий масштаб CGF приведет к удалению вывода от основной подсказки при более высоком качестве.

Но когда вам нужно использовать шкалу CFG на стабильной диффузии? Ответ прост: фотогенератор ИИ не может создать что-то, чего он не знает, поэтому шкала CFG поможет вам соединить несколько объектов, увеличив ее значение. Единственным недостатком является расход качества изображения, который пропорционален подсказкам. Если вы заинтересованы в этом инструменте, вы должны попрактиковаться в калибровке весов, чтобы найти золотую середину.

Шкала CFG

Часть 5. Что такое стабильная диффузия шумоподавления

Этот метод инициирует процесс, который добавляет шум к входным изображениям. это просто Стабильный диффузионный апскейлер. Это отличное значение для стабильной диффузии, поскольку оно может проходить через изображение-в-изображение (img2img) или InPaint. Количество шума контролируется Denoise Strength, от минимума 0 до максимума 1. Установка значения 0 уменьшит шум до нуля, сделав изображение похожим на входное изображение. В противном случае значение 1 заменит ввод шумом.

Вы можете использовать Denoise Strength в качестве практического метода, чтобы определить близость вывода с влиянием входных изображений. Отличным примером является более низкая сила шумоподавления, благодаря которой сгенерированные изображения выглядят ближе к входным данным, что является идеальной настройкой для незначительных модификаций. С другой стороны, более высокая сила шумоподавления, вероятно, увеличит вариативность, уменьшая при этом сходство входного и выходного изображений. Таким образом, более высокие значения полезны для значительных модификаций.

Сила шумоподавления

Часть 6. Что такое Clip Skip Stable Diffusion и как его использовать

CLIP известен как слой внедрения, который используется для анализа текстов. Его структура состоит из слоев, каждый из которых более специфичен, чем предыдущий. Например, Слой 1 может быть «Человек», а Слой 2 может быть «женским» или «мужским». Затем следующим слоем будет «родитель, отец, мужчина, мальчик и т. д.».

Его цель — получить точную текстовую модель, которая останавливает длинный список слоев, в конечном итоге смешивая больше данных и давая вам больше, чем вам нужно. Лучшим примером этого является модель 1.5 с 12 рангами в глубину. Каждый слой имеет встроенный текст и может быть смешан с другими деталями, такими как размер, цвет и т. д. CLIP пропускает размер текстового пространства и получает точный результат. Вот как это использовать:

Шаг 1.В контрольной точке стабильной диффузии перейдите в настройки и выберите «Стабильная диффузия».

Шаг 2.Прокрутите вниз и перейдите к «Clip Skip». Пожалуйста, установите желаемое значение, затем прокрутите вверх, чтобы нажать кнопку «Применить настройки».

Клип Пропустить

Часть 7. Что такое стабильная скорость генерации диффузии и как ее ускорить

Когда вы смотрите на скорость генератора ИИ, вы ожидаете, что потребуется некоторое время, чтобы показать результаты. Тем не менее, Stable Diffusion имеет скорость генерации 10 секунд. Это только для общего использования онлайн-инструмента, но время может сократиться до четырех секунд при подписке на основной или стандартный план. Это один из способов ускорить модель, но точность результата отклоняется от входных данных. Стабильная диффузия подсказок. Более того, инструмент бесплатный с некоторыми ограничениями функций по сравнению с платными планами. Итак, как вы увеличиваете скорость генерации, не платя?

Единственное требование для ускорения — карта Nvidia, которая может быть серий 4000, 3000, 2000 и даже 1000. Вы можете использовать Lovelace, Ampere, Pascal Turing и т. д. В качестве альтернативы используйте более низкую точность, например float16, и выполните меньше шагов вывода.

Бонусные советы: изменение размера результатов стабильной диффузии

Изучив модель ИИ, вы должны знать еще одну вещь: размер файла является важным фактором для изображений, и они могут занимать место в вашем хранилище из-за больших размеров файлов. Но с AnyRec Бесплатный онлайн-компрессор изображений, сжимать фотографии будет удобно. Онлайн-инструмент оснащен новейшей технологией искусственного интеллекта, которая помогает оптимизировать загрузку при уменьшении размера файла. Поскольку он создает файлы меньшего размера, пользователь может импортировать больше изображений из локальной папки, и компрессор мгновенно загрузит их.

Часть 8. Часто задаваемые вопросы о стабильной диффузии

Заключение

Этот пост объясняет что такое стабильная диффузия и как это работает с Clip Skip, VAE, DreamBooth, CFG Scale и Denoising Strength. С другой стороны, вы можете использовать AnyRec Free Image Compressor Online, чтобы уменьшить размер файлов сгенерированных изображений. Это абсолютно бесплатно и неограниченно в использовании!

Статьи по Теме: