Co je stabilní difúze a jak maximalizovat její sílu

Liam Miller Liam Miller
Čvc 26, 2023 (Aktualizováno: Čvc 26, 2023)Soubor na: Nástroje AI

Pokrok umělé inteligence nyní přebírá některé programy, které pomohou vytvářet obrázky. Můžete vidět nástroj Stabilní difúze. Ale co je stabilní difúze? Toto je nástroj pro generování obrázků. Jeho primárním účelem je vytvářet obrázky pomocí výzev a lidé považují za přitažlivé a zábavné vytvářet různé postavy a prvky společně. Zjistěte více o tom, co je stabilní difúze, a zjistěte, jak funguje.

Část 1: Co je stabilní difúze

Jedná se o model hlubokého učení, model text-to-image, který vytváří obrázky zadáváním výzev k popisu hlavního předmětu. Můžete například zadat „kočka“ a nástroj vygeneruje obrázek kočky. Při zadávání složitých výzev však může dále zdůraznit nebo přidat další podrobnosti. Generativní neuronová síť se stává více než jen nástrojem umělé inteligence, protože je také podmíněna dalšími úkoly, jako je malování, malování a překládání z obrázku na obrázek pomocí textových výzev.

Stable Diffusion byla vyvinuta a financována Stability AI, ale skupina CompVis na Univerzitě Ludwiga Maximiliana v Mnichově má technickou licenci pro model latentní difuze. Vývoj dále vedli výzkumníci Patrick Esser a Robin Rombach, kteří jako podporovatelé projektů získali další tréninková data od neziskových organizací v Německu. Později v říjnu 2022 společnost získala 101 milionů US$ poté, co ji původně představila v srpnu 2022.

Stabilní difúze

Část 2. Co je stabilní difúze VAE

Možná jste se s tím setkali při používání generátoru fotografií AI a nástroj VAE je užitečný. VAE je zkratka pro Variable Auto Encoder, která se používá k jemnému doladění dekodéru pro lepší vykreslení detailů. Je to doplněk k nástroji AI, protože může pomoci získat ostřejší obrázky a živé barvy a zlepšit generování rukou a tváří.

Samozřejmě, VAE je více než jen stabilní difúze, protože všechny modely mají vestavěné VAE pro vypracování detailů. Porovnání bude výsledkem mezi jednotlivými modely a tím, jak dopadnou, když obrázky zkomprimujete. Kromě toho existují samostatné soubory VAE, které si můžete stáhnout do svého zařízení. Chcete-li vyzkoušet jeden dekodér, můžete použít následující:

Soubory Vae

Část 3. Co je Dreambooth na stabilní difúzi a jak nainstalovat

DreamBooth je model generování hlubokého učení, který dolaďuje generované obrázky, zejména konkrétní předmět. Zpočátku je založen na modelu Imagen text-to-image, ale bohužel Imagen nemá předem trénované váhy jako Stable Diffusion nebo jiné nástroje AI. DreamBooth byl dále vyvinut výzkumníky Google a některými kolegy z Bostonské univerzity v roce 2022.

Úkolem modelu je upravovat a dolaďovat generované fotografie, ale je také schopen vykreslit známé předměty v jakémkoli prostředí a situaci. Vzhledem k tomu, že většina předtrénovaných difúzních modelů musí být v této kategorii stále vylepšena, DreamBooth posílí trénink difúzních modelů. S pouhými pěti obrázky lze úpravy obrázků provádět na platformách, jako je Stable Diffusion. Zde je krátký návod, jak používat DreamBooth na Stable Diffusion:

Krok 1.Nejprve musíte mít tréninkové obrázky jednoho předmětu, které chcete použít na DreamBooth. Ujistěte se, že má objekt zachycené snímky. Pokračujte změnou velikosti obrázků na 512 x 512 pixelů.

Krok 2.Otevřete DreamBooth a vstupte Výzva k instanci a Výzva ke třídě. Změny zpracujte kliknutím na Hrát si tlačítko z levé části rozhraní.

Výzva k instanci Dreambooth

Krok 3Až budete hotovi, otestujte jej a obdržíte několik vzorků vygenerovaných modelem. Soubor kontrolního bodu modelu si můžete stáhnout z Disku Google a nainstalovat do GUI.

Test Dreambooth

Část 4. Co je měřítko CFG ve stabilní difúzi

Tuto hodnotu můžete najít v modelu generátoru fotografií. A protože je to nezbytné, musíte se naučit, co stojí za optimalizaci obrázků. Klasifikátor Free Guidance Scale umožňuje uživatelům upravit blízkost výsledku ze vstupního obrázku nebo použitých výzev. Když například upravíte měřítko CFG na lepší hodnotu, výstup se bude více podobat vstupnímu obrazu, ale očekává se, že bude zkreslený. Na druhou stranu, nižší měřítko CGF dostane výstup daleko od primární výzvy a zároveň generuje lepší kvalitu.

Kdy je ale potřeba použít stupnici CFG na Stable Diffusion? Odpověď je jednoduchá: AI fotogenerátor nemůže vytvořit něco, co není v jeho znalostech, takže CFG stupnice vám pomůže spojit více předmětů zvýšením její hodnoty. Jedinou nevýhodou jsou náklady na kvalitu obrazu, která je úměrná výzvám. Máte-li zájem o tento nástroj, musíte si procvičit kalibraci váhy, abyste našli sladké místo.

Měřítko CFG

Část 5. Co je odšumovací síla Stabilní difúze

Tato metoda zahájí proces, který do vstupních obrazů přidá šum. Je to jen a Stabilní difúzní upscaler. Je to vynikající hodnota pro Stable Diffusion, protože se může dostat přes obrázek-obrázek (img2img) nebo InPaint. Množství šumu je řízeno pomocí síly potlačení šumu, od minima 0 do maxima 1. Nastavení hodnoty na 0 sníží šum na žádný a vytvoří podobný obraz jako vstupní obraz. Jinak hodnota 1 nahradí vstup šumem.

Sílu potlačení šumu můžete použít jako praktickou metodu k určení podobnosti výstupu s vlivem vstupních obrázků. Skvělým příkladem je nižší odšumovací síla, díky které budou generované obrázky vypadat blíže vstupu, což je ideální nastavení pro drobné úpravy. Na druhou stranu vyšší odšumovací síla pravděpodobně zvýší variace a zároveň sníží podobnost vstupních a výstupních obrázků. Proto jsou vyšší hodnoty užitečné pro významné úpravy.

Odšumovací síla

Část 6. Co je stabilní difúze přeskakování klipů a jak se používá

CLIP je známý jako vkládací vrstva, která se používá pro analýzu textů. Jeho struktura se skládá z vrstev, které jsou na jednotlivce specifičtější než předchozí. Například vrstva 1 může být „osoba“ a vrstva 2 bude „žena“ nebo „muž“. Pak bude další vrstva „rodič, otec, muž, chlapec atd.

Jeho účelem je získat přesný textový model, který zastaví dlouhý seznam vrstev a nakonec smísí více dat a dá vám více, než potřebujete. Nejlepším příkladem toho je model 1,5 s hloubkou 12 stupňů. Každá vrstva má vložení textu a lze ji smíchat s dalšími detaily, jako je velikost, barva atd. CLIP přeskočí rozměr textového prostoru a dostane se k přesnému výstupu. Postup použití:

Krok 1.Z kontrolního bodu stabilní difúze přejděte do nastavení a vyberte „Stable Diffusion“.

Krok 2.Přejděte dolů a přejděte na „Přeskočit klip“. Nastavte ji na požadovanou hodnotu a poté přejděte nahoru a klikněte na tlačítko „Použít nastavení“.

Přeskočit klip

Část 7. Co je stabilní rychlost generování difúze a jak zrychlit

Když se podíváte na rychlost generátoru AI, budete očekávat, že bude nějakou dobu trvat, než se zobrazí výsledky. Stabilní difúze má však rychlost generování 10 sekund. Toto je pouze pro obecné použití online nástroje, ale čas se může i tak zkrátit až o čtyři sekundy při přihlášení k primárnímu nebo standardnímu plánu. Toto je jeden ze způsobů, jak zrychlit rychlost modelu, ale přesnost výsledku se odchyluje od zadání Výzvy pro stabilní difuzi. Nástroj je navíc zdarma s pouze několika omezeními funkcí oproti cenovým plánům. Jak tedy zrychlíte rychlost generování a přitom neplatíte?

Jediným požadavkem pro akceleraci je karta Nvidia, která může být v řadě 4000, 3000, 2000 a dokonce i 1000. Můžete použít Lovelace, Ampere, Pascal Turing atd. Jako alternativu použijte nižší přesnost, jako je float16, a spusťte méně inferenčních kroků.

Bonusové tipy: Změňte velikost výsledků stabilní difúze

Poté, co jste se dozvěděli o modelu umělé inteligence, je tu ještě jedna věc, kterou musíte vědět: velikost souboru je obrovským faktorem pro obrázky a mohou zabírat váš úložný prostor kvůli větší velikosti souborů. Ale s AnyRec Free Image Compressor online, bude komprese fotografií pohodlná. Online nástroj má nejnovější technologii AI, která pomáhá optimalizovat nahrávání a zároveň zmenšuje velikost souboru. Protože generuje menší soubory, uživatel může importovat více obrázků z místní složky a kompresor je okamžitě načte.

Část 8. Časté dotazy o stabilní difúzi

Závěr

Tento příspěvek vysvětluje co je stabilní difúze a jak to funguje s Clip Skip, VAE, DreamBooth, CFG Scale a Denoising Strength. Na druhou stranu můžete použít AnyRec Free Image Compressor Online ke zmenšení velikosti souborů generovaných obrázků. Je to zcela zdarma a neomezené použití!

Související články: