Mi az a stabil diffúziós CFG skála – az AI eszköz kiegészítése

Liam Miller Liam Miller
2023. augusztus 3. (Frissítve: 2023. augusztus 03.)Beküldve: AI eszközök

A Stable Diffusion egy mesterséges intelligencia fotógenerátor, amely teljesen ingyenes és nyílt forráskódú. Gyors növekedését látva ebben az eszközben számos beállítás található. Például a CFG skála stabil diffúzióban. Sokan azonban még mindig nem tudják, mi ez a beállítás, és hogyan kell használni a képek generálásakor. Nos, tudjon meg többet a CFG skáláról a stabil diffúzióban, ha elolvassa ezt a bejegyzést.

1. rész: Mi a CFG skála a stabil diffúzióban

A CFG vagy Classifier Free Guidance skála az a beállítás, amely hozzájárul a beviteli promptok legközelebbi eredményéhez. A részletesebb magyarázat érdekében, ha nagyobb CFG skálaértéket ad meg, akkor a prompthoz való hasonlóság jobban hasonlít, de minősége torz lesz. Közben ezt meg lehet csinálni másként is, cserébe magasabb minőséggel.

Az alapértelmezett CFG skála értéke 7, hogy egyensúlyba kerüljön a kreatív szabadság és az irány. Másrészt az 1-es érték valószínűleg lehetővé teszi a Stable Diffusion számára a szabadságot, míg a 15-ös és afölötti érték korlátozásokat tartalmaz. Bár az AI képgenerátor maximum 1-től 30-ig korlátozza a CFG-t, a terminálon keresztül beállíthatja a skálát 999-re a stabil diffúzióban, negatív és pozitív egyaránt.

Lehet, hogy egyszerű beállításnak hangzik, de az AI képgenerátor megnehezíti a szabályozást a különféle CFG értékek kompromisszumaival. De a mérleg leghatékonyabb használatához kövesse az alábbi bemutatót a Stable Diffusion használatáról.

2. rész: A CFG-skála használata stabil diffúzióban

Ebben a bemutatóban elkezdheti a kísérletezést a CFG-vel a DreamStudio vagy a Playground alkalmazásban. Azonban több lehetőség is elérhető az Ön számára, például a Stable Diffusion Online Demo, a teljes Stable Diffusion webes felhasználói felület vagy egy minimális beállítás a RunPod.io webhelyen.

1. lépés.Látogassa meg a DreamStudiót, a Lexicát vagy a Playground AI-t, és regisztráljon. A Lexica nem követeli meg a felhasználók regisztrációját, de a másik két platformhoz Gmail vagy Discord fiók szükséges. Miután belépett, írja be a szöveget a prompt mezőbe.

2. lépés.Kattintson a "Létrehozás" gombra, miután elszámolt az utasításokkal. A használt platformtól függően a DreamStudio rendelkezik CFG-skálával, míg a Lexica-ban Guidance Scale. Másrészt a felület jobb oldalán találja a Prompt Guidance on Playground AI-t.

Hogyan készítsünk CFG-skálát

3. lépésÁllítsa be a paramétert ízlése szerint. Ne feledje, hogy a 7 és 11 közötti érték általában optimálisabb kimenettel rendelkezik. De ez továbbra is az Ön igényeitől függ, ezért szánjon időt a kísérletezésre, amíg el nem éri a legjobb eredményt.

CFG azonnali útmutatás

3. rész. Különböző CFG léptékű képek összehasonlítása

Hogyan látja a különbségeket a CFG skála minden beállításánál? A változások láthatóak a kimeneten, különösen, ha kis értékről nagyobbra ugrik. Még ha csak egy platformot használ is, a különbség néhány módosítással megmutatja a torzítást és a minőséget. Ennek bemutatására itt van néhány kép a Stable Diffusion és a CFG skáláról:

CFG skálakülönbség

A képen használt felszólítás: Tom Cruise portréja Stabil diffúziós üzenetek piros öltöny, kiváló minőségű, 4K. Stabil diffúzióban jön létre, meghatározott CFG értékekkel. Ennek eredményeként jobban látható a kép hasonlósága a beviteli prompthoz.

Van néhány dolog, amit a különböző értékeknél láthat. A színtelítettség és a kontraszt a CFG skálaérték hozzáadásával nő. De egy másik ponton, közvetlenül az alapértelmezett érték felett, a kimeneti kép minősége homályosabb lesz, ami részletveszteséget eredményez.

Ha el szeretné kerülni az alacsony minőségű eredményeket, két dolgot tehet. Először növelje a mintavevő lépéseit. De mivel ugyanez a helyzet a CFG-vel, a mintavevő lépései hosszabb feldolgozási időt eredményezhetnek. Ha az első módszer nem kedvez Önnek, módosíthatja a mintavevőket, hogy jobb képrészleteket generáljanak, akár 7-nél nagyobb értéknél is. Íme további minták képek 4K-ra felskálázva bizonyos CFG skálaértékekhez.

CFG képek

Bónusz tippek: Stabil diffúziós CFG képek nagyítása

Ha nem szeretnél többet módosítani a Stable Diffusion-on, akkor a jó minőségű mesterséges intelligencia fotók másik módja a AnyRec AI Image Upscaler. Ez egy online eszköz az AI technológia erejével, és támogatja a népszerű képformátumokat, mint például a PNG, BMP, JPEG, GIF stb. Intuitív kezelőfelületével a fénykép nagyítási szintjét 2x, 4x, 6x és 8x maximális értékre növelheti. Automatikusan helyreállítja a letöltés során fellépő részletes veszteséget, beleértve a képpontokat, színeket, textúrákat stb. Ez a megoldás a képek nagyítására, alkalmas nyomtatásra, grafikai tervezésre és közösségi média megosztásra.

1. lépés.Kattintson a "Fénykép feltöltése" gombra, és válassza ki a képet az eszközéről.

AnyRec Fénykép feltöltése

2. lépés.Válassza ki a nagyítási szintet; ellenőrizze a részleteket a Zoom funkcióval.

AnyRec nagyítás

3. lépésHa elégedett, kattintson a "Mentés" gombra a végeredmény letöltéséhez.

AnyRec Új kép mentése

4. rész: GYIK a CFG-skáláról a stabil diffúzióban

Következtetés

CFG skála stabil diffúzióban a kép eredményének a beviteli prompthoz való közelségének szabályozására szolgál. Míg az olyan platformok, mint a DreamStudio, a Lexica és a Playground AI hatékonyabban kísérleteznek a beállítással, a Stable Diffusion CFG skála magasabb értékét is beállíthatja, és az AnyRec AI Image Upscaler segítségével egy kattintással nagyíthatja a méretet, és visszaállíthatja a részleteket.

Kapcsolódó cikkek: