Hvad er stabil diffusions-CFG-skala – AI-værktøjets tilføjelse

Liam Miller Liam Miller
3. august 2023 (Opdateret: 3. august 2023)Arkiveret til: AI værktøjer

Stable Diffusion er en AI-fotogenerator, der er helt gratis og open source. Når du ser dens hurtige vækst, er der mange indstillinger i dette værktøj. For eksempel CFG-skala i stabil diffusion. Men mange mennesker ved stadig ikke, hvad denne indstilling er, og hvordan man bruger den, når de genererer billeder. Nå, find ud af mere om CFG-skalaen i Stable Diffusion ved at læse dette indlæg.

Del 1: Hvad er CFG-skala i stabil diffusion

CFG eller Classifier Free Guidance-skalaen er den indstilling, der bidrager til det nærmeste resultat af input-prompterne. For en mere uddybende forklaring vil en større CFG-skalaværdi resultere i en tættere lighed med prompten, men den vil være forvrænget i kvalitet. I mellemtiden kan dette gøres på anden måde, med en højere kvalitet til gengæld.

Standardværdien af CFG-skalaen er sat til 7 for at balancere den kreative frihed og retningen. På den anden side vil en værdi på 1 sandsynligvis tillade stabil diffusion at have frihed, mens en værdi på 15 og derover vil have begrænsninger. Selvom AI-billedgeneratoren begrænser CFG fra 1 til 30 maksimalt, kan du indstille skalaen til 999 i stabil diffusion, både negativ og positiv, via terminalen.

Det lyder måske som en ligetil indstilling, men AI-billedgeneratoren vil gøre det sværere at kontrollere med afvejningen fra forskellige CFG-værdier. Men for at bruge vægten mest effektivt, kan du følge nedenstående demonstration om, hvordan du bruger den på Stable Diffusion.

Del 2. Sådan bruges CFG-skala i stabil diffusion

I denne demonstration kan du begynde at eksperimentere med CFG på DreamStudio eller Playground. Der er dog flere muligheder tilgængelige for dig, såsom Stable Diffusion Online Demo, fuld Stable Diffusion Web UI eller en minimal opsætning på RunPod.io.

Trin 1.Besøg DreamStudio, Lexica eller Playground AI og tilmeld dig. Lexica kræver ikke, at brugerne tilmelder sig, men de to andre platforme kræver en Gmail- eller Discord-konto. Når du er inde, skal du indtaste teksten i promptboksen.

Trin 2.Klik på "Generer"-knappen, når du har afklaret med meddelelserne. Afhængigt af den platform du bruger, vil DreamStudio have CFG Scale, mens Lexica har Guidance Scale. På den anden side kan du finde hurtig vejledning om Playground AI i højre del af grænsefladen.

Sådan skalerer du CFG

Trin 3.Juster parameteren efter din smag. Husk, at mellem 7 og 11 værdier normalt har mere optimalt output. Men det afhænger stadig af dit krav, så tag dig god tid til at eksperimentere, indtil du har det bedste resultat.

Sådan CFG hurtig vejledning

Del 3. Sammenligning af forskellige CFG-skalabilleder

Hvordan ser du forskellene for hver justering på CFG-skalaen? Ændringerne er synlige for outputtet, især hvis du hopper fra en lille værdi til en større. Selvom du kun bruger én platform, vil forskellen fortælle forvrængning og kvalitet med et par tweaks. For at demonstrere er her nogle billeder fra stabil diffusion og CFG-skala:

CFG-skalaforskel

Den prompt, der bruges på dette billede, er Portræt af Tom Cruise i Stabil diffusion prompter af rødt jakkesæt, høj kvalitet, 4K. Det genereres i stabil diffusion med specifikke CFG-værdier. Som et resultat er billedets lighed med inputprompten mere synlig.

Der er også nogle ting, du kan se for de forskellige værdier. Farvemætning og kontrast øges, når CFG-skalaværdien tilføjes. Men på et andet punkt vil lige over standardværdien bringe outputbilledet til en slørere kvalitet, hvilket resulterer i tab af detaljer.

Hvis du vil undgå resultater af lav kvalitet, er der to ting, du kan gøre. Forøg først prøvetagningstrinnene. Men da det er det samme med CFG, kan sampler-trin skabe længere behandlingstid. Hvis den første metode ikke er en fordel for dig, kan du ændre samplerne for at generere bedre billeddetaljer, selv ved en større værdi end 7. Her er flere eksempler billeder opskaleret til 4K for visse CFG-skalaværdier.

CFG billeder

Bonustips: Sådan forstørres stabile diffusions-CFG-billeder

Hvis du ikke ønsker at lave flere justeringer på Stable Diffusion, så er en anden måde at få AI-billeder af høj kvalitet på at bruge AnyRec AI Image Upscaler. Det er et onlineværktøj med kraften fra AI-teknologi, der understøtter populære billedformater, såsom PNG, BMP, JPEG, GIF og mere. Med dens intuitive grænseflade kan du øge forstørrelsesniveauet for et billede ved 2x, 4x, 6x og 8x maksimumværdier. Det vil automatisk gendanne det detaljerede tab ved download, herunder pixels, farver, teksturer osv. Dette er løsningen til at forstørre billeder, velegnet til udskrivning, grafisk design og deling på sociale medier.

Trin 1.Klik på knappen "Upload billede", og vælg billedet fra din enhed.

AnyRec Upload billede

Trin 2.Vælg forstørrelsesniveau; tjek detaljerne med zoomfunktionen.

AnyRec Forstørrelse

Trin 3.Klik på knappen "Gem", når du er tilfreds, for at downloade det endelige resultat.

AnyRec Gem nyt billede

Del 4: Ofte stillede spørgsmål om CFG-skala i stabil diffusion

Konklusion

CFG-skala i stabil diffusion bruges til at kontrollere, hvor tæt billedresultatet er til inputprompten. Mens platforme som DreamStudio, Lexica og Playground AI er mere effektive til at eksperimentere med indstillingen, kan du også indstille Stable Diffusion CFG-skalaen højere værdi og bruge AnyRec AI Image Upscaler til at forstørre størrelsen og gendanne detaljerne med et enkelt klik.

Relaterede artikler: