Hva er stabil diffusjon CFG-skala – AI-verktøyets tillegg

Liam Miller Liam Miller
3. august 2023 (oppdatert: 3. august 2023)Arkivert til: AI-verktøy

Stable Diffusion er en AI-fotogenerator som er helt gratis og åpen kildekode. Når du ser den raske veksten, er det mange innstillinger i dette verktøyet. For eksempel CFG-skala i stabil diffusjon. Men mange mennesker vet fortsatt ikke hva denne innstillingen er og hvordan de skal bruke den når de genererer bilder. Vel, finn ut mer om CFG-skalaen i Stable Diffusion ved å lese dette innlegget.

Del 1: Hva er CFG-skala i stabil diffusjon

CFG eller Classifier Free Guidance-skala er innstillingen som bidrar til det nærmeste resultatet av inndatameldingene. For en mer forseggjort forklaring vil å sette en større CFG-skalaverdi resultere i en nærmere likhet med ledeteksten, men den vil bli forvrengt i kvalitet. I mellomtiden kan dette gjøres på annen måte, med høyere kvalitet i bytte.

Standard CFG-skalaverdi er satt til 7 for å balansere den kreative friheten og retningen. På den annen side vil en verdi på 1 sannsynligvis tillate stabil diffusjon å ha frihet, mens en verdi på 15 og høyere vil ha begrensninger. Selv om AI-bildegeneratoren begrenser CFG fra 1 til 30 maksimalt, kan du sette skalaen til 999 i stabil diffusjon, både negativ og positiv, via terminalen.

Det kan høres ut som en enkel innstilling, men AI-bildegeneratoren vil gjøre det vanskeligere å kontrollere med avveininger fra ulike CFG-verdier. Men for å bruke skalaen mest effektivt, kan du følge demonstrasjonen nedenfor om hvordan du bruker den på Stable Diffusion.

Del 2. Hvordan bruke CFG-skala i stabil diffusjon

I denne demonstrasjonen kan du begynne å eksperimentere med CFG på DreamStudio eller Playground. Det er imidlertid flere alternativer tilgjengelig for deg, for eksempel Stable Diffusion Online Demo, full Stable Diffusion Web UI eller et minimalt oppsett på RunPod.io.

Trinn 1.Besøk DreamStudio, Lexica eller Playground AI og registrer deg. Lexica krever ikke at brukere registrerer seg, men de to andre plattformene krever en Gmail- eller Discord-konto. Når du er inne, skriv inn teksten i ledetekstboksen.

Steg 2.Klikk på "Generer"-knappen når du har slått deg til ro med instruksjonene. Avhengig av plattformen du bruker, vil DreamStudio ha CFG Scale, mens Lexica har Guidance Scale. På den annen side kan du finne prompt veiledning om Playground AI på høyre del av grensesnittet.

Slik skalerer du CFG

Trinn 3.Juster parameteren etter din smak. Husk at mellom 7 og 11 verdier vanligvis gir mer optimal effekt. Men det avhenger fortsatt av dine krav, så ta deg god tid med eksperimentering til du har det beste resultatet.

Hvordan CFG rask veiledning

Del 3. Sammenligning av forskjellige CFG-skalabilder

Hvordan ser du forskjellene for hver justering på CFG-skalaen? Endringene er synlige for utdataene, spesielt hvis du hopper fra en liten verdi til en større. Selv om du bare bruker én plattform, vil forskjellen fortelle forvrengningen og kvaliteten med noen få justeringer. For å demonstrere, her er noen bilder fra stabil diffusjon og CFG-skala:

CFG-skalaforskjell

Spørsmålet som brukes i dette bildet er Portrait of Tom Cruise in the Stabil diffusjonsmelding av rød drakt, høy kvalitet, 4K. Den genereres i stabil diffusjon med spesifikke CFG-verdier. Som et resultat er likheten mellom bildet og inndatameldingen mer synlig.

Det er også noen ting du kan se for de forskjellige verdiene. Fargemetning og kontrast økes når CFG-skalaverdien legges til. Men på et annet punkt, rett over standardverdien vil sette utgangsbildet til en mer uskarp kvalitet, noe som resulterer i tap av detaljer.

Hvis du vil unngå resultater av lav kvalitet, er det to ting du kan gjøre. Øk først prøvetakerens trinn. Men siden det er det samme med CFG, kan sampler-trinn skape lengre behandlingstid. Hvis den første metoden ikke er en tjeneste for deg, kan du endre samplerne for å generere bedre bildedetaljer, selv ved en høyere verdi enn 7. Her er flere eksempler bilder oppskalert til 4K for visse CFG-skalaverdier.

CFG-bilder

Bonustips: Hvordan forstørre stabile diffusjons-CFG-bilder

Hvis du ikke vil gjøre mer justering på Stable Diffusion, er en annen måte å få AI-bilder av høy kvalitet på å bruke AnyRec AI Image Upscaler. Det er et nettbasert verktøy med kraften til AI-teknologi, som støtter populære bildeformater, som PNG, BMP, JPEG, GIF og mer. Med det intuitive grensesnittet kan du øke forstørrelsesnivået til et bilde med 2x, 4x, 6x og 8x maksimale verdier. Den vil automatisk gjenopprette det detaljerte tapet ved nedlasting, inkludert piksler, farger, teksturer osv. Dette er løsningen for å forstørre bilder, egnet for utskrift, grafisk design og deling av sosiale medier.

Trinn 1.Klikk på "Last opp bilde"-knappen og velg bildet fra enheten din.

AnyRec Last opp bilde

Steg 2.Velg forstørrelsesnivå; sjekk detaljene med zoomfunksjonen.

AnyRec forstørrelse

Trinn 3.Klikk på "Lagre"-knappen når du er fornøyd for å laste ned det endelige resultatet.

AnyRec Lagre nytt bilde

Del 4: Vanlige spørsmål om CFG-skala i stabil diffusjon

Konklusjon

CFG-skala i stabil diffusjon brukes til å kontrollere hvor nærhet bilderesultatet er til inndatameldingen. Mens plattformer som DreamStudio, Lexica og Playground AI er mer effektive når det gjelder å eksperimentere med innstillingen, kan du også stille inn Stable Diffusion CFG-skalaen høyere verdi og bruke AnyRec AI Image Upscaler for å forstørre størrelsen og gjenopprette detaljene med ett klikk.

Relaterte artikler: