Što je stabilna difuzija i kako povećati njezinu snagu

Liam Miller Liam Miller
srp 26, 2023 (Ažurirano: srp 26, 2023)Podneseno na: AI Alati

Napredak umjetne inteligencije sada preuzima neke programe koji će pomoći u stvaranju slika. Možda ćete vidjeti alat Stabilna difuzija. Ali što je stabilna difuzija? Ovo je alat za generiranje slika. Njegova primarna svrha je generiranje slika pomoću upita, a ljudima je privlačno i zabavno generirati različite likove i elemente zajedno. Saznajte više o tome što je stabilna difuzija i saznajte kako funkcionira.

Dio 1: Što je stabilna difuzija

To je model dubokog učenja, tekst-u-sliku, koji stvara slike unosom upita za opisivanje glavne teme. Na primjer, možete staviti 'cat', a alat će generirati sliku mačke. Međutim, može dodatno naglasiti ili dodati više detalja kada unosite složene upite. Generativna neuronska mreža postaje više od AI alata, budući da je također uvjetovana drugim zadacima kao što su iscrtavanje, oslikavanje i prevođenje slike u sliku putem tekstualnih upita.

Stabilnu difuziju je razvio i financirao Stability AI, ali grupa CompVis sa Sveučilišta Ludwig Maximilian u Münchenu ima tehničku licencu za model latentne difuzije. Nadalje, razvoj su vodili istraživači Patrick Esser i Robin Rombach, prikupivši više podataka o obuci od neprofitnih organizacija u Njemačkoj koje podržavaju projekte. Kasnije u listopadu 2022. tvrtka je prikupila $101 milijun US nakon što ju je prvobitno predstavila u kolovozu 2022.

Stabilna difuzija

Dio 2. Što je VAE stabilna difuzija

Možda ste se susreli s ovim prilikom korištenja AI foto generatora, a VAE je od pomoći za alat. VAE je kratica za Variable Auto Encoder, koja se koristi za fino ugađanje dekodera za slikanje boljih detalja. To je dodatak AI alatu, jer može pomoći u dobivanju oštrijih slika i živih boja te poboljšati generiranje ruku i lica.

Naravno, VAE je za više od samo stabilne difuzije jer svi modeli imaju ugrađene VAE za izradu detalja. Usporedba će biti rezultat između svakog modela i kako će ispasti kada komprimirate slike. Štoviše, postoje zasebne VAE datoteke koje možete preuzeti na svoj uređaj. Da biste isprobali jedan dekoder, možete upotrijebiti sljedeće:

Vae datoteke

Dio 3. Što je Dreambooth na Stable Diffusion i kako ga instalirati

DreamBooth je model generiranja dubokog učenja koji fino podešava generirane slike, posebno specifičnu temu. U početku se temelji na Imagenovom modelu pretvaranja teksta u sliku, ali nažalost, Imagen nema unaprijed uvježbane težine poput Stable Diffusion ili drugih AI alata. DreamBooth su dalje razvili Googleovi istraživači i neki kolege sa Sveučilišta u Bostonu 2022.

Rad modela je modificiranje i fino podešavanje generiranih fotografija, ali također je sposoban prikazati poznate subjekte u bilo kojem okruženju i situaciji. Budući da većinu prethodno obučenih modela difuzije još treba poboljšati u ovoj kategoriji, DreamBooth će poboljšati obuku za modele difuzije. Sa samo pet slika, modifikacija slike može se izvršiti s platformama kao što je Stable Diffusion. Evo kratkih uputa o tome kako koristiti DreamBooth na Stable Diffusion:

Korak 1.Prvo, morate imati slike za obuku jedne teme za korištenje na DreamBoothu. Uvjerite se da subjekt ima snimljene slike. Nastavite s promjenom veličine slika na 512x512 piksela.

Korak 2.Otvorite DreamBooth i uđite Instance Prompt i Class Prompt. Obradite promjene klikom na igra gumb s lijeve strane sučelja.

Dreambooth Instance Prompt

3. korakKada završite, testirajte ga i dobit ćete nekoliko uzoraka koje je generirao model. Datoteku kontrolne točke modela možete preuzeti sa svog Google diska i instalirati je u GUI.

Dreambooth test

Dio 4. Što je CFG skala u stabilnoj difuziji

Ovu vrijednost možete pronaći unutar modela generatora fotografija. A budući da je bitno, morate naučiti što je vrijedno optimiziranja slika. Classifier Free Guidance Scale omogućuje korisnicima podešavanje blizine rezultata prema ulaznoj slici ili korištenim uputama. Na primjer, kada prilagodite CFG skalu na bolju vrijednost, izlaz će biti sličniji ulaznoj slici, ali se očekuje da će biti iskrivljen. S druge strane, niža CGF ljestvica udaljit će izlaz od primarnog odziva, a istovremeno će generirati bolju kvalitetu.

Ali kada trebate koristiti CFG ljestvicu na stabilnoj difuziji? Odgovor je jednostavan: AI foto generator ne može stvoriti nešto što nije unutar njegovog znanja, tako da će vam CFG ljestvica pomoći da spojite više subjekata povećanjem njene vrijednosti. Jedina mana je cijena kvalitete slike, koja je proporcionalna upitima. Ako vas zanima ovaj alat, morate vježbati kalibraciju vage kako biste pronašli najbolju točku.

CFG ljestvica

Dio 5. Što je denoising snaga Stabilna difuzija

Ova metoda pokreće proces koji dodaje šum ulaznim slikama. To je samo a Stabilni difuzijski upscaler. To je izvrsna vrijednost za stabilnu difuziju, jer može doći kroz sliku-na-sliku (img2img) ili InPaint. Količina šuma kontrolira se pomoću Snage uklanjanja šuma, od najmanje 0 do najviše 1. Postavljanjem vrijednosti na 0 smanjit će se šum na ništa, stvarajući sliku sličnu ulaznoj slici. Inače će vrijednost 1 zamijeniti ulaz šumom.

Možete koristiti Denoise Strength kao praktičnu metodu za određivanje bliskosti izlaza s utjecajem ulaznih slika. Sjajan primjer je niža snaga uklanjanja šuma koja čini da generirane slike izgledaju bliže ulazu, što je idealna postavka za manje izmjene. S druge strane, veća snaga uklanjanja buke vjerojatno će povećati varijacije uz smanjenje sličnosti ulazne i izlazne slike. Stoga su veće vrijednosti korisne za značajne izmjene.

Denoising Strength

Dio 6. Što je Clip Skip Stable Diffusion i kako se koristi

CLIP je poznat kao sloj za ugradnju koji se koristi za analizu tekstova. Struktura mu je sastavljena od slojeva, koji su po pojedincu specifičniji od prethodnog. Na primjer, sloj 1 može biti "Osoba", a sloj 2 bit će "ženski" ili "muški". Zatim će sljedeći sloj biti "roditelj, otac, muškarac, dječak itd."

Njegova je svrha dobiti precizan tekstualni model, koji zaustavlja dugačak popis slojeva, na kraju miješajući više podataka i dajući vam više nego što vam je potrebno. Najbolji primjer za to je model 1.5 s dubinom od 12 redova. Svaki sloj ima ugrađivanje teksta i može se miješati s drugim detaljima, kao što su veličina, boja itd. CLIP preskače dimenziju prostora teksta i dolazi do točnog izlaza. Evo kako ga koristiti:

Korak 1.Iz kontrolne točke stabilne difuzije idite na postavke i odaberite "Stabilna difuzija".

Korak 2.Pomaknite se prema dolje i idite na "Clip Skip". Postavite je na željenu vrijednost, a zatim se pomaknite prema gore i kliknite gumb "Primijeni postavke".

Isječak Preskoči

Dio 7. Što je stabilna brzina generiranja difuzije i kako ubrzati

Kad pogledate brzinu AI generatora, očekivat ćete da će trebati neko vrijeme da se pokažu rezultati. Međutim, Stabilna difuzija ima brzinu generiranja od 10 sekundi. Ovo je samo za opću upotrebu mrežnog alata, ali vrijeme se ipak može skratiti do četiri sekunde kada se pretplatite na primarni ili standardni plan. Ovo je jedan od načina da se ubrza brzina modela, ali točnost rezultata odmiče od ulaza Upute za stabilnu difuziju. Štoviše, alat je besplatan sa samo nekoliko ograničenja značajki u odnosu na pretplatničke pakete. Dakle, kako ubrzati generiranje brzine bez plaćanja?

Jedini uvjet za ubrzanje je Nvidia kartica, koja može biti u seriji 4000, 3000, 2000, pa čak i 1000. Možete koristiti Lovelace, Ampere, Pascal Turing, itd. Kao alternativu, koristite nižu preciznost kao što je float16 i izvodite manje koraka zaključivanja.

Dodatni savjeti: promijenite veličinu rezultata stabilne difuzije

Nakon što ste naučili o AI modelu, postoji još jedna stvar koju morate znati: veličina datoteke je ogroman čimbenik za slike, a one mogu pojesti vaš prostor za pohranu zbog većih veličina datoteka. Ali sa AnyRec besplatni kompresor slika na mreži, komprimiranje fotografija bit će zgodno. Mrežni alat ima najnoviju AI tehnologiju koja pomaže u optimizaciji prijenosa uz smanjenje veličine datoteke. Kako generira manje datoteke, korisnik može uvesti više slika iz lokalne mape, a kompresor će ih odmah učitati.

Dio 8. Često postavljana pitanja o stabilnoj difuziji

Zaključak

Ovaj post objašnjava što je stabilna difuzija i kako radi s Clip Skip, VAE, DreamBooth, CFG Scale i Denoising Strength. S druge strane, možete koristiti AnyRec Free Image Compressor Online za smanjenje veličine datoteke generiranih slika. Potpuno je besplatan i neograničen za korištenje!

Povezani članci: