Wat is stabiele diffusie en hoe kan de kracht ervan worden gemaximaliseerd?

Liam Miller Liam Miller
26 juli 2023 (Bijgewerkt: 26 juli 2023)ingediend bij: AI-tools

De opmars van de kunstmatige intelligentie neemt nu enkele programma’s over die helpen bij het genereren van afbeeldingen. Mogelijk ziet u de tool Stabiele diffusie. Maar wat is stabiele diffusie? Dit is een hulpmiddel voor het genereren van afbeeldingen. Het primaire doel is om afbeeldingen te genereren met behulp van aanwijzingen, en mensen vinden het aantrekkelijk en leuk om verschillende karakters en elementen samen te genereren. Lees meer over wat stabiele diffusie is en ontdek hoe het werkt.

Deel 1: Wat is stabiele diffusie

Het is een diepgaand lerend, tekst-naar-beeldmodel, waarbij afbeeldingen worden gemaakt door aanwijzingen in te voeren om het hoofdonderwerp te beschrijven. Als u bijvoorbeeld 'kat' invoert, genereert de tool een afbeelding van een kat. Het kan echter meer details benadrukken of toevoegen wanneer u complexe aanwijzingen invoert. Het generatieve neurale netwerk wordt meer dan een AI-tool, omdat het ook wordt geconditioneerd met andere taken zoals outpainting, inpainting en beeld-naar-beeldvertaling via tekstprompts.

Stable Diffusion is ontwikkeld en gefinancierd door Stability AI, maar de CompVis-groep van de Ludwig Maximilian Universiteit van München heeft de technische licentie voor het latente diffusiemodel. Bovendien werd de ontwikkeling geleid door de onderzoekers Patrick Esser en Robin Rombach, die meer trainingsgegevens verzamelden van non-profitorganisaties in Duitsland als ondersteuners van de projecten. Later in oktober 2022 haalde het bedrijf $101 miljoen op, nadat het het aanvankelijk in augustus 2022 had geïntroduceerd.

Stabiele diffusie

Deel 2. Wat is VAE-stabiele diffusie

Mogelijk bent u dit tegengekomen bij het gebruik van de AI-fotogenerator, en VAE is nuttig voor de tool. VAE staat voor Variable Auto Encoder, gebruikt om de decoder te verfijnen om betere details te schilderen. Het is een aanvulling op de AI-tool, omdat het kan helpen scherpere beelden en levendige kleuren te krijgen en de generatie van handen en gezichten te verbeteren.

Natuurlijk is VAE voor meer dan alleen stabiele diffusie, omdat alle modellen ingebouwde VAE's hebben om de details uit te werken. De vergelijking zal het resultaat zijn tussen elk model en hoe ze eruit zullen zien als u de afbeeldingen comprimeert. Bovendien zijn er aparte VAE-bestanden die u op uw apparaat kunt downloaden. Om één decoder te proberen, kunt u het volgende gebruiken:

Vae-bestanden

Deel 3. Wat is Dreambooth op het gebied van stabiele diffusie en hoe te installeren

DreamBooth is een deep learning-generatiemodel dat gegenereerde afbeeldingen verfijnt, vooral het specifieke onderwerp. In eerste instantie is het gebaseerd op het tekst-naar-afbeelding-model van Imagen, maar helaas beschikt Imagen niet over de vooraf getrainde gewichten zoals Stable Diffusion of andere AI-tools. DreamBooth werd in 2022 verder ontwikkeld door Google Researchers en enkele collega's van Boston University.

Het model heeft tot taak gegenereerde foto's aan te passen en te verfijnen, maar het is ook in staat bekende onderwerpen in elke omgeving en situatie weer te geven. Omdat de meeste vooraf getrainde diffusiemodellen in deze categorie nog moeten worden verbeterd, zal DreamBooth de training voor diffusiemodellen een impuls geven. Met slechts vijf afbeeldingen kan beeldaanpassing worden uitgevoerd met platforms zoals Stable Diffusion. Hier is een korte instructie over het gebruik van DreamBooth op stabiele diffusie:

Stap 1.Ten eerste moet u trainingsafbeeldingen van één onderwerp hebben om op DreamBooth te gebruiken. Zorg ervoor dat er foto's zijn gemaakt van het onderwerp. Ga verder met het wijzigen van het formaat van de afbeeldingen naar 512x512 pixels.

Stap 2.Open DreamBooth en ga naar binnen Instantieprompt en Klasseprompt. Verwerk de wijzigingen door op de knop te klikken Toneelstuk knop aan de linkerkant van de interface.

Dreambooth-instantieprompt

Stap 3.Als u klaar bent, test u het en ontvangt u een paar voorbeelden die door het model zijn gegenereerd. U kunt het modelcontrolepuntbestand downloaden van uw Google Drive en in de GUI installeren.

Dreambooth-test

Deel 4. Wat is CFG-schaal in stabiele diffusie

U kunt deze waardeset vinden in het fotogeneratormodel. En aangezien het essentieel is, moet u leren wat de moeite waard is om afbeeldingen te optimaliseren. Met Classifier Free Guidance Scale kunnen gebruikers de nabijheid van het resultaat aanpassen aan de hand van de invoerafbeelding of de gebruikte aanwijzingen. Als u bijvoorbeeld de CFG-schaal instelt op een uitstekende waarde, zal de uitvoer meer lijken op de invoerafbeelding, maar zal deze naar verwachting vervormd zijn. Aan de andere kant zorgt een lagere CGF-schaal ervoor dat de output ver weg ligt van de primaire prompt, terwijl er een betere kwaliteit wordt gegenereerd.

Maar wanneer moet je de CFG-schaal gebruiken voor stabiele diffusie? Het antwoord is simpel: de AI-fotogenerator kan niet iets creëren dat niet binnen zijn kennis ligt, dus de CFG-schaal zal je helpen meerdere onderwerpen samen te voegen door de waarde ervan te verhogen. Het enige nadeel zijn de kosten van de beeldkwaliteit, die evenredig zijn aan de aanwijzingen. Als u geïnteresseerd bent in deze tool, moet u oefenen met het kalibreren van de weegschaal om de goede plek te vinden.

CFG-schaal

Deel 5. Wat is ruisonderdrukking Sterkte Stabiele diffusie

Deze methode initieert een proces dat ruis aan de invoerbeelden toevoegt. Het is gewoon een Stabiele diffusie-opschaler. Het is een uitstekende waarde voor stabiele diffusie, omdat het via image-to-image (img2img) of InPaint kan komen. De hoeveelheid ruis wordt geregeld door Denoise Strength, van minimaal 0 tot maximaal 1. Als u de waarde op 0 zet, wordt de ruis tot nul gereduceerd, waardoor een beeld ontstaat dat vergelijkbaar is met het invoerbeeld. Anders zal de waarde 1 de invoer vervangen door ruis.

U kunt Denoise Strength gebruiken als een praktische methode om te bepalen in hoeverre de uitvoer nauw aansluit bij de invloed van de invoerbeelden. Een goed voorbeeld is een lagere ruisonderdrukkingssterkte waardoor gegenereerde afbeeldingen dichter bij de invoer lijken, een ideale instelling voor kleine aanpassingen. Aan de andere kant zal een hogere ruisonderdrukkingssterkte waarschijnlijk de variatie vergroten terwijl de gelijkenis tussen de invoer- en uitvoerbeelden wordt verminderd. Daarom zijn hogere waarden nuttig voor significante wijzigingen.

Denoising kracht

Deel 6. Wat is Clip Skip Stable Diffusion en hoe te gebruiken

CLIP staat bekend als een inbeddingslaag die wordt gebruikt voor het analyseren van teksten. De structuur is samengesteld uit lagen, die per individu specifieker zijn dan de vorige. Laag 1 kan bijvoorbeeld 'Persoon' zijn en Laag 2 'vrouwelijk' of 'mannelijk'. Vervolgens zal de volgende laag 'ouder, vader, man, jongen, enz.' zijn.

Het doel ervan is om het precieze tekstmodel te krijgen, dat de lange lijst met lagen stopt, waardoor uiteindelijk meer gegevens worden gemengd en u meer krijgt dan u nodig heeft. Het beste voorbeeld hiervan is het 1.5-model met 12 rijen diep. Elke laag heeft tekstinsluiting en kan worden gemengd met andere details, zoals grootte, kleur, enz. CLIP slaat de afmeting van de tekstruimte over en krijgt de exacte uitvoer. Hier ziet u hoe u het kunt gebruiken:

Stap 1.Ga vanuit het Stabiele Diffusiecontrolepunt naar instellingen en selecteer “Stabiele Diffusie”.

Stap 2.Scroll naar beneden en ga naar “Clip Skip”. Stel deze in op de gewenste waarde, scroll vervolgens omhoog en klik op de knop 'Instellingen toepassen'.

Clip overslaan

Deel 7. Wat is stabiele diffusie die snelheid genereert en hoe te versnellen

Als je naar de snelheid van een AI-generator kijkt, verwacht je dat het enige tijd zal duren voordat resultaten zichtbaar zijn. Stabiele diffusie heeft echter een generatiesnelheid van 10 seconden. Dit is alleen voor algemeen gebruik van de online tool, maar de tijd kan nog steeds oplopen tot vier seconden bij het abonneren op het primaire of standaardabonnement. Dit is een manier om de snelheid van het model te versnellen, maar de nauwkeurigheid van het resultaat wijkt af van de invoer Stabiele diffusie-aanwijzingen. Bovendien is de tool gratis met slechts enkele functiebeperkingen ten opzichte van de geprijsde abonnementen. Dus, hoe versnel je de opwekkingssnelheid zonder te betalen?

De enige vereiste voor acceleratie is een Nvidia-kaart, die uit de 4000-, 3000-, 2000- en zelfs 1000-serie kan komen. U kunt Lovelace, Ampere, Pascal Turing, enz. gebruiken. Als alternatief kunt u een lagere precisie gebruiken, zoals float16, en minder gevolgtrekkingsstappen uitvoeren.

Bonustips: Wijzig de grootte van stabiele diffusieresultaten

Nadat u het AI-model heeft leren kennen, is er nog één ding dat u moet weten: de bestandsgrootte is een enorme factor voor afbeeldingen, en ze kunnen uw opslagruimte in beslag nemen vanwege de grotere bestandsgroottes. Maar met AnyRec gratis beeldcompressor online, is het handig om de foto's te comprimeren. De online tool beschikt over de nieuwste AI-technologie om de uploads te helpen optimaliseren en tegelijkertijd de bestandsgrootte te verkleinen. Omdat het kleinere bestanden genereert, kan de gebruiker meer afbeeldingen uit de lokale map importeren, en de compressor laadt ze onmiddellijk.

Deel 8. Veelgestelde vragen over stabiele diffusie

Conclusie

Dit bericht legt het uit wat is stabiele diffusie en hoe het werkt met Clip Skip, VAE, DreamBooth, CFG Scale en Denoising Strength. Aan de andere kant kunt u AnyRec Free Image Compressor Online gebruiken om de bestandsgrootte van de gegenereerde afbeeldingen te verkleinen. Het is geheel gratis en onbeperkt te gebruiken!

Gerelateerde artikelen: