O que é escala CFG de difusão estável – adição da ferramenta AI

Liam Miller Liam Miller
Ago 03, 2023 (Atualizado: Ago 03, 2023)Arquivado para: Ferramentas de IA

Stable Diffusion é um gerador de fotos de IA totalmente gratuito e de código aberto. Vendo seu rápido crescimento, existem muitas configurações nesta ferramenta. Por exemplo, o Escala CFG em difusão estável. Mas muita gente ainda não sabe o que é essa configuração e como utilizá-la na geração de imagens. Pois bem, descubra mais sobre a escala CFG em Difusão Estável lendo este post.

Parte 1: O que é escala CFG em difusão estável

A escala CFG ou Classifier Free Guidance é a configuração que contribui para o resultado mais próximo dos prompts de entrada. Para uma explicação mais elaborada, colocar um valor maior na escala CFG resultará em uma semelhança mais próxima com o prompt, mas terá qualidade distorcida. Entretanto, isso pode ser feito de outra forma, com uma troca de maior qualidade.

O valor padrão da escala CFG é definido como 7 para equilibrar a liberdade criativa e a direção. Por outro lado, um valor de 1 provavelmente permitirá que a Difusão Estável tenha liberdade, enquanto um valor de 15 e acima terá restrições. Embora o gerador de imagem AI limite o CFG de 1 a 30 no máximo, você pode definir a escala em 999 em Difusão Estável, tanto negativa quanto positiva, por meio do Terminal.

Pode parecer uma configuração simples, mas o gerador de imagens de IA tornará mais difícil o controle com as compensações de vários valores de CFG. Mas para usar a escala de forma mais eficaz, você pode seguir a demonstração abaixo sobre como usá-la na Difusão Estável.

Parte 2. Como usar a escala CFG em difusão estável

Nesta demonstração, você pode começar a experimentar CFG no DreamStudio ou Playground. No entanto, existem mais opções disponíveis para você, como a demonstração online do Stable Diffusion, a interface da Web do Stable Diffusion completa ou uma configuração mínima no RunPod.io.

Passo 1.Visite DreamStudio, Lexica ou Playground AI e inscreva-se. Lexica não exige que os usuários se inscrevam, mas as outras duas plataformas exigem uma conta Gmail ou Discord. Depois de entrar, digite o texto na caixa de prompt.

Passo 2.Clique no botão "Gerar" depois de aceitar as instruções. Dependendo da plataforma que você usar, o DreamStudio terá CFG Scale, enquanto o Lexica terá Guidance Scale. Por outro lado, você pode encontrar Orientação imediata sobre Playground AI na parte direita da interface.

Como escalar CFG

Etapa 3.Ajuste o parâmetro de acordo com sua preferência. Lembre-se de que geralmente entre 7 e 11 valores geralmente há uma saída ideal. Mas ainda depende da sua necessidade, então reserve um tempo para experimentar até obter o melhor resultado.

Como obter orientação imediata do CFG

Parte 3. Comparação de diferentes imagens em escala CFG

Como você vê as diferenças para cada ajuste na escala CFG? As alterações são visíveis na saída, especialmente se você estiver saltando de um valor pequeno para um valor maior. Mesmo se você estiver usando apenas uma plataforma, a diferença será notada na distorção e na qualidade com alguns ajustes. Para demonstrar, aqui estão algumas fotos da difusão estável e da escala CFG:

Diferença de escala CFG

O prompt usado nesta foto é Retrato de Tom Cruise no Prompts de difusão estável de terno vermelho, alta qualidade, 4K. É gerado em difusão estável com valores específicos de CFG. Como resultado, a semelhança da imagem com o prompt de entrada é mais visível.

Existem também algumas coisas que você pode ver para os diferentes valores. A saturação e o contraste da cor aumentam à medida que o valor da escala CFG é adicionado. Mas por outro lado, logo acima do valor padrão colocará a imagem de saída com uma qualidade mais desfocada, resultando em perda de detalhes.

Se quiser evitar resultados de baixa qualidade, há duas coisas que você pode fazer. Primeiro, aumente as etapas do amostrador. Mas como acontece o mesmo com o CFG, as etapas do amostrador podem criar um tempo de processamento mais longo. Se o primeiro método não for um favor para você, você pode alterar os amostradores para gerar melhores detalhes da imagem, mesmo com um valor maior que 7. Aqui estão mais exemplos imagens ampliadas para 4K para determinados valores da escala CFG.

Imagens CFG

Dicas bônus: como ampliar imagens CFG de difusão estável

Se você não quiser fazer mais ajustes no Stable Diffusion, outra maneira de obter fotos de IA de alta qualidade é usar Upscaler de imagem AnyRec AI. É uma ferramenta online com o poder da tecnologia AI, suportando formatos de imagem populares, como PNG, BMP, JPEG, GIF e muito mais. Com sua interface intuitiva, você pode aumentar o nível de ampliação de uma foto em valores máximos de 2x, 4x, 6x e 8x. Ele recuperará automaticamente a perda detalhada no download, incluindo pixels, cores, texturas, etc. Esta é a solução para ampliar imagens, adequada para impressão, design gráfico e compartilhamento em redes sociais.

Passo 1.Clique no botão "Carregar foto" e escolha a imagem do seu dispositivo.

AnyRec Carregar Foto

Passo 2.Escolha o nível de ampliação; verifique os detalhes com a função Zoom.

Ampliação AnyRec

Etapa 3.Clique no botão "Salvar" quando estiver satisfeito para baixar o resultado final.

AnyRec Salvar Nova Imagem

Parte 4: Perguntas frequentes sobre a escala CFG em difusão estável

Conclusão

Escala CFG em difusão estável é usado para controlar a proximidade do resultado da imagem com o prompt de entrada. Embora plataformas como DreamStudio, Lexica e Playground AI sejam mais eficazes na experimentação da configuração, você também pode definir o valor mais alto da escala Stable Diffusion CFG e usar AnyRec AI Image Upscaler para aumentar o tamanho e recuperar os detalhes com um clique.

Artigos relacionados: