4-4 Configuração Avançada
Ajuste fino da sua arte com IA no SeaArt! Domine prompts negativos, VAEs, amostragem, escala CFG, seed e clip skip para controle preciso.
Processo de Criação: Selecionar Modelo - Inserir Prompts - Ajustar Parâmetros - Criar
Prompts Negativos
Geralmente, é difícil para o modelo entender negações nos prompts, como palavras “não”, “sem”, “exceto”. Por isso, precisamos incluir os efeitos indesejados nos Prompts Negativos. Além de adicionar elementos que não queremos na imagem, também podemos incluir palavras como “baixa qualidade”, “pouco detalhado”, “feio”, “deformado”, etc. Isso ajuda a melhorar a qualidade da imagem final. Normalmente, ao gerar imagens, o SeaArt já inclui etiquetas negativas automaticamente.

(pior qualidade, baixa qualidade, qualidade normal, baixa resolução, poucos detalhes, supersaturado, sub-saturado, superexposto, subexposto, escala de cinza, pb, foto ruim, fotografia ruim, arte ruim:1.4), (marca d'água, assinatura, fonte de texto, nome de usuário, erro, logotipo, palavras, letras, dígitos, autógrafo, marca registrada, nome:1.2), (desfocado, borrado, granulado), mórbido, feio, assimétrico, mutado, malformado, mutilado, mal iluminado, sombra ruim, rascunho, cortado, fora do enquadramento, recortado, censurado, artefatos jpeg, fora de foco, falha, duplicado, (mãos ruins, anatomia ruim, corpo ruim, rosto ruim, dentes ruins, braços ruins, pernas ruins, deformidades:1.3)
VAE
O VAE pode ser considerado como um “filtro” que melhora a qualidade da geração de imagens e aprimora os efeitos visuais por meio de algoritmos de otimização. Também pode fazer pequenos ajustes nas formas das imagens. Se notar problemas de cor nas imagens, tente trocar o VAE.

VAEs mais usados:
Automático: Seleciona automaticamente a configuração de VAE mais adequada para a tarefa.
Nenhum: Não utiliza VAE.
vae-ft-mse-840000-ema-pruned: Estilo de cor realista, 840000 indica o número de iterações de treinamento, melhorando a qualidade das imagens geradas, reduzindo a complexidade e aumentando a eficiência.
vae-ft-ema-560000-ema-pruned: Estilo de cor realista, treinado por 560000 iterações, adequado para geração de imagens mais rápida ou com menos recursos.
kl-f8-anime2: Otimizado para gerar imagens em estilo anime.
*Alguns Checkpoints já vêm com VAE embutido, não sendo necessário selecionar separadamente.
Amostragem
Princípio da amostragem
O processo padrão de pintura por IA envolve adição de ruído (forward) e remoção de ruído (backward), restauração e geração do alvo. No processo forward, ruído é adicionado continuamente aos dados de entrada, enquanto o sampler é responsável pela remoção do ruído no processo backward.

Processo forward (da direita para a esquerda): Adiciona ruído gradualmente à imagem original, principalmente durante o treinamento para treinar a capacidade da U-Net de prever ruído.
Processo backward (da esquerda para a direita): Remove gradualmente o ruído estimado pela U-Net treinada, reproduzindo a imagem.
Nesses dois processos, a IA embaralha uma imagem específica e aprende a criar uma nova imagem a partir dela, no sentido inverso. Ou seja, após o treinamento do processo forward, o backward gera uma nova imagem a partir de uma imagem ruidosa.
Antes de gerar uma imagem nítida, o modelo precisa gerar uma imagem aleatória no espaço latente. O preditor de ruído começa subtraindo o ruído previsto da imagem. Com repetições, obtemos uma imagem clara. Todo esse processo é chamado de “amostragem”, e o método utilizado é chamado de sampler ou método de amostragem.
O método de amostragem determina como a remoção de ruído é feita, e diferentes métodos produzem resultados diferentes.
*O valor numérico da semente determina o ruído inicial da primeira imagem gerada.

Método de Amostragem
Solucionadores ODE Clássicos
Euler: Método de Euler, o mais simples.
Heun: Versão mais precisa, porém mais lenta, do Euler.
LMS: Método Linear Multistep, mesma velocidade do Euler, mas mais preciso.
Convergência: Com mais passos de amostragem, os resultados tendem a uma imagem fixa, estabilizando a imagem.
Samplers Ancestrais (nomes com “a”)
Euler a
DPM2 a
DPM++ 2S a
DPM++ 2S a Karras
Esses samplers adicionam ruído a cada passo, trazendo aleatoriedade e não convergindo.
Não convergente: As imagens são aleatórias e podem adicionar detalhes. Para resultados estáveis e reproduzíveis, evite samplers ancestrais.
*Alguns samplers, mesmo sem “a” no nome, também são aleatórios.
DDIM, PLMS (pouco usados atualmente)
DDIM: Denoising Diffusion Implicit Models, primeiro sampler para modelos de difusão.
PLMS: Pseudo Linear Multistep Method, alternativa mais rápida ao DDIM.
Série DPM e DPM++
Esses samplers utilizam bem as tags, ampliando os passos de amostragem para melhores efeitos, mas são mais lentos. DPM++ é uma melhoria do DPM, com resultados mais precisos, porém mais lentos.
Karras: Produz imagens nítidas com menos passos, otimizando o algoritmo.
Restart: Usa menos passos de amostragem para gerar boas imagens em menos tempo.
LCM: Gera imagens rapidamente.

*Recomendado usar:
Euler/Euler a: Rápido, alta qualidade, adequado para a maioria dos cenários, recomendado 15-30 passos.
DPM++2M Karras: Convergente, rápido, boa qualidade (15-25 passos).
DPM++SDE Karras: Não convergente, lento, boa qualidade, ideal para imagens realistas, recomendado 10-15 passos.
DPM++2M SDE Karras: Algoritmo intermediário entre 2M e SDE, não convergente, velocidade um pouco maior.
DPM++ 2M SDE Heun Exponential: Não convergente, imagem suave e limpa, com menos detalhes.
DPM++ 3M SDE Karras
DPM++ 3M SDE Exponential: Mesma velocidade do 2M, requer mais passos, acima de 30 passos, reduza a intensidade do texto (CFG) para melhores resultados.
Restart: Muito rápido, ideal para rascunhos ou verificação de conceito, bons resultados com poucos passos.
LCM: “Renderização em tempo real” em apenas 4 passos, qualidade média, ideal para esboços ou conceitos iniciais.
*Observações
I. Priorize algoritmos recomendados pelo autor do modelo para melhor compatibilidade e eficácia.
II. Priorize algoritmos com sinal de mais, pois são mais estáveis.
III. Se houver ruído nas imagens geradas, tente outro sampler.
Passos de Amostragem
Geralmente, quanto maior o número de etapas de amostragem, melhor a qualidade da imagem. No entanto, cerca de 25 etapas de amostragem normalmente são suficientes para obter imagens de alta qualidade. Aumentar o número de etapas além desse ponto pode gerar imagens diferentes, mas não garante necessariamente uma qualidade melhor. Além disso, um número maior de etapas de amostragem requer mais tempo. Na maioria dos casos, não há necessidade de definir um número excessivamente alto de etapas de amostragem, pois isso apenas aumentaria o tempo de espera.

À medida que o número de etapas de amostragem aumenta, a forma principal da "garota" permanece relativamente consistente, enquanto certos pequenos detalhes, como a qualidade do cabelo, cor, fundo, etc., melhoram com o aumento das etapas. Portanto, o número de etapas de amostragem deve ser ajustado de acordo com as suas próprias necessidades.
CFG Scale (Escala de orientação sem classificador)
A relevância para os prompts: Quanto maior a força do texto, mais próxima a imagem fica dos prompts. Geralmente é definido entre 7 e 10. Se for definido muito alto, pode causar distorções na imagem. Se a imagem gerada não seguir os prompts, você pode aumentar adequadamente a força do texto.
Prompts: foto de corpo inteiro, pose de super-herói, traje biomecânico, formas infláveis, usando implantes épicos de ciborgue biônico, obra-prima, intrincado, guarda-roupa biopunk futurista, altamente detalhado, artstation, arte conceitual, cyberpunk, renderização octane

Semente
Durante o processo de desenho, há uma incerteza significativa na Arte IA, pois cada desenho envolve um conjunto de mecanismos computacionais aleatórios, cada um correspondendo a um valor de semente fixa. Ao fixar o valor da semente, podemos controlar a aleatoriedade dos resultados do desenho.
Por exemplo, se estivermos satisfeitos com uma imagem gerada, podemos preencher seu valor de semente aqui para reproduzir o mesmo conteúdo. Clicar em 'Aleatório' redefine a seed para o padrão -1, enquanto 'Personalização' permite que você insira livremente o valor da semente.

Using the same parameters, prompts, and seed will produce identical images. Therefore, we can utilize the same seed to modify certain parameters, resulting in the generation of new images with the original features.

*Apenas modificando palavras emocionais para mudar a expressão facial, mantendo outras características como cabelo, roupas e fundo inalterados.
Clip Skip (Pular camadas do CLIP)
Camada por camada, os prompts são transformados em números, depois lidos pelo conversor, fornecendo uma compreensão progressivamente detalhada dos prompts.
Se o prompt for: "Uma jovem, vestindo um vestido preto, com um chapéu preto, segurando uma varinha, uma bruxa", quando o Clip Skip está definido como 2, a IA pode omitir os conceitos do vestido preto ou da varinha. À medida que o valor de Clip Skip aumenta, a IA omitirá mais partes do prompt.
Portanto, quando o Clip Skip está definido como 1, significa terminar a imagem a partir da última camada. O resultado incluirá uma descrição completa dos prompts. Quanto mais cedo a terminação, menos descrição será obtida dos prompts, resultando em menor precisão no resultado final. Geralmente é definido como 2.
Para que serve o Clip Skip?
O Clip Skip ajuda a lidar com situações de overfitting, terminando a leitura dos prompts no momento certo. Quando a imagem está com overfitting, o Clip Skip pode ser aumentado.
Ao definir o Clip Skip, você pode ajustar os detalhes e o estilo da Arte IA, tornando o resultado final mais flexível e controlável, atendendo assim a diferentes requisitos de geração de imagens.
Prompts: melhor qualidade, obra-prima, ilustração, brilho bonito e detalhado, sombreamento têxtil, resolução absurda, alta resolução, iluminação dinâmica, detalhes intrincados, olhos bonitos, [luz de fundo], iluminação no rosto, (ponto de vista:1.3), (1 garota, sozinha:1.5), franja assimétrica, cabelo preto, (sorrindo), (calça jeans e camisa)

Last updated