2-1 Texto para Imagem

Aprenda o que é texto para imagem e como usar o gerador de texto para imagem com IA com instr

Você já encontrou problemas semelhantes ao usar o SeaArt: o efeito de controle não é ideal, ou os resultados do desenho não refletem os prompts adicionados, entre outros? Neste artigo, vamos apresentar de forma abrangente como dominar a operação de texto para imagem e entender a estratégia de escrever prompts eficientes.

O que é Texto para Imagem?

No SeaArt AI, existem três modos de desenho: Texto para Imagem, Imagem para Imagem e ControINet.

Os passos básicos para desenhar são: selecionar um modelo → inserir prompts → definir parâmetros → Criar.

O modelo determina o estilo, os prompts definem o conteúdo da imagem e os parâmetros refinam as características predefinidas da imagem.

Escrita Básica e Avançada de Prompts

O que é um Prompt? Como Escrever um Bom Prompt?

Um prompt é uma descrição textual que orienta a IA a gerar conteúdo. Um bom prompt deve ser claro e específico, cobrindo aspectos-chave como estilo, conteúdo e detalhes. Exemplo: "Estilo anime japonês, garota, debaixo de uma cerejeira, sorrindo, dia ensolarado." Recomendamos consultar exemplos da comunidade e construir experiência gradualmente.

Sintaxe e Estrutura Básica de Prompt

● Use vírgulas para separar palavras-chave; a ordem das palavras afeta os resultados.

● Use parênteses ou pesos para enfatizar palavras-chave, por exemplo, (gato:1.2).

● Há suporte multilíngue, mas o inglês ou o idioma recomendado pela plataforma é preferível.

● Use prompts negativos para excluir elementos indesejados.

Como Definir Pesos de Prompt (Explicação Detalhada)

A ponderação enfatiza a importância das palavras-chave. Formato comum: (palavra-chave:1.5) significa peso = 1.5 (maior influência).

Várias palavras-chave podem ter pesos individuais, por exemplo, (gato:1.2), (cachorro:0.8).

O suporte pode variar ligeiramente entre modelos; consulte a documentação ou dicas da comunidade.

Como Usar Prompts Negativos

No campo de prompt negativo, insira elementos indesejados como: "borrado, baixa qualidade, marca d'água". Use pesos para reforçar exclusões, por exemplo, (múltiplas pessoas:1.5), para controlar retratos solo.

Prompts negativos são especialmente úteis quando alguns modelos têm dificuldade em entender detalhes específicos (por exemplo, estruturas das mãos), pois ajudam a evitar esses elementos e melhoram a qualidade da imagem.

Por exemplo, inclua: (mãos ruins, anatomia ruim, corpo ruim, rosto ruim, dentes ruins, braços ruins, pernas ruins, deformidades: 1.3)

Entrada de Prompts: forma de linguagem/frase natural

Linguagem natural: Uma garota de cabelo preto dançando

Forma de frase: Uma garota, cabelo preto, dançando

O papel dos prompts é guiar e auxiliar o modelo no processo de desenho, e não ser um requisito rígido. Mesmo que sua entrada seja apenas uma frase casual, o modelo ainda pode criar uma imagem para você, e o resultado pode mesmo ser muito bom.

*Prompts ricos podem controlar melhor o efeito final da saída. No processo de ajuste fino posterior, palavras-chave específicas podem ser rapidamente modificadas e verificadas quanto ao seu impacto no resultado do desenho.

Fórmula Universal de Prompt

Um prompt eficaz é como atribuir uma tarefa ao gerador de arte com IA. Se a instrução for vaga, como apenas dizer “desenhe uma imagem” sem especificar elementos e propósito, o resultado geralmente é imprevisível. Portanto, instruções detalhadas e específicas podem melhorar muito a qualidade e relevância do resultado.

Por exemplo, se o prompt simplesmente disser "uma garota", não menciona a roupa da garota, o cenário, o ângulo da câmera, etc., e a IA só pode agir com base na experiência histórica do modelo durante o treinamento. Graças às capacidades do modelo, os resultados ainda podem ser bons. No entanto, se houver requisitos específicos para o conteúdo da imagem, tal eficiência é muito baixa.

Quando adicionamos outras palavras descritivas para o conteúdo, a imagem se torna muito mais estável.

Uma fórmula de prompt ideal inclui elementos como conteúdo principal, fundo ambiental, composição, configurações da imagem e estilo de referência, cada um afetando o resultado do desenho em diferentes graus.

*Esta fórmula é uma referência, não uma regra rígida para toda criação de prompt. Primeiro, determine o impacto do conteúdo principal, depois otimize os detalhes conforme suas necessidades.

Conteúdo principal: Descreve o assunto principal, como pessoas ou animais, suas roupas, expressões, pelos, ações ou o material dos objetos. Criar vários sujeitos juntos pode causar problemas; recomenda-se criar cada sujeito separadamente e depois usar a geração ControINet para integração.
Fundo ambiental: Define o cenário e elementos auxiliares como cor do céu, arredores, iluminação e tom de cor, melhorando a atmosfera da imagem e destacando seu tema.
Composição dos planos: Ajusta o ângulo da câmera e a perspectiva, como ênfase na profundidade de campo ou disposição dos objetos, aumentando significativamente o impacto visual.
Configurações da imagem: Incluem termos para aumentar a expressividade visual, como riqueza de detalhes, qualidade fotográfica e efeito cinematográfico. A resolução e o nível de detalhes são determinados principalmente pelo tamanho, com técnicas de pós-processamento como Upscale para aprimorar ainda mais os detalhes.
Estilo de referência: Descreve o estilo artístico e o clima desejados, como mencionar o nome de um artista, técnicas de arte, época ou cores. No entanto, o estilo da imagem é amplamente determinado pelo modelo; se o modelo não foi treinado com palavras-chave de estilos artísticos específicos, pode não entendê-las. Para requisitos de estilo específicos, usar um modelo treinado nesse estilo pode trazer melhores resultados do que apenas usar prompts.

Remix: Se você achar a escrita de prompts muito complexa, pode buscar inspiração nas imagens geradas por IA na página inicial e usar o recurso de reutilização com um clique dos parâmetros e prompts existentes para simplificar o processo de criação.

Prompts Enfatizados

A ênfase nos prompts depende de parênteses e valores numéricos para controlar o peso de prompts específicos. Quanto maior o valor do peso, mais o modelo prioriza aquele prompt, focando em renderizar essa parte durante o processo. Assim, a imagem final refletirá mais as informações correspondentes. Por outro lado, menos ênfase resultará em menor representação desse conteúdo na imagem.

Um método é aumentar o peso usando parênteses, e o outro é inserir diretamente valores numéricos, sendo este último o mais utilizado.

Existem três tipos de parênteses para controlar o peso das palavras-chave:

Parênteses redondos ( ): Cada camada aumenta o peso original em 1,1 vezes.
Colchetes [ ]: Cada camada reduz o peso original para 0,9 vezes.
Além disso, os parênteses suportam múltiplas camadas, com cada camada representando um peso multiplicado por um fator fixo.

Por exemplo, por padrão, as roupas da garota serão uma combinação de amarelo e laranja. No entanto, ao usar "(((casaco laranja)))", com os parênteses indicando aumento de ênfase, a representação do casaco laranja pelo modelo é reforçada, resultando em mais laranja no casaco na imagem final.

Por outro lado, ao usar "[[casaco laranja]]", com os colchetes indicando diminuição de ênfase, os elementos laranja são reduzidos. O modelo então prioriza as palavras-chave restantes "((casaco amarelo))", fazendo com que o casaco apareça mais amarelo na imagem final.

Insira diretamente valores numéricos para controlar o peso.

Por exemplo, por padrão, o cabelo é apresentado nas cores verde e vermelha. Se definirmos o peso após "(cabelo verde)" para 0,9, significa que o peso da parte do cabelo verde é reduzido para 0,9 vezes o valor original. Da mesma forma, se quisermos aumentar o peso do cabelo verde, basta inserir 1,1 em seguida.

*Embora a ênfase no peso das palavras-chave possa variar de 0,1 a 100, considerando possíveis desvios causados por valores extremos, recomenda-se manter o peso entre 0,5 e 1,5 para melhores resultados.

Para configurações de parâmetros específicos, clique aqui para ver detalhes.

✨4-Parâmetros

Previous2-Funções Básicas do SeaArt AI Next2-2 Imagem para Imagem

Last updated 5 months ago