# 2-1 Texto para Imagem

> **Você já encontrou problemas semelhantes ao usar o SeaArt: o efeito de controle não é ideal, ou os resultados do desenho não refletem os prompts adicionados, entre outros? Neste artigo, vamos apresentar de forma abrangente como dominar a operação de texto para imagem e entender a estratégia de escrever prompts eficientes.**

### O que é Texto para Imagem?

No SeaArt AI, existem três modos de desenho: <mark style="background-color:yellow;">Texto para Imagem,</mark> [<mark style="background-color:yellow;">Imagem para Imagem</mark>](https://docs.seaart.ai/guide-1/portugues/2-funcoes-basicas-do-seaart-ai/2-2-imagem-para-imagem) e [<mark style="background-color:yellow;">ControINet</mark>](https://docs.seaart.ai/guide-1/portugues/2-funcoes-basicas-do-seaart-ai/2-3-controlnet)<mark style="background-color:yellow;">.</mark>

<figure><img src="https://2001975340-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FH71dO7TuUPMHtPY8Ra8I%2Fuploads%2Fs9LMEta7FnMonDwHCLPD%2F31-.png?alt=media&#x26;token=b8e88a33-2df2-4140-b279-302778930e65" alt=""><figcaption></figcaption></figure>

Os passos básicos para desenhar são: <mark style="background-color:red;">selecionar um modelo → inserir prompts → definir parâmetros → Criar.</mark>

O modelo determina o <mark style="background-color:yellow;">estilo</mark>, os prompts definem o <mark style="background-color:yellow;">conteúdo da imagem</mark> e os parâmetros refinam <mark style="background-color:yellow;">as características predefinidas da imagem.</mark>

## Escrita Básica e Avançada de Prompts

**O que é um Prompt? Como Escrever um Bom Prompt?**

Um prompt é uma descrição textual que orienta a IA a gerar conteúdo. Um bom prompt deve ser claro e específico, cobrindo aspectos-chave como estilo, conteúdo e detalhes. Exemplo: "Estilo anime japonês, garota, debaixo de uma cerejeira, sorrindo, dia ensolarado." Recomendamos consultar exemplos da comunidade e construir experiência gradualmente.

**Sintaxe e Estrutura Básica de Prompt**

● Use vírgulas para separar palavras-chave; a ordem das palavras afeta os resultados.

● Use parênteses ou pesos para enfatizar palavras-chave, por exemplo, (gato:1.2).

● Há suporte multilíngue, mas o inglês ou o idioma recomendado pela plataforma é preferível.

● Use prompts negativos para excluir elementos indesejados.

**Como Definir Pesos de Prompt (Explicação Detalhada)**

A ponderação enfatiza a importância das palavras-chave. Formato comum: (palavra-chave:1.5) significa peso = 1.5 (maior influência).

Várias palavras-chave podem ter pesos individuais, por exemplo, (gato:1.2), (cachorro:0.8).

O suporte pode variar ligeiramente entre modelos; consulte a documentação ou dicas da comunidade.

**Como Usar Prompts Negativos**

No campo de prompt negativo, insira elementos indesejados como: "borrado, baixa qualidade, marca d'água". Use pesos para reforçar exclusões, por exemplo, (múltiplas pessoas:1.5), para controlar retratos solo.

Prompts negativos são especialmente úteis quando alguns modelos têm dificuldade em entender detalhes específicos (por exemplo, estruturas das mãos), pois ajudam a evitar esses elementos e melhoram a qualidade da imagem.

Por exemplo, inclua: (mãos ruins, anatomia ruim, corpo ruim, rosto ruim, dentes ruins, braços ruins, pernas ruins, deformidades: 1.3)

<figure><img src="https://2001975340-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FH71dO7TuUPMHtPY8Ra8I%2Fuploads%2FEaxMnrY0lgzpPgeGj752%2F32-.png?alt=media&#x26;token=1e1b1113-135b-43c4-a4be-7de0126e94a9" alt=""><figcaption></figcaption></figure>

Entrada de Prompts: forma de linguagem/frase natural

**Linguagem natural:** Uma garota de cabelo preto dançando&#x20;

**Forma de frase:** Uma garota, cabelo preto, dançando

O papel dos prompts é guiar e auxiliar o modelo no processo de desenho, e não ser um requisito rígido. Mesmo que sua entrada seja apenas uma frase casual, o modelo ainda pode criar uma imagem para você, e o resultado pode mesmo ser muito bom.

<mark style="color:red;">\*Prompts ricos podem controlar melhor o efeito final da saída. No processo de ajuste fino posterior, palavras-chave específicas podem ser rapidamente modificadas e verificadas quanto ao seu impacto no resultado do desenho.</mark>

### Fórmula Universal de Prompt

Um prompt eficaz é como atribuir uma tarefa ao gerador de arte com IA. Se a instrução for vaga, como apenas dizer “desenhe uma imagem” sem especificar elementos e propósito, o resultado geralmente é imprevisível. Portanto, instruções detalhadas e específicas podem melhorar muito a qualidade e relevância do resultado.

Por exemplo, se o prompt simplesmente disser "uma garota", não menciona a roupa da garota, o cenário, o ângulo da câmera, etc., e a IA só pode agir com base na experiência histórica do modelo durante o treinamento. Graças às capacidades do modelo, os resultados ainda podem ser bons. No entanto, se houver requisitos específicos para o conteúdo da imagem, tal eficiência é muito baixa.

Quando adicionamos outras palavras descritivas para o conteúdo, a imagem se torna muito mais estável.

Uma fórmula de prompt ideal inclui elementos como <mark style="background-color:yellow;">conteúdo principal, fundo ambiental, composição, configurações da imagem e estilo de referência</mark>, cada um afetando o resultado do desenho em diferentes graus.

<mark style="color:red;">\*Esta fórmula é uma referência, não uma regra rígida para toda criação de prompt. Primeiro, determine o impacto do conteúdo principal, depois otimize os detalhes conforme suas necessidades.</mark>

1. **Conteúdo principal:** Descreve o assunto principal, como <mark style="background-color:yellow;">pessoas ou animais, suas roupas, expressões, pelos, ações ou o material dos objetos.</mark> Criar vários sujeitos juntos pode causar problemas; recomenda-se criar cada sujeito separadamente e depois usar a geração ControINet para integração.
2. **Fundo ambiental:** Define o cenário e elementos auxiliares como <mark style="background-color:yellow;">cor do céu, arredores, iluminação e tom de cor</mark>, melhorando a atmosfera da imagem e destacando seu tema.
3. **Composição dos planos:** Ajusta o ângulo da câmera e a perspectiva, como ênfase na <mark style="background-color:yellow;">profundidade de campo ou disposição dos objetos</mark>, aumentando significativamente o impacto visual.
4. **Configurações da imagem:** Incluem termos para aumentar a expressividade visual, como <mark style="background-color:yellow;">riqueza de detalhes, qualidade fotográfica e efeito cinematográfico.</mark> A resolução e o nível de detalhes são determinados principalmente pelo tamanho, com técnicas de pós-processamento como Upscale para aprimorar ainda mais os detalhes.
5. **Estilo de referência:** Descreve o estilo artístico e o clima desejados, como mencionar <mark style="background-color:yellow;">o nome de um artista, técnicas de arte, época ou cores.</mark> No entanto, o estilo da imagem é amplamente determinado pelo modelo; se o modelo não foi treinado com palavras-chave de estilos artísticos específicos, pode não entendê-las. Para requisitos de estilo específicos, usar um modelo treinado nesse estilo pode trazer melhores resultados do que apenas usar prompts.

**Remix:** Se você achar a escrita de prompts muito complexa, pode buscar inspiração nas imagens geradas por IA na página inicial e usar o recurso de reutilização com um clique dos parâmetros e prompts existentes para simplificar o processo de criação.

<figure><img src="https://2001975340-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FH71dO7TuUPMHtPY8Ra8I%2Fuploads%2Fb8AtcFPNgNWXfiyzgkAG%2F37-.png?alt=media&#x26;token=ed03f94c-275d-4600-8fbd-dab0120d401d" alt=""><figcaption></figcaption></figure>

<figure><img src="https://2001975340-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FH71dO7TuUPMHtPY8Ra8I%2Fuploads%2Fmj0tVgMLdD5CMv0a9ohm%2F38-.png?alt=media&#x26;token=a21ce54f-9d45-46e2-981b-e0610325c4af" alt=""><figcaption></figcaption></figure>

### Prompts Enfatizados

A ênfase nos prompts depende de parênteses e valores numéricos para controlar o peso de prompts específicos. Quanto maior o valor do peso, mais o modelo prioriza aquele prompt, focando em renderizar essa parte durante o processo. Assim, a imagem final refletirá mais as informações correspondentes. Por outro lado, menos ênfase resultará em menor representação desse conteúdo na imagem.

Um método é <mark style="background-color:yellow;">aumentar o peso usando parênteses</mark>, e o outro é <mark style="background-color:yellow;">inserir diretamente valores numéricos</mark>, sendo este último o mais utilizado.

Existem três tipos de parênteses para controlar o peso das palavras-chave:

* Parênteses redondos ( ): Cada camada aumenta o peso original em 1,1 vezes.
* Colchetes \[ ]: Cada camada reduz o peso original para 0,9 vezes.
* Além disso, os parênteses suportam múltiplas camadas, com cada camada representando um peso multiplicado por um fator fixo.

<figure><img src="https://content.gitbook.com/content/H71dO7TuUPMHtPY8Ra8I/blobs/cISp8WvvWuBW2Z86tRCh/%E4%BC%81%E4%B8%9A%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20240407150213.png" alt="Emphasize prompts by adding parentheses"><figcaption></figcaption></figure>

Por exemplo, por padrão, as roupas da garota serão uma combinação de amarelo e laranja. No entanto, ao usar "**(((casaco laranja)))**", com os parênteses indicando aumento de ênfase, a representação do casaco laranja pelo modelo é reforçada, resultando em <mark style="background-color:yellow;">mais laranja</mark> no casaco na imagem final.

<figure><img src="https://2001975340-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FH71dO7TuUPMHtPY8Ra8I%2Fuploads%2FMN7k5IhhRAbS5YXv6OW9%2F40-%20compara%C3%A7%C3%A3o%20antes%20e%20depois%20de%20prompts%20enfatizados.png?alt=media&#x26;token=272c9640-5cfb-45c1-92b3-866b1ac8c01a" alt=""><figcaption></figcaption></figure>

Por outro lado, ao usar "**\[\[casaco laranja]]"**, com os colchetes indicando diminuição de ênfase, os elementos laranja são reduzidos. O modelo então prioriza as palavras-chave restantes "((casaco amarelo))", fazendo com que o casaco apareça <mark style="background-color:yellow;">mais amarelo</mark> na imagem final.

<figure><img src="https://2001975340-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FH71dO7TuUPMHtPY8Ra8I%2Fuploads%2FCBsExJyTDnjZcqLnZFjj%2F41-Compara%C3%A7%C3%A3o%20antes%20e%20depois%20de%20imagens%20de%20IA.png?alt=media&#x26;token=b2cb13a0-b342-460b-aa34-6e186ea3d35d" alt=""><figcaption></figcaption></figure>

Insira diretamente valores numéricos para controlar o peso.

Por exemplo, por padrão, o cabelo é apresentado nas cores verde e vermelha. Se definirmos o peso após "(cabelo verde)" para 0,9, significa que o peso da parte do cabelo verde é reduzido para 0,9 vezes o valor original. Da mesma forma, se quisermos aumentar o peso do cabelo verde, basta inserir 1,1 em seguida.

<figure><img src="https://2001975340-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FH71dO7TuUPMHtPY8Ra8I%2Fuploads%2FneaFWdk7jOAw0PAGT9R7%2F42-Tr%C3%AAs%20exemplos%20de%20imagens%20de%20anime%20IA%20com%20diferentes%20prompts.png?alt=media&#x26;token=0305a5e6-b566-4294-93b6-d26bf7d2f757" alt=""><figcaption></figcaption></figure>

<mark style="color:red;">\*Embora a ênfase no peso das palavras-chave possa variar de 0,1 a 100, considerando possíveis desvios causados por valores extremos, recomenda-se manter o peso entre 0,5 e 1,5 para melhores resultados.</mark>

<mark style="background-color:red;">Para configurações de parâmetros específicos, clique aqui para ver detalhes.</mark>

{% content-ref url="../4-parametros" %}
[4-parametros](https://docs.seaart.ai/guide-1/portugues/4-parametros)
{% endcontent-ref %}
