# 2-1 文生图\`

> 相信大家在使用SeaArt的过程中都遇到过类似问题：**控图效果不理想、加了提示词但绘图结果却没有体现**等。 在本篇中，我们将详尽介绍如何精通文生图的操作，并掌握编写高效提示词的策略。

## 什么是文生图？

在SeaArt.AI中，有文生图、[图生图](https://docs.seaart.ai/guide-1/zhong-wen/2-ji-chu-gong-neng-cao-zuo/22-tu-sheng-tu)和[条件生图](https://docs.seaart.ai/guide-1/zhong-wen/2-ji-chu-gong-neng-cao-zuo/23-tiao-jian-sheng-tu)3种绘图模式，其中文生图模式下包括默认、SDXL、实验室3三种生图方式。

<mark style="background-color:red;">绘图基本步骤：选择模型-填写提示词-设置参数-点击生成</mark>

模型决定了<mark style="background-color:yellow;">画风</mark>、提示词定义了<mark style="background-color:yellow;">画面内容</mark>、参数则细化了图像的<mark style="background-color:yellow;">预设特性</mark>

## 提示词详解

**什么是提示词？如何写一个好的提示词？**

提示词（Prompt）是指导AI生成内容的文字描述。好的提示词应简明、具体，包含风格、内容、细节等关键信息。例如：“日系动漫风格，少女，樱花树下，微笑，阳光明媚”。建议多参考网站优秀案例，逐步积累经验。

**提示词基本语法与结构**

● 关键词用逗号分隔，顺序影响生成结果。

● 可用括号或权重调整关键词重要性，如：(cat:1.2)。

● 支持多语言，但建议优先使用英文或平台推荐语言。

● 负面提示词（Negative Prompt）可排除不希望出现的元素。

SeaArt支持用户直接在提示框中输入中文提示词，虽然大部分模型基于英文训练，使得英文提示词的识别效率相对较高。

**如何设置提示词权重（详细解释权重概念和不同设置方法）**

权重用于突出某些关键词的重要性。常见写法有：(关键词:1.5) 表示该词权重为1.5，数值越大影响越强。

多个关键词可分别设置权重，如 (cat:1.2), (dog:0.8)。

不同模型对权重支持略有差异，建议参考平台文档或社区经验。

负标签：不期望出现在图像中的内容，在一些模型对特定细节（如手部结构）理解不足时尤其有用，通过负标签避免这些元素的出现，可以提升图像质量。

<mark style="color:red;">例如加入：</mark>(bad hands, bad anatomy, bad body, bad face, bad teeth, bad arms, bad legs, deformities: 1.3)

<figure><img src="https://751506775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FI1niezbE5y99beoQQ5aL%2Fuploads%2FlLj28O5fWNYEzhIQQEyW%2F8186dda5-4ebe-43cb-bbd4-b01b8ca64f19.png?alt=media&#x26;token=b1edf47e-51a0-42c3-ac1d-70f8906b4052" alt=""><figcaption></figcaption></figure>

输入提示词：自然语言/词组形式

自然语言：一个黑色头发女孩在跳舞&#x20;

词组形式：一个女孩，黑色头发，跳舞

<mark style="color:red;">\*</mark>提示词不是越多越好，过量的提示词可能会引起模型的混淆，影响出图效果。重要的是找到<mark style="background-color:yellow;">平衡</mark>，既要足够详细以引导AI，又要避免过度复杂化。

提示词的作用是<mark style="background-color:yellow;">引导和辅助</mark>模型的绘图过程，并非硬性要求，即使你的输入随便一句话，模型依旧可以为你画出一张图来，甚至可能效果还不错

<mark style="color:red;">\*不过丰富的提示词可以更好的控制最终出图效果，在后期微调中，也可以快速修改和验证特定关键词对出图结果的影响。</mark>

<figure><img src="https://751506775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FI1niezbE5y99beoQQ5aL%2Fuploads%2FO0LK6rc2ECmBJOPmWUQd%2F%E4%BC%81%E4%B8%9A%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20240521173531.png?alt=media&#x26;token=7016eaff-fc61-47d6-a646-86e863cd7a7b" alt=""><figcaption><p>简单提示词</p></figcaption></figure>

### 万能提示词公式

一条有效的提示词，就如同是在对AI布置一个任务。如果指令含糊不清，比如仅仅说“设计一张图”，而不具体说明要素和用途，那么结果往往难以预料。因此，详细而具体的指令能够极大提升成果的质量和符合度。

<mark style="color:red;">例：</mark>提示词仅仅输入“一个女孩”，对于画面中女孩着装、场景、镜头角度等内容都没有提及，ai只能根据模型训练时的历史经验自行发挥。得益于模型的强大，我们得到的绘图结果都还不错，但如果对画面内容有特定要求，这样的效率很低了。

<figure><img src="https://751506775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FI1niezbE5y99beoQQ5aL%2Fuploads%2FgdnNFQPCr8Df34YZrmDh%2F%E4%BC%81%E4%B8%9A%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20240521173531.png?alt=media&#x26;token=c3db476e-29e3-44b0-87d2-2a4f07637c0f" alt=""><figcaption></figcaption></figure>

当我们加入其他内容描述词，画面会稳定很多

<figure><img src="https://751506775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FI1niezbE5y99beoQQ5aL%2Fuploads%2FsL6sT8q5OVL6y0rIBhPU%2F%E4%BC%81%E4%B8%9A%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20240521174020.png?alt=media&#x26;token=3fb78eee-f9b8-443a-80a6-67bd800ddb2e" alt=""><figcaption></figcaption></figure>

* 一个理想的提示词公式包括：<mark style="background-color:yellow;">主体内容、环境背景、构图镜头、图像设定及参考风格</mark>等元&#x7D20;**，**&#x6BCF;一部分都对绘图结果有着不同程度的影响。

<mark style="color:red;">\*公式只是参考，并非每次编写提示词我们都要包含所有内容，实践中，先确定主体内容对出图效果的影响，再根据个人需求进行细节优化。</mark>

<figure><img src="https://751506775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FI1niezbE5y99beoQQ5aL%2Fuploads%2FQFs5HD2JyhpIFtzFDfnE%2Foutput.png?alt=media&#x26;token=3da3cc9a-948c-4b2e-98e7-21975d306336" alt=""><figcaption></figcaption></figure>

1. **主体内容：**&#x63CF;述画面的主要内容，比如<mark style="background-color:yellow;">人或者动物，人物的着装、表情，动物的毛发、动作，物体的材质等</mark>。不过多个物体组合生成可能会出现问题，可以先挨个生成主体素材进行拼合，然后用条件生图约束进行出图。
2. **环境背景：**&#x8BBE;定周围的场景和辅助元素，比如<mark style="background-color:yellow;">天空的颜色、四周的背景、环境的灯光、画面色调等，</mark>这一步是为了渲染画面氛围，凸显图片的主题。
3. **构图镜头：**&#x8C03;节画面的镜头和视角，如<mark style="background-color:yellow;">景深的强调、物体的布局，甚至使用黄金分割或中全景视角</mark>，可以大幅度地提升作品的视觉冲击力。
4. **图像设定：**&#x589E;强画面表现力的常用词汇，常见于让人印象深刻的高质量图片中，例如<mark style="background-color:yellow;">细节丰富度、摄影画质、电影感等</mark>。值得一提的是，最终图像的分辨率和细节层次主要由其尺寸决定，而通过后期处理如超分辨率技术，可以进一步增强图像细节。
5. **参考风格：**&#x63CF;述画面想呈现的风格和情绪表达，比如加入<mark style="background-color:yellow;">艺术家的名字、艺术手法、年代、色彩等。</mark>不过图像风格基本是由模型决定的，如果此前该模型并没有经过艺术风格关键词训练，是无法理解的。如果对图像风格有要求，最好还是直接使用对应风格的模型来绘图，会比单纯使用提示词更好。

<mark style="background-color:red;">一键同款：</mark>如果觉得编写提示词过于复杂，可以在广场中寻找灵感图像，一键复用已有的参数和提示词，简化创作过程。

<figure><img src="https://751506775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FI1niezbE5y99beoQQ5aL%2Fuploads%2Fw1nBSzK6tiXce9XFGtZH%2Ff04bcf74-e0d3-4001-955d-b74b8a29b0ab.png?alt=media&#x26;token=23bd950a-cb81-431c-9a28-1a8bef5cb46e" alt="" width="563"><figcaption></figcaption></figure>

<figure><img src="https://751506775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FI1niezbE5y99beoQQ5aL%2Fuploads%2Fo5Cyfl7zB6DSghHN1RHk%2F227ec8a7-e0bf-4124-8729-57b1aab04361.png?alt=media&#x26;token=29d4ce7d-2678-45b2-94dd-bbe5218cf608" alt=""><figcaption></figcaption></figure>

### 强调提示词

强调提示词是依赖括号和数值来控制特定提示词的权重，当权重数值越高，说明模型对该提示词更加重视，在运行过程中就会着重绘制该部分，在最终成像时图片中就会体现更多对应信息。反之内容会展示的更少。

一种是通过<mark style="background-color:yellow;">括号增加权重</mark>，另一种是<mark style="background-color:yellow;">直接填写数值</mark>，通常使用第二种

控制提示词的括号共有三种类型:

圆括号( )：每层括号增加到原有权重 1.1倍

方括号\[ ]：每层括号降低到原有权重0.9倍

而且括号是支持多层叠加的，每层括号都表示乘以固定倍数的权重。

<figure><img src="https://751506775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FI1niezbE5y99beoQQ5aL%2Fuploads%2FVOcVLET3i4Dp6As4GjWn%2F564183dd-b670-4403-965b-b49ef94ffc57.png?alt=media&#x26;token=77810f79-3ce3-4dca-a610-fee74582576b" alt=""><figcaption></figcaption></figure>

<mark style="color:red;">例：</mark>默认情况下女孩的衣服会是黄色和橙色的结合，而&#x5F53;**(((orange coat)))**&#x52A0;上表示提高权重的圆括号时，模型对橙色外套的绘制会加强，最终图像里外套就出现<mark style="background-color:yellow;">更多橙色。</mark>

<figure><img src="https://content.gitbook.com/content/I1niezbE5y99beoQQ5aL/blobs/SyvCt5odqQwEodl9scDg/%E6%8B%AC%E5%8F%B71.png" alt="Before and after comparison of emphasized prompts" width="563"><figcaption></figcaption></figure>

反之，**\[\[orange coat]]**&#x52A0;上表示降低权重的方括号时，橙色部分被减弱，模型在绘制时就会优先关注剩下的关键词 **((Yellow coat))**，所以最终图像里外套出现<mark style="background-color:yellow;">更多黄色。</mark>

<figure><img src="https://content.gitbook.com/content/I1niezbE5y99beoQQ5aL/blobs/oFosfPtv7RGg1FSGTxDx/%E9%99%8D%E4%BD%8E.png" alt="Before and after comparison of AI images" width="563"><figcaption></figcaption></figure>

直接填写数值控制权重

<mark style="color:red;">例：</mark>默认情况下头发是呈现绿、红两种颜色，如果我们在 **(green hair)**&#x540E;面设置权重为0.9，表示绿发部分的权重降低为原来的0.9倍，同理如果我们想增加绿发的权重就在后面输入1.1就可以了。

<figure><img src="https://content.gitbook.com/content/I1niezbE5y99beoQQ5aL/blobs/sZGKHMAjrHFBgRPPLfk0/c3e350df-80c0-44bb-aaee-9599b1cf06dc.png" alt="Three examples of AI anime images with different prompts"><figcaption></figcaption></figure>

<mark style="color:red;">\*尽管强调关键词的权重可以在0.1至100的范围内变化，但考虑到权重极端值可能带来的效果偏差，建议将权重控制在0.5至1.5之间，以获得最佳的图像效果。</mark>

#### **控制生成结果**

**如何尝试控制生成图片的数量/人物**

● 在正向提示词中明确指定“1girl”或“single character”

● 在负面提示词中加强“multiple people”或“2girls”等排除项，并可加权重

● 多尝试不同表达方式，结合社区经验

**其他控制技巧**

● 构图可通过描述“close-up, full body, portrait”等实现

● 风格可通过指定“watercolor, cyberpunk, oil painting”等关键词实现

● 具体技巧详见网站教程

\*具体参数设置点击这里查看详情

{% content-ref url="../4-can-shu-jie-shi" %}
[4-can-shu-jie-shi](https://docs.seaart.ai/guide-1/zhong-wen/4-can-shu-jie-shi)
{% endcontent-ref %}
