2-1 文生图

通过简单的分步说明，了解什么是文生图以及如何使用文生图。

相信大家在使用SeaArt的过程中都遇到过类似问题：控图效果不理想、加了提示词但绘图结果却没有体现等。在本篇中，我们将详尽介绍如何精通文生图的操作，并掌握编写高效提示词的策略。

什么是文生图？

在SeaArt.AI中，有文生图、图生图和条件生图3种绘图模式，其中文生图模式下包括默认、SDXL、实验室3三种生图方式。

绘图基本步骤：选择模型-填写提示词-设置参数-点击生成

模型决定了画风、提示词定义了画面内容、参数则细化了图像的预设特性

什么是提示词？如何写一个好的提示词？

提示词（Prompt）是指导AI生成内容的文字描述。好的提示词应简明、具体，包含风格、内容、细节等关键信息。例如：“日系动漫风格，少女，樱花树下，微笑，阳光明媚”。建议多参考网站优秀案例，逐步积累经验。

提示词基本语法与结构

● 关键词用逗号分隔，顺序影响生成结果。

● 可用括号或权重调整关键词重要性，如：(cat:1.2)。

● 支持多语言，但建议优先使用英文或平台推荐语言。

● 负面提示词（Negative Prompt）可排除不希望出现的元素。

SeaArt支持用户直接在提示框中输入中文提示词，虽然大部分模型基于英文训练，使得英文提示词的识别效率相对较高。

如何设置提示词权重（详细解释权重概念和不同设置方法）

权重用于突出某些关键词的重要性。常见写法有：(关键词:1.5) 表示该词权重为1.5，数值越大影响越强。

多个关键词可分别设置权重，如 (cat:1.2), (dog:0.8)。

不同模型对权重支持略有差异，建议参考平台文档或社区经验。

负标签：不期望出现在图像中的内容，在一些模型对特定细节（如手部结构）理解不足时尤其有用，通过负标签避免这些元素的出现，可以提升图像质量。

例如加入：(bad hands, bad anatomy, bad body, bad face, bad teeth, bad arms, bad legs, deformities: 1.3)

输入提示词：自然语言/词组形式

自然语言：一个黑色头发女孩在跳舞

词组形式：一个女孩，黑色头发，跳舞

*提示词不是越多越好，过量的提示词可能会引起模型的混淆，影响出图效果。重要的是找到平衡，既要足够详细以引导AI，又要避免过度复杂化。

提示词的作用是引导和辅助模型的绘图过程，并非硬性要求，即使你的输入随便一句话，模型依旧可以为你画出一张图来，甚至可能效果还不错

*不过丰富的提示词可以更好的控制最终出图效果，在后期微调中，也可以快速修改和验证特定关键词对出图结果的影响。

一条有效的提示词，就如同是在对AI布置一个任务。如果指令含糊不清，比如仅仅说“设计一张图”，而不具体说明要素和用途，那么结果往往难以预料。因此，详细而具体的指令能够极大提升成果的质量和符合度。

例：提示词仅仅输入“一个女孩”，对于画面中女孩着装、场景、镜头角度等内容都没有提及，ai只能根据模型训练时的历史经验自行发挥。得益于模型的强大，我们得到的绘图结果都还不错，但如果对画面内容有特定要求，这样的效率很低了。

当我们加入其他内容描述词，画面会稳定很多

*公式只是参考，并非每次编写提示词我们都要包含所有内容，实践中，先确定主体内容对出图效果的影响，再根据个人需求进行细节优化。

主体内容：描述画面的主要内容，比如人或者动物，人物的着装、表情，动物的毛发、动作，物体的材质等。不过多个物体组合生成可能会出现问题，可以先挨个生成主体素材进行拼合，然后用条件生图约束进行出图。
环境背景：设定周围的场景和辅助元素，比如天空的颜色、四周的背景、环境的灯光、画面色调等，这一步是为了渲染画面氛围，凸显图片的主题。
构图镜头：调节画面的镜头和视角，如景深的强调、物体的布局，甚至使用黄金分割或中全景视角，可以大幅度地提升作品的视觉冲击力。
图像设定：增强画面表现力的常用词汇，常见于让人印象深刻的高质量图片中，例如细节丰富度、摄影画质、电影感等。值得一提的是，最终图像的分辨率和细节层次主要由其尺寸决定，而通过后期处理如超分辨率技术，可以进一步增强图像细节。
参考风格：描述画面想呈现的风格和情绪表达，比如加入艺术家的名字、艺术手法、年代、色彩等。不过图像风格基本是由模型决定的，如果此前该模型并没有经过艺术风格关键词训练，是无法理解的。如果对图像风格有要求，最好还是直接使用对应风格的模型来绘图，会比单纯使用提示词更好。