2-1 文生图

通过简单的分步说明，了解什么是文生图以及如何使用文生图。

Last updated 5 months ago

通过简单的分步说明，了解什么是文生图以及如何使用文生图。

相信大家在使用SeaArt的过程中都遇到过类似问题：控图效果不理想、加了提示词但绘图结果却没有体现等。在本篇中，我们将详尽介绍如何精通文生图的操作，并掌握编写高效提示词的策略。

什么是文生图？

在SeaArt.AI中，有文生图、图生图和条件生图3种绘图模式，其中文生图模式下包括默认、SDXL、实验室3三种生图方式。

绘图基本步骤：选择模型-填写提示词-设置参数-点击生成

模型决定了画风、提示词定义了画面内容、参数则细化了图像的预设特性

什么是提示词？

为了更有效的引导AI，人们逐步探索出了一种方法，即通过提供正面或负面的反馈来约束模型的行为。这种用来指导模型的信息，我们称之为提示词（Prompt）。可以将其理解为是人类与AI沟通的桥梁。

提示词基本语法

SeaArt支持用户直接在提示框中输入中文提示词，虽然大部分模型基于英文训练，使得英文提示词的识别效率相对较高，但SeaArt.AI的智能化设计允许直观方便地使用中文进行创作。

如果你还不会编辑提示词，可以点击工具-提示词工具，快速构建出高效的提示词组合。

负标签：不期望出现在图像中的内容，在一些模型对特定细节（如手部结构）理解不足时尤其有用，通过负标签避免这些元素的出现，可以提升图像质量。

例如加入：(bad hands, bad anatomy, bad body, bad face, bad teeth, bad arms, bad legs, deformities: 1.3)

输入提示词：自然语言/词组形式

自然语言：一个黑色头发女孩在跳舞

词组形式：一个女孩，黑色头发，跳舞

*提示词不是越多越好，过量的提示词可能会引起模型的混淆，影响出图效果。重要的是找到平衡，既要足够详细以引导AI，又要避免过度复杂化。

提示词的作用是引导和辅助模型的绘图过程，并非硬性要求，即使你的输入随便一句话，模型依旧可以为你画出一张图来，甚至可能效果还不错

*不过丰富的提示词可以更好的控制最终出图效果，在后期微调中，也可以快速修改和验证特定关键词对出图结果的影响。

一条有效的提示词，就如同是在对AI布置一个任务。如果指令含糊不清，比如仅仅说“设计一张图”，而不具体说明要素和用途，那么结果往往难以预料。因此，详细而具体的指令能够极大提升成果的质量和符合度。

例：提示词仅仅输入“一个女孩”，对于画面中女孩着装、场景、镜头角度等内容都没有提及，ai只能根据模型训练时的历史经验自行发挥。得益于模型的强大，我们得到的绘图结果都还不错，但如果对画面内容有特定要求，这样的效率很低了。

当我们加入其他内容描述词，画面会稳定很多

*公式只是参考，并非每次编写提示词我们都要包含所有内容，实践中，先确定主体内容对出图效果的影响，再根据个人需求进行细节优化。

主体内容：描述画面的主要内容，比如人或者动物，人物的着装、表情，动物的毛发、动作，物体的材质等。不过多个物体组合生成可能会出现问题，可以先挨个生成主体素材进行拼合，然后用条件生图约束进行出图。
环境背景：设定周围的场景和辅助元素，比如天空的颜色、四周的背景、环境的灯光、画面色调等，这一步是为了渲染画面氛围，凸显图片的主题。
构图镜头：调节画面的镜头和视角，如景深的强调、物体的布局，甚至使用黄金分割或中全景视角，可以大幅度地提升作品的视觉冲击力。
图像设定：增强画面表现力的常用词汇，常见于让人印象深刻的高质量图片中，例如细节丰富度、摄影画质、电影感等。值得一提的是，最终图像的分辨率和细节层次主要由其尺寸决定，而通过后期处理如超分辨率技术，可以进一步增强图像细节。
参考风格：描述画面想呈现的风格和情绪表达，比如加入艺术家的名字、艺术手法、年代、色彩等。不过图像风格基本是由模型决定的，如果此前该模型并没有经过艺术风格关键词训练，是无法理解的。如果对图像风格有要求，最好还是直接使用对应风格的模型来绘图，会比单纯使用提示词更好。