2-1 文生图

通过简单的分步说明,了解什么是文生图以及如何使用 文生图。

相信大家在使用SeaArt的过程中都遇到过类似问题:控图效果不理想、加了提示词但绘图结果却没有体现等。 在本篇中,我们将详尽介绍如何精通文生图的操作,并掌握编写高效提示词的策略。

什么是文生图?

在SeaArt.AI中,有文生图、图生图条件生图3种绘图模式,其中文生图模式下包括默认、SDXL、实验室3三种生图方式。

绘图基本步骤:选择模型-填写提示词-设置参数-点击生成

模型决定了画风、提示词定义了画面内容、参数则细化了图像的预设特性

提示词详解

什么是提示词?

为了更有效的引导AI,人们逐步探索出了一种方法,即通过提供正面或负面的反馈来约束模型的行为。这种用来指导模型的信息,我们称之为提示词(Prompt)。可以将其理解为是人类与AI沟通的桥梁。

提示词基本语法

SeaArt支持用户直接在提示框中输入中文提示词,虽然大部分模型基于英文训练,使得英文提示词的识别效率相对较高,但SeaArt.AI的智能化设计允许直观方便地使用中文进行创作。

如果你还不会编辑提示词,可以点击工具-提示词工具,快速构建出高效的提示词组合。

负标签:不期望出现在图像中的内容,在一些模型对特定细节(如手部结构)理解不足时尤其有用,通过负标签避免这些元素的出现,可以提升图像质量。

例如加入:(bad hands, bad anatomy, bad body, bad face, bad teeth, bad arms, bad legs, deformities: 1.3)

输入提示词:自然语言/词组形式

自然语言:一个黑色头发女孩在跳舞

词组形式:一个女孩,黑色头发,跳舞

*提示词不是越多越好,过量的提示词可能会引起模型的混淆,影响出图效果。重要的是找到平衡,既要足够详细以引导AI,又要避免过度复杂化。

提示词的作用是引导和辅助模型的绘图过程,并非硬性要求,即使你的输入随便一句话,模型依旧可以为你画出一张图来,甚至可能效果还不错

*不过丰富的提示词可以更好的控制最终出图效果,在后期微调中,也可以快速修改和验证特定关键词对出图结果的影响。

万能提示词公式

一条有效的提示词,就如同是在对AI布置一个任务。如果指令含糊不清,比如仅仅说“设计一张图”,而不具体说明要素和用途,那么结果往往难以预料。因此,详细而具体的指令能够极大提升成果的质量和符合度。

例:提示词仅仅输入“一个女孩”,对于画面中女孩着装、场景、镜头角度等内容都没有提及,ai只能根据模型训练时的历史经验自行发挥。得益于模型的强大,我们得到的绘图结果都还不错,但如果对画面内容有特定要求,这样的效率很低了。

当我们加入其他内容描述词,画面会稳定很多

  • 一个理想的提示词公式包括:主体内容、环境背景、构图镜头、图像设定及参考风格等元素每一部分都对绘图结果有着不同程度的影响。

*公式只是参考,并非每次编写提示词我们都要包含所有内容,实践中,先确定主体内容对出图效果的影响,再根据个人需求进行细节优化。

  1. 主体内容:描述画面的主要内容,比如人或者动物,人物的着装、表情,动物的毛发、动作,物体的材质等。不过多个物体组合生成可能会出现问题,可以先挨个生成主体素材进行拼合,然后用条件生图约束进行出图。

  2. 环境背景:设定周围的场景和辅助元素,比如天空的颜色、四周的背景、环境的灯光、画面色调等,这一步是为了渲染画面氛围,凸显图片的主题。

  3. 构图镜头:调节画面的镜头和视角,如景深的强调、物体的布局,甚至使用黄金分割或中全景视角,可以大幅度地提升作品的视觉冲击力。

  4. 图像设定:增强画面表现力的常用词汇,常见于让人印象深刻的高质量图片中,例如细节丰富度、摄影画质、电影感等。值得一提的是,最终图像的分辨率和细节层次主要由其尺寸决定,而通过后期处理如超分辨率技术,可以进一步增强图像细节。

  5. 参考风格:描述画面想呈现的风格和情绪表达,比如加入艺术家的名字、艺术手法、年代、色彩等。不过图像风格基本是由模型决定的,如果此前该模型并没有经过艺术风格关键词训练,是无法理解的。如果对图像风格有要求,最好还是直接使用对应风格的模型来绘图,会比单纯使用提示词更好。

一键同款:如果觉得编写提示词过于复杂,可以在广场中寻找灵感图像,一键复用已有的参数和提示词,简化创作过程。

强调提示词

强调提示词是依赖括号和数值来控制特定提示词的权重,当权重数值越高,说明模型对该提示词更加重视,在运行过程中就会着重绘制该部分,在最终成像时图片中就会体现更多对应信息。反之内容会展示的更少。

一种是通过括号增加权重,另一种是直接填写数值,通常使用第二种

控制提示词的括号共有三种类型:

圆括号( ):每层括号增加到原有权重 1.1倍

方括号[ ]:每层括号降低到原有权重0.9倍

而且括号是支持多层叠加的,每层括号都表示乘以固定倍数的权重。

例:默认情况下女孩的衣服会是黄色和橙色的结合,而当(((orange coat)))加上表示提高权重的圆括号时,模型对橙色外套的绘制会加强,最终图像里外套就出现更多橙色。

反之,[[orange coat]]加上表示降低权重的方括号时,橙色部分被减弱,模型在绘制时就会优先关注剩下的关键词 ((Yellow coat)),所以最终图像里外套出现更多黄色。

直接填写数值控制权重

例:默认情况下头发是呈现绿、红两种颜色,如果我们在 (green hair)后面设置权重为0.9,表示绿发部分的权重降低为原来的0.9倍,同理如果我们想增加绿发的权重就在后面输入1.1就可以了。

*尽管强调关键词的权重可以在0.1至100的范围内变化,但考虑到权重极端值可能带来的效果偏差,建议将权重控制在0.5至1.5之间,以获得最佳的图像效果。

*具体参数设置点击这里查看详情

4-参数解释

Last updated