Stable Diffusion 3.5

Stable Diffusion 3.5は、その優れたプロンプト理解力と遵守能力で高品質な画像を生成します。このガイドでは、SD3.5の使用方法について詳しく説明します。

Stable Diffusion 3.5は、Stability AIによって作成された新しいベースモデルで、81億のパラメーターを持っています。このモデルは、プロンプト理解力と遵守能力に優れており、高品質な画像を生成します。SD3.5は、メディア、スタイル、アーティスト、漫画家、イラストレーターなどの知識が豊富で、非常に柔軟に使用できます。

モデル:Stable Diffusion 3.5

開始前 | 顕著な違い

新しいStable Diffusionは、Fluxモデルとプロンプトにおいていくつかの類似点があります。つまり、SD3.5も自然言語プロンプトに傾いており、以前のFluxのような機能はサポートしていません。

  1. キーワードの重み付けは機能しません。例: (term:1.3)、[[term]]、(((term)))

  2. キーワードのブレンディング/編集ツールは機能しません。

  3. BREAKは効果がありません。

  4. 自然言語プロンプトの理解が向上しています。

  5. 画像内で異なる主題を簡単に生成できます。

例:犬と猫は、Stable Diffusion 3.5では解剖学的に正しい二つの異なる動物を生成しますが、他の多くのモデルでは、これら二つの動物が組み合わさったクリーチャーを生成する傾向があります。しかし、Stable Diffusion 3.5はネガティブプロンプトを無視しません。ネガティブプロンプトはモデルがうまく機能するために必須ではありませんが、Fluxとは異なり、ユーザーにはまだ使用するオプションがあります。また、Fluxと比較して、SD3.5はアートやアーティストのスタイルに関する知識が優れています。ご存知の通り、Fluxは参照を理解し認識する能力がかなり弱かったのですが、SD3.5はその古いバージョンと同様に、スタイルに関する強力なデータベースを持っています。これにより、Fluxで十分なアーティストの知識や美しさを見つけられなかったユーザーにとって、SD3.5は優れた選択肢となります。

このモデルが得意なこと

  • 「Quality Modifier」プロンプトなしで高品質な画像を生成すること。

  • 他のモデルでは問題になるような混乱を招くプロンプトでも、正しい詳細と配置で望ましい画像を生成することができます。例:青い立方体の下に赤いボール。

  • 画像内で正確なテキストをレンダリングすること。非常に長いテキストには苦労することがありますが、モデルの能力はほとんどのユーザーを満足させるには十分です。

  • 正しいプロンプトでほぼすべての主題を生成すること。

  • どんなアートスタイルやメディアでも画像を作成することができ、優れたアートスタイルのデータセットを持っています。

  • 現実の写真と区別がつかない超フォトリアルな画像を生成すること。ただし、リアリズムの面ではFluxの方がSD3.5よりも優れています。

  • 正しい解剖学と手のレンダリングを生成すること。ただし、首、顎、頬骨などの体の一部で苦労することがあります。

  • SFWコンテンツを使った画像作成。

  • 参照からアート/アーティストのスタイルを認識すること。

  • 自然言語とタグベースのプロンプトの両方でうまく機能します。詳細な構成には、長い説明的な自然言語プロンプトが推奨されます。

最適な使用のための注意点

  • プロンプトに括弧を使わないでください。

  • AIアプリまたは標準生成ページから使用できます。

  • 基本的なSDXL解像度でうまく機能します。

  • NSFWの生成には最適なモデルではありません。LoRAサポートや新しいSD3.5ベースのモデルを待つのが良いでしょう。

  • テキストは引用符「"」内で使用する必要があります。

  • ネガティブプロンプトは必要ありませんが、不要なものを避けるために使用することができます。

おすすめ設定

  • サンプリングステップ: 20 (最大40まで増加可能)

  • CFGスケール: 4.5 (アニメや漫画スタイルのアートには7が使用できます)

  • サンプリング法: euler+beta, euler+sgm_uniform, dpmpp_2s_ancestral+sgm_uniform, dpmpp_2m+sgm_uniform

プロンプトスタイル

Stable Diffusion 3.5は強力な自然言語プロンプト理解能力を持ち、その使いやすいスタイルが特徴です。モデルはネガティブプロンプトボックスもサポートしているため、Fluxよりも簡単かつ効果的に画像を編集することができます。タグベースのプロンプトにも適していますが、最高の結果を得るためには自然言語プロンプトが推奨されます。

テキストレンダリング | タイポグラフィ

Stable Diffusion 3.5は他のAI画像生成ツールに比べて優れたテキストレンダリング能力を持っています。ユーザーはテキストを引用符「"」内に書く必要があります。例:

道路標識に書かれたテキスト"SeaArt"

推奨プロンプトの順番

  1. スタイル/媒体

  2. 主題

  3. 主題の詳細

  4. アート/アーティストの参照

  5. 追加の詳細

  6. 照明/影

  7. 追加の修飾語

自然言語プロンプト

まず、主題を述べ、主題の詳細、スタイル、媒体を説明します。その後、照明、背景、効果など、画像の構成を作成するための追加の詳細を加えます。最後に、プロンプトを完成させるための修飾語を追加できます。

注意: 文章を終わらせた後、プロンプト内でピリオド「.」を使用できます。

推奨使用法

自然言語プロンプトを使用し、各単語をカンマ「,」で区切らないようにします。その後、追加のタグで画像の構成を強化します。

プロンプト例

アールヌーヴォーのポートレート

ポジティブプロンプト

流れる髪と花のモチーフを持つ女性の詳細なポートレート、アルフォンス・ミュシャのスタイル、アールヌーヴォー、複雑なパターン、虹色の水彩インクの飛び散り、高いコントラストのカラフルなアートワーク、人生の混乱を思わせるブラシ線で描かれた画像。

ネガティブプロンプト

nsfw、ヌード、子供、子供っぽい

冬のキャビン

ポジティブプロンプト

シネマティックな写真、雪に覆われた森にある居心地の良い冬のキャビン、窓から柔らかい金色の光が漂い、高い松の木に囲まれている。リアルなスタイル、高いディテール、温かい雰囲気、冬のワンダーランドのシーン。

ネガティブプロンプト

ぼやけている、暗い、空っぽ

暗闇を抱きしめる

暗く不気味な中世の風景、巨大な剣を持つ孤独な戦士、ケンタロウ・ミウラのスタイル、高いディテール、空に手書きで書かれた"Embrace The Darkness"、強い影、ダークファンタジー。

ネガティブプロンプト

nsfw

Last updated