Img2Img+部分的な再描画
ComfyUIのImg2Imgへのワークフローと4つの強力な部分再描画方法について学びましょう:VAEエンコード、潜在ノイズマスク設定、ControlNetインペイント、およびCLIPSeg。
Last updated
ComfyUIのImg2Imgへのワークフローと4つの強力な部分再描画方法について学びましょう:VAEエンコード、潜在ノイズマスク設定、ControlNetインペイント、およびCLIPSeg。
Last updated
Img2Imgは、テキストから画像(Text to Image)を基に調整し、「Load Image」と「VAE Encode」ノードを追加します。
入力画像はピクセル画像であるため、直接潜在空間に配置することはできません。そのため、潜在空間が認識できるように画像をエンコードするVAEエンコーダーが必要です。この場合、最終的に生成される画像のサイズは元の画像と一致します。
Empty Latent Image: 前のテキストから画像へのワークフローでは、新しい画像を生成する前にEmpty Latent Image
を通してノイズ除去を行う必要がありますが、画像が追加されたため、Empty Latent Image
はもう必要ありません。
ワークフロー: 画像をアップロード→モデルを選択→プロンプトを入力→パラメータを調整→生成。
パラメータ:
denoise: ノイズ除去の強度で、0から1の間で調整可能。
Img2Imgを使用すると、スタイルの変更、画像の修復、画像の拡張、高解像度の復元などが可能です。
前処理画像
異なるノードを追加することで、画像のスケーリングやクロップが可能です。
Upscale Image/Upscale Image By: 画像のアップスケーリング。
ImageCrop: 画像のクロップ。
4つの方法:VAEエンコード(for Inpainting)、潜在ノイズマスク設定、ControlNetインペイント、およびCLIPSeg。
VAE Encode (for Inpainting)
VAE Encode (for Inpainting)を追加し、マスクを接続します。画像を右クリックしてMaskEditorで開き、マスクを描きます。描いたマスクに問題がある場合、右クリックで削除できます。
ワークフロー:元の画像に似たモデルを選択し、マスク部分のプロンプトを入力します。
VAE Encode (for Inpainting): VAEエンコード(インペイント用):再描画と同等で、ランダム性が高く、元のマスクされた領域は保持されません。
Set Latent Noise Mask
まず、VAEで画像をエンコードし、それを潜在空間が認識できるコンテンツに変換し、その後マスク領域をノイズコンテンツとして再生成します。
潜在ノイズマスク設定:元の画像を参照して再描画するため、生成されるコンテンツの理解が深まり、誤った画像が生成される可能性が低く、元の画像に似た形で微調整するのに適しています。
ControlNet Inpaint
ControlNetを追加し、インペイントモデルを選択し、画像を前処理します(インペイントプリプロセッサ)。
注意:画像を潜在空間に入れるためにVAEエンコーダーを追加することを忘れないでください。
CLIPSeg
プロンプトを入力してマスク領域を自動的に分割し、手動での塗り直しが不要です。潜在ノイズマスク設定と一緒に使用できます。
パラメータ:
text: 再描画したい領域を入力します。
threshold: コンテンツ認識の精度レベル。
dilation_factor: コンテンツ認識の拡散度。
出力:
Heatmap Mask: ヒートマップ画像。
BW Mask: 白黒画像。
認識されたマスク領域を個別にプレビューできます。
4つの再描画方法の違い:
VAEエンコード(インペイント用):消去と再描画に相当し、ランダム性が高く、スクラッチからの生成に適しています。
潜在ノイズマスク設定:元の画像を参照して再描画し、元の画像に似た形で微調整するのに適しています。
ControlNetインペイント:比較的安定しており、洗練されています。
CLIPSeg:マスク領域を自動的に認識するため、手動での塗り直しが不要で、より便利です。