Img2Img+部分的な再描画

ComfyUIのImg2Imgへのワークフローと4つの強力な部分再描画方法について学びましょう:VAEエンコード、潜在ノイズマスク設定、ControlNetインペイント、およびCLIPSeg。

基本的Img2Imgのワークフロー

Img2Imgは、テキストから画像(Text to Image)を基に調整し、「Load Image」と「VAE Encode」ノードを追加します。

入力画像はピクセル画像であるため、直接潜在空間に配置することはできません。そのため、潜在空間が認識できるように画像をエンコードするVAEエンコーダーが必要です。この場合、最終的に生成される画像のサイズは元の画像と一致します。

Empty Latent Image: 前のテキストから画像へのワークフローでは、新しい画像を生成する前にEmpty Latent Imageを通してノイズ除去を行う必要がありますが、画像が追加されたため、Empty Latent Imageはもう必要ありません。

ワークフロー: 画像をアップロード→モデルを選択→プロンプトを入力→パラメータを調整→生成。

パラメータ:

denoise: ノイズ除去の強度で、0から1の間で調整可能。

Img2Imgを使用すると、スタイルの変更、画像の修復、画像の拡張、高解像度の復元などが可能です。

前処理画像

異なるノードを追加することで、画像のスケーリングやクロップが可能です。

Upscale Image/Upscale Image By: 画像のアップスケーリング。

ImageCrop: 画像のクロップ。

部分的な再描画

4つの方法:VAEエンコード(for Inpainting)、潜在ノイズマスク設定、ControlNetインペイント、およびCLIPSeg。

  1. VAE Encode (for Inpainting)

VAE Encode (for Inpainting)を追加し、マスクを接続します。画像を右クリックしてMaskEditorで開き、マスクを描きます。描いたマスクに問題がある場合、右クリックで削除できます。

ワークフロー:元の画像に似たモデルを選択し、マスク部分のプロンプトを入力します。

VAE Encode (for Inpainting): VAEエンコード(インペイント用):再描画と同等で、ランダム性が高く、元のマスクされた領域は保持されません。

  1. Set Latent Noise Mask

まず、VAEで画像をエンコードし、それを潜在空間が認識できるコンテンツに変換し、その後マスク領域をノイズコンテンツとして再生成します。

潜在ノイズマスク設定:元の画像を参照して再描画するため、生成されるコンテンツの理解が深まり、誤った画像が生成される可能性が低く、元の画像に似た形で微調整するのに適しています。

  1. ControlNet Inpaint

ControlNetを追加し、インペイントモデルを選択し、画像を前処理します(インペイントプリプロセッサ)。

注意:画像を潜在空間に入れるためにVAEエンコーダーを追加することを忘れないでください。

  1. CLIPSeg

プロンプトを入力してマスク領域を自動的に分割し、手動での塗り直しが不要です。潜在ノイズマスク設定と一緒に使用できます。

パラメータ:

text: 再描画したい領域を入力します。

threshold: コンテンツ認識の精度レベル。

dilation_factor: コンテンツ認識の拡散度。

出力:

Heatmap Mask: ヒートマップ画像。

BW Mask: 白黒画像。

認識されたマスク領域を個別にプレビューできます。

4つの再描画方法の違い:

  1. VAEエンコード(インペイント用):消去と再描画に相当し、ランダム性が高く、スクラッチからの生成に適しています。

  2. 潜在ノイズマスク設定:元の画像を参照して再描画し、元の画像に似た形で微調整するのに適しています。

  3. ControlNetインペイント:比較的安定しており、洗練されています。

  4. CLIPSeg:マスク領域を自動的に認識するため、手動での塗り直しが不要で、より便利です。

Last updated