ComfyUI-QI-QwenEditSafe:Qwen Image Edit向けの一致性強化ノード

AI/ML

概要

ComfyUI-QI-QwenEditSafeは、ComfyUI上に組み込んでQwen Image Edit(Qwenによる画像編集)ワークフローの「一致性(consistency)」「画質安定性」を改善するためのノード/設定群です。本ノード(QI_TextEncodeQwenImageEdit_CN)は推論段階で条件(conditioning)に対して「同源のピクセル情報」を供給し、reference_latentsやreference_pixelsを注入することでVAE参照と条件の不整合を解消します。さらに、tokenize(images=[…])に補助原図や調色用アンカ画像を渡せる多重ビジュアルトークン化をサポートし、構図・色域・質感の逸脱を予防。双截棍/FLUX互換モードにより形状や解像度グリッドの衝突も軽減できます。シンプルなJSON設定(qwen_edit_safe_minimal_v1.json)と英中 README を備え、ComfyUIに容易に導入できるのが特徴です。

GitHub

リポジトリの統計情報

  • スター数: 13
  • フォーク数: 0
  • ウォッチャー数: 13
  • コミット数: 8
  • ファイル数: 4
  • メインの言語: Python

主な特徴

  • 推論時に条件ピクセルとVAE参照を「同源化」し、構図や色のズレを抑制
  • reference_latents / reference_pixels の注入によりリファレンス忠実度を向上
  • tokenize(images=[…])で補助原図やパレットアンカーを多重トークンとして利用
  • 双截棍(FLUX)互換モードで形状や解像度のグリッド衝突を低減

技術的なポイント

本プロジェクトの技術的中核は「条件(conditioning)を早い段階でソースに近づける」点にあります。一般的な画像編集ワークフローでは、元画像から得られるVAE潜在(latents)や条件ピクセルが前処理やリサイズ、クロップの違いによって不一致になり、これが再編集時の構図ずれや色変化、質感の喪失を招きます。ComfyUI-QI-QwenEditSafeはこれを解消するために、以下の仕組みを採用しています。

  • 同源像素(same-source pixels): 条件ピクセルとVAEエンコードに使う「主対齊(マスター)画像」を一致させ、スケールやクロップの差分から生じるドリフトを排除します。これにより、編集内容(ポーズの変更、大きな再構成、要素の差し替え)に対しても構図が安定します。
  • 参考注入(reference injection): reference_latentsおよびreference_pixelsを条件に直接注入できる設計で、モデルが参照情報をより直接的に参照できるようにします。これにより、元画像の色味や質感を保持しつつ新しい編集を行えます。
  • マルチビジュアルトークン(tokenize(images=[…])): 補助原図や調色用アンカ(palette anchor)を複数のビジュアルトークンとして取り込み、生成時にスタイルや色域をロックします。単一のテキストプロンプトでは難しい「色の一貫性」や「配色の制約」を視覚トークンで補強します。
  • 双截棍/FLUX互換モード: 形状の誤認やビューのずれ、解像度のグリッド干渉を回避するための互換性モードを提供。特定のフローで生じるアーティファクトを軽減します。

実装面では、ComfyUIのノードインターフェースに合わせたPythonモジュールと、ワークフロー定義用の最小JSON(qwen_edit_safe_minimal_v1.json)を同梱しており、既存のComfyUIフローに差し替えや挿入が容易です。また README_中文.txt が同梱されているため、中国語圏のユーザー向けに利用手順や設定の背景が説明されています。注意点としては、VAEの種類や画像前処理がワークフロー全体の一貫性に影響するため、同一のVAE設定・解像度運用を推奨する点です。導入により大幅な改善が期待できますが、完全自動で全てのケースを解決するわけではなく、入力リファレンスの品質やサイズ整合、ComfyUIのバージョン依存性には留意が必要です。

プロジェクトの構成

主要なファイルとディレクトリ:

  • README.md: file
  • README_中文.txt: file
  • init.py: file
  • qwen_edit_safe_minimal_v1.json: file

まとめ

Qwen Image Editワークフローで一貫した色・構図・質感を守るための実用的なComfyUI拡張です。

リポジトリ情報:

READMEの抜粋:

ComfyUI-QI-QwenEditSafe

ComfyUI-QI-QwenEditSafe

QI • 文生图编辑(中文·一致性增强)

本节点(QI_TextEncodeQwenImageEdit_CN)用于在 Qwen Image Edit 的编辑流程中提升一致性与画质稳定性,尽量避免在大幅编辑(重构图、改姿态、替换元素)时出现“构图跑偏”“质感被洗”“冷暖色调被改写”等问题。它从推理阶段着手,而非后期滤镜:让条件像素VAE 参考同源,支持把 reference_latents 与/或 reference_pixels 注入到条件里;同时可在 tokenize(images=[...]) 中引入辅助原图调色板锚定图作为多图视觉 token,从源头锁定风格与色域。节点提供双截棍/FLUX 兼容模式以降低形状/视图错误和分辨率网格冲突。

核心思路

  • 同源像素:用于条件与 VAE 编码的“主对齐图”完全一致,消除缩放/裁切不一致导致的漂移。
  • 参考注入:向 conditi…