ComfyUI用Qwen-Image APIプラグイン

AI/ML

概要

「comfyui-modelscope-qwen-image」は、オープンソースの画像生成UIであるComfyUIに対応したカスタムノードプラグインです。本プラグインを導入することで、ModelScopeが提供するQwen-Image APIを利用し、ComfyUI上から直接テキストプロンプトによる画像生成が可能になります。APIキーや各種パラメータは設定ファイルで管理でき、生成画像の解像度調整やネガティブプロンプトの利用、シード値固定など細かな制御も行えます。エラーハンドリングやタイムアウト管理も実装されているため、安定した運用が期待できる点も特徴です。Pythonで開発されており、シンプルな構成で導入も容易です。

GitHub

リポジトリの統計情報

  • スター数: 8
  • フォーク数: 0
  • ウォッチャー数: 8
  • コミット数: 2
  • ファイル数: 6
  • メインの言語: Python

主な特徴

  • ComfyUIのカスタムノードとしてModelScopeのQwen-Image APIを直接呼び出し可能
  • APIトークンや設定をconfig.jsonで簡単に管理
  • 画像の解像度を64x64から2048x2048まで柔軟に指定可能
  • ネガティブプロンプト対応やシード値設定、サンプリングステップ数調整が可能

技術的なポイント

本プラグインはPythonで実装されており、ComfyUIの拡張機能として動作するカスタムノードとして設計されています。中心となるのはqwen_image_node.pyで、ここでModelScopeのQwen-Image APIへのHTTPリクエストを管理し、画像生成のパラメータを受け取ります。

API通信では、ユーザーが設定ファイルconfig.jsonに指定したAPIトークンを用いて認証を行い、テキストプロンプトやネガティブプロンプト、画像サイズ、シード値、サンプリングステップ数、ガイダンススケール(引導係数)など、多彩なパラメータをAPIに渡します。これにより生成される画像の品質やスタイルを細かく調整可能です。

また、APIからのレスポンスとして返却された画像データは、ComfyUIが扱える形式(主にPIL画像など)に自動変換され、ユーザーは生成画像をノード出力として他の処理に繋げられます。画像サイズは64×64から最大2048×2048まで対応しており、小さいサムネイルから高解像度画像まで幅広く生成可能です。

エラーハンドリングも充実しており、API通信のタイムアウトやレスポンス異常時には適切に例外処理を行い、ComfyUIのUI上にエラーメッセージを反映します。これにより安定した運用とトラブルシューティングが容易になっています。

さらに、シード値の固定やランダム化が選べるため、同じ設定での再現性ある画像生成や多様なバリエーション作成も可能です。サンプリングステップ数の調整によって処理時間と画像の精度のバランスをコントロールできます。

インストールは非常に簡単で、プラグインフォルダをComfyUIのcustom_nodesディレクトリにコピーし、必要なPython依存パッケージをインストールするだけです。これにより、ユーザーは既存のComfyUI環境に無理なく本機能を追加できます。

全体として、ModelScopeの強力なQwen-Imageモデルの能力をComfyUIの柔軟なUIと組み合わせ、テキストから高品質な画像を手軽に生成できる実用性の高いプラグインであると言えます。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: Git管理対象外ファイル指定
  • README.md: リポジトリの説明とインストール方法
  • __init__.py: Pythonパッケージ初期化用ファイル
  • config.json: APIトークン等の設定ファイル
  • qwen_image_node.py: ComfyUIカスタムノードの主要実装ファイル
  • その他ファイル1点(詳細不明)

まとめ

ComfyUIにModelScopeのQwen-Image APIを統合し、簡単かつ高機能な画像生成環境を提供する優れたプラグイン。

リポジトリ情報: