ComfyPilot — ComfyUI向け自然言語ワークフローアシスタント

AI/ML

概要

ComfyPilotは、ComfyUIでの画像生成ワークフロー構築を自然言語で行えるようにするAIアシスタントです。ユーザーが「高解像度にして」「ノイズを減らす処理を追加して」といった会話的な指示を与えると、バックエンドで指定したLLM(Claude、Ollama、Geminiなど)に問い合わせ、適切なノードや接続を生成・編集してComfyUIのワークフローとして反映します。Pythonで書かれたモジュール化設計により、異なるエージェントの追加やワークフロー処理の拡張が容易で、プロトタイプ作成や反復的なワークフロー調整を効率化します。

GitHub

リポジトリの統計情報

  • スター数: 2
  • フォーク数: 0
  • ウォッチャー数: 2
  • コミット数: 15
  • ファイル数: 13
  • メインの言語: Python

主な特徴

  • 自然言語でComfyUIワークフローを作成・編集可能
  • Claude、Ollama、Geminiなど複数のLLMと連携するエージェント設計
  • モジュール化されたエージェントディレクトリで拡張しやすい構成
  • GPL-3.0ライセンス・Python 3.10+対応のアルファ段階プロジェクト

技術的なポイント

ComfyPilotは「自然言語 → ワークフロー(ノードグラフ)」という変換パイプラインを中核に据えています。入力された会話をLLMに送信し、LLMから返された構成指示をパースしてComfyUIのノード定義(ノード種別、パラメータ、接続関係)へマッピングする処理が主要な役割です。実装はPythonで、agentsディレクトリに各種エージェントのインタフェースやプロンプトテンプレートを分離することで、バックエンドのモデル差分(APIやレスポンス形式)を吸収できる設計になっています。応答の検証・バリデーションや既存ワークフローとのマージ処理を行うことで、意図しない破壊的変更を抑える仕組みを想定しています。さらに、ComfyUIが扱うノードのシリアライズ/デシリアライズ(JSONや内部表現)を介して読み書きを行い、GUI側へ即時反映できるようなパスを提供します。エラー処理や会話の文脈保持により、対話的な微調整(パラメータ変更、ノード追加・削除)を連続して行えるのも特徴です。アルファ段階であるため安全性・堅牢性や対応ノードの網羅は今後の課題ですが、拡張ポイント(新エージェント追加、プロンプトチューニング、ノードテンプレートの追加)は明確に分離されています。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file
  • LICENSE: file
  • README.md: file
  • init.py: file
  • agents: dir

…他 8 ファイル

まとめ

自然言語でComfyUIワークフローを操作できる有望なプロトタイプ。

リポジトリ情報:

READMEの抜粋:

🚀 comfy-pilot

AI assistant for ComfyUI — Create and modify workflows through natural language conversation.

Talk to Claude, Ollama, Gemini, or other AI agents directly in ComfyUI. Describe what you want, get a working workflow.

License Python ComfyUI Status