Comfyui_BananaTutuapiによるGoogle Gemini画像生成カスタムノード

AI/ML

概要

Comfyui_BananaTutuapiは、Google Geminiの画像生成をComfyUI上で簡単に利用できるように設計されたカスタムノードです。複数のAPIプロバイダーに対応し、特にGoogle Gemini 2.5 Flash向けに最適化されています。12種類の専門的なプリセットを備え、ユーザーがカスタム設定を保存・読み込み可能。ストリーミングレスポンスにも対応し、リアルタイムでの画像生成状況の把握が可能です。Pythonで実装されており、軽量ながら高機能で、AI画像生成のワークフローを効率化します。

GitHub

リポジトリの統計情報

  • スター数: 11
  • フォーク数: 0
  • ウォッチャー数: 11
  • コミット数: 4
  • ファイル数: 16
  • メインの言語: Python

主な特徴

  • 複数APIプロバイダー対応(ai.comfly.chat、OpenRouter)
  • Google Gemini 2.5 Flash画像生成に特化した最適化
  • 12種類の専門的プリセット搭載とカスタムプリセットの保存・読み込み
  • ストリーミングレスポンス対応でリアルタイム処理が可能

技術的なポイント

Comfyui_BananaTutuapiは、Google Geminiを中心に据えた画像生成AIをComfyUIのカスタムノードとして実装した点が最大の特徴です。ComfyUIはノードベースの画像生成ツールであり、ユーザーは視覚的にモデルや処理を組み合わせられますが、本リポジトリはその拡張としてGoogle Gemini APIを活用可能にしました。

複数のAPIプロバイダーをサポートしており、ai.comfly.chatとOpenRouterに対応。これによりユーザーは利用環境やAPIの安定性に応じて選択可能です。API呼び出しはPythonで実装され、HTTPリクエストの最適化やエラーハンドリングも組み込まれています。

Google Gemini 2.5 Flashという最新バージョンの画像生成に特化し、パラメータ調整やレスポンス処理を最適化しています。これにより高品質かつ高速な画像生成が実現されているのが強みです。

また、12種類の専門的なプリセットを内蔵し、ユーザーは複雑なパラメータ設定をプリセットから選択するだけで手軽に利用できます。さらにカスタムプリセットの保存・読み込み機能もあり、ワークフローの繰り返し利用に便利です。プリセットはJSON形式などで管理され、拡張や共有も容易です。

ストリーミングレスポンスに対応している点も注目すべき技術的特徴です。画像生成中に部分的な結果をリアルタイムで受け取れるため、ユーザーは進捗状況を把握しやすく、処理待ち時間のストレスを軽減。非同期処理やWebSocket通信の活用も伺えます。

これらの技術要素はPythonの軽量なコードベースで実装されており、ComfyUIの他ノードとの統合もスムーズ。APIキーの管理や環境設定も簡単に行え、開発者だけでなく一般ユーザーにも扱いやすい設計です。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: Git管理除外設定ファイル
  • LICENSE: ライセンス情報
  • README.md: プロジェクト概要と使用方法説明
  • Tutu.py: メインのPythonスクリプト。API呼び出しやノード定義を担当
  • Tutuapi.json: プリセット設定ファイル。12種類のプロ仕様プリセットを管理

その他にもAPI通信処理やレスポンス処理、UI連携用の補助ファイルが含まれています。全16ファイルで構成されており、Pythonのモジュールとして整理されています。

まとめ

Google Gemini対応の多機能カスタムノードでComfyUIの画像生成を強化。

リポジトリ情報: