PerTouch:パーソナライズされた意味的画像レタッチのVLMエージェント
2025/11/13
PerTouchは、視覚言語モデル(VLM)を中核に据えた画像レタッチ用エージェントを提案する研究プロジェクト(AAAI 2026)。ユーザーの好みや文脈に基づいた「パーソナライズ」と、画像内の意味的領域を認識して局所的・全体的に最適なレタッチ操作を選択・実行する能力を組み合わせることを目指しています。本リポジトリはその公式コードであり、執筆時点では構成とドキュメント整備中で公開準備が進められています。研究論文と連携した実験・モデル実装、エージェント制御ロジック、デモ用パイプラインの提供が期待されます(詳細は順次追加予定)。