Buyer Eval — B2Bベンダー評価スキル

AI/ML

概要

Buyer Evalは、購入検討者(バイヤー)に代わりB2Bソフトウェアベンダーを構造的かつ証拠ベースで評価するClaudeスキルです。ユーザーが会社名と評価対象ベンダーを与えると、まず企業の業種・規模・技術スタック・成熟度などをリサーチしてフォーム入力の手間を省きます。次に、ソフトウェアのカテゴリに応じたドメイン専門家レベルの質問を行い、見落としがちな要件を掘り下げます。さらにハードコンストレイント(必須要件)を設定し、ベンダーとの会話や公開情報を根拠にスコアリングを行い、透明性のある証拠付きレポートを生成します。Claude Codeや対話型AIエージェントとの連携を想定した設計が特徴です。

GitHub

リポジトリの統計情報

  • スター数: 36
  • フォーク数: 1
  • ウォッチャー数: 36
  • コミット数: 4
  • ファイル数: 7
  • メインの言語: Shell

主な特徴

  • 企業プロファイルの自動リサーチにより入力負荷を削減
  • ソフトウェアカテゴリ別のドメイン専門家質問で要求を深掘り
  • ハードコンストレイントを立てた上での証拠ベースなスコアリング
  • Claude/エージェント連携による対話型のベンダー評価フロー

技術的なポイント

このリポジトリは「Claudeスキル」として動作する設計思想が中核にあります。SKILL.mdにはスキルの振る舞い(プロンプトや対話フロー、期待される入力/出力形式)が定義されていると推測され、EVALUATION.mdには評価基準やスコアリングルーブリック、証拠の取り扱いルールが記されていることが想定されます。実装自体は小規模で、Shellが主要言語になっている点から、スキルのパッケージ化やデプロイ用のスクリプト、テスト用のラッパーが含まれている可能性があります。

設計上の注目点は「証拠のトレーサビリティ」と「ドメイン専門家質問」の組み合わせです。単なるヒューリスティックな評価ではなく、ベンダーの公開情報や会話ログを根拠にスコアを算出し、その根拠(引用やメタデータ)を出力することで透明性と再現性を確保します。評価パイプラインはおそらく次のような段階を持ちます:企業リサーチ → 要件掘り下げ(プロンプト駆動)→ ハード要件判定 → ベンダー情報収集(会話・公開データ)→ 証拠付きスコア算出 → レポート出力。各段階でClaudeのLLM能力を使い、意図的なプロンプト設計(システムメッセージ、例示、評価基準の埋め込み)で医療や金融などカテゴリ特有の要件にも対応可能にしています。

実運用での懸念点としては、外部データの取得方法やプライバシー、ソース信頼度の自動判定、スコアのバイアス管理があります。EVALUATION.mdに明示された評価基準や重み付けのカスタマイズ機能があるかどうかが実用性を左右します。また、Claude Codeやエージェントと組み合わせることで、ベンダーとの模擬会話をエージェントに任せ、実際のRFPやデモで出る応答をシミュレートして比較するなど、対話ループを用いた検証が可能です。小規模リポジトリの利点はカスタマイズのしやすさと導入の軽さで、企業内ワークフローへの組み込みや独自評価軸の導入も比較的容易です。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file
  • EVALUATION.md: file
  • LICENSE: file
  • README.md: file
  • SKILL.md: file

…他 2 ファイル

まとめ

Claudeベースで証拠重視のベンダー評価を自動化する実用的なスキル群。導入やカスタマイズが容易。

リポジトリ情報:

READMEの抜粋:

Buyer Eval — B2B Software Vendor Evaluation Skill

A Claude skill that conducts structured, evidence-based evaluations of B2B software vendors on behalf of buyers.

What it does

You give it your company name and the vendors you’re evaluating. It:

  1. Researches your company — industry, size, tech stack, maturity — so you don’t fill out a form
  2. Asks domain-expert questions specific to the software category — surfacing hidden requirements you didn’t know to mention
  3. **Sets hard c…