Vibium — AIエージェント向けブラウザ自動化インフラ

Tool

概要

Vibiumは「Browser automation without the drama.」を掲げる、AIエージェント向けに最適化されたブラウザ自動化インフラです。特徴は単一のGoバイナリでブラウザの起動・監視・終了までを管理し、WebDriver BiDi(双方向のWebDriverプロトコル)を扱えるブリッジ機能を提供すると同時に、MCPサーバを公開してClaude Code等のMCPクライアントからブラウザを直接操作できる点です。これにより、設定や複雑な依存関係を最小限に抑え、エージェントやテストツールが即座に利用できる運用体験を実現します。

GitHub

リポジトリの統計情報

  • スター数: 28
  • フォーク数: 6
  • ウォッチャー数: 28
  • コミット数: 5
  • ファイル数: 7
  • メインの言語: 未指定

主な特徴

  • 単一のGoバイナリでブラウザのライフサイクル管理とサーバ公開を実現(運用が容易)
  • WebDriver BiDiプロトコル対応により、標準的なブラウザ自動化ツールやクライアントと相互運用可能
  • MCPサーバを提供し、Claude CodeなどのMCPクライアントからゼロセットアップでブラウザ操作が可能
  • AIエージェント向けの運用(エージェントが外部ブラウザを安全に利用する)とテスト自動化の両方で利用できる

技術的なポイント

Vibiumのコア設計は「シンプルで信頼できるランタイム」を目指しています。Goで単一バイナリを提供することで配布・デプロイが容易になり、言語特有のランタイム依存を排除します。技術的に注目すべき点は大きく分けて三つあります。

  1. ブラウザライフサイクル管理: Vibiumはブラウザプロセスの起動、監視、異常時の再起動、終了処理を一元管理します。これにより、長時間稼働するエージェント環境でもブラウザの安定性を保てます。ヘッドレス/フルブラウザのモードやリソース制限といった運用要件にも適応しやすい設計が想定されています。

  2. WebDriver BiDiのブリッジ: W3CのWebDriver BiDi(双方向通信)をサポートすることで、既存の自動化クライアントやテストツールと連携しやすくなります。BiDiはページ側のイベントをサーバにプッシュできるため、エージェントがページの状態変化を受け取りながら操作する用途に適しています。Vibiumはこのプロトコルを取り扱うことで、クライアント側の実装負担を軽減します。

  3. MCPサーバの公開: 特にAIエージェント向けの設計として、VibiumはMCP(Claude Code等が利用するプロトコル)サーバを公開します。これにより、Claude CodeのようなMCPクライアントが追加設定なしにブラウザをドライブ可能です。MCPを介した命令の伸縮性(例えばコマンドのキューイング、認証、セッション管理)によって、複数のエージェントやユーザーからの同時利用にも対応しやすくなります。

これらを組み合わせることで、VibiumはAIエージェントの「ブラウザを使いたい」という要望に対して、セットアップコストと運用リスクを低減しつつ、堅牢な実行基盤を提供します。ドキュメント(FILESYSTEM.md、V1-ROADMAP.md等)を参照することで、導入フローや将来の機能計画も追跡できます。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file — ビルド成果物や一時ファイルを除外する設定
  • FILESYSTEM.md: file — Vibiumが内部で用いるファイル構成や永続化領域についての説明(ログ・セッション・キャッシュ配置など)を定義
  • LICENSE: file — ライセンス情報(利用条件や再配布の可否)
  • README.md: file — プロジェクト全体の概要、クイックスタート、コンポーネント説明や利用例が含まれる主要ドキュメント
  • V1-ROADMAP.md: file — バージョン1に向けた開発ロードマップ、優先度や予定機能の記載 …他 2 ファイル

各ファイルはプロジェクトの運用・導入を容易にするためのドキュメントや設定が中心で、実行バイナリとドキュメントのバランスが取られています。FILESYSTEM.mdは特に永続化の挙動やどのディレクトリに何が置かれるかを明確にしており、コンテナ化やボリュームマウント時の運用に役立ちます。V1-ROADMAP.mdは今後の機能追加方針(例えばより細かなセッション管理、認証の強化、追加プロトコル対応など)を示しており、導入前に将来の互換性を判断する材料になります。

まとめ

AIエージェントが実ブラウザを安全に使うための、シンプルで実用的な自動化インフラ。

リポジトリ情報:

READMEの抜粋:

Vibium

Browser automation without the drama.

Vibium is browser automation infrastructure built for AI agents. A single Go binary handles browser lifecycle, WebDriver BiDi protocol, and exposes an MCP server — so Claude Code (or any MCP client) can drive a browser with zero setup. Works great for AI agents, test automation, and anything else that needs a browser.


Quick Reference

ComponentPurposeInterface
ClickerBrowser autom…