autoresearch-builder — 自律実験ループ(Claude Code対応)

Tool

概要

autoresearch-builderは「自律実験ループ」をシンプルなShellスクリプト群で実現するプロジェクトです。karpathy氏のautoresearchを発想の源にしつつ、Claude Code(Anthropic Claude向けのコード実行環境やプラグイン)に合わせて調整され、機械学習プロジェクトに限らずWeb/Flutter/Javaなど任意のプロジェクトタイプで動作する点が特徴です。基本的なサイクルは「現状解析→改善案生成→ターゲットファイル改変→実験実行→評価→良ければ保持、悪ければ再試行」を無限ループで繰り返すもので、実行者が中断するまで継続します。軽量な構成で既存リポジトリに組み込んで自動化ワークフローを試せます。

GitHub

リポジトリの統計情報

  • スター数: 14
  • フォーク数: 3
  • ウォッチャー数: 14
  • コミット数: 4
  • ファイル数: 5
  • メインの言語: Shell

主な特徴

  • Claude Code向けに適応された自律実験ループの実装(汎用プロジェクト対応)。
  • 単一ファイルを対象に変更を加え、実験を回して改善を継続するワークフロー。
  • Shellベースの軽量スクリプト群で導入が容易。既存プロジェクトへ組み込みやすい。
  • コマンド群を分離した設計(commandsディレクトリ)で拡張やカスタマイズが可能。

技術的なポイント

autoresearch-builderは概念的には「自動化された試行錯誤ループ」をシェルスクリプトとClaude向けプラグインで実現しています。技術的に注目すべき点は以下です。

  • ループ設計の単純さと可搬性: 仕組みはLOOP FOREVERの擬似コードに表されるように単純で、「現状解析→改善案生成→ターゲットファイル変更→実験実行→評価→採用/破棄」のサイクルを継続します。シェルスクリプト中心なので依存が少なく、UNIX環境で容易に動作します。
  • Claude Codeとの連携: READMEにある通りkarpathy版の思想を踏襲しつつClaude Code向けに調整されており、生成や改変の判断にClaudeを使う設計が想定されます。.claude-pluginの存在はClaudeとの連携ポイントを示し、LLMを使った改変案生成や評価ルールの自動化を容易にします。
  • 単一ファイルターゲット戦略: 自動改変の対象を一つのファイルに限定する手法は、変更範囲を小さく保ち、実験の帰属を明確にする利点があります。これにより差分管理やロールバックがシンプルになり、人間の介入なしで繰り返し試験を行いやすくなります。
  • 拡張性とコマンド分離: commandsディレクトリに実験実行や評価のためのスクリプト群を置くことで、プロジェクト固有のテスト・ビルド・評価フローを容易に差し替え可能です。ML以外のプロジェクト(WebアプリやFlutter、Javaなど)でも、適切なcommandsを用意すれば同じループで改善を回せます。
  • ダッシュボードと運用補助: autoresearch-dashboard.shのような補助スクリプトが用意されており、ループの状態確認やログ参照、実行制御に役立つことが期待されます。シンプルなダッシュボードで運用の可視化を図れる点は、長時間実行する自律ループでは重要です。
  • 安全性と停止制御: READMEは「ユーザーが止めるまで止まらない」と明記しており、無限ループ特性と停止手段(シグナルや制御スクリプト)を運用で整備する必要があります。自動変更はリスクを伴うため、ローカルでの検証やブランチ運用、CIとの組み合わせで安全弁を実装することが推奨されます。

これらの要素により、autoresearch-builderは軽量ながらも汎用的な自律実験フレームワークとして、Claudeを活用した改良案生成と自動評価の基盤を提供します。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .claude-plugin: dir
  • README-KR.md: file
  • README.md: file
  • autoresearch-dashboard.sh: file
  • commands: dir

まとめ

Claude対応で汎用性の高い自律実験ループをシェルで実現する軽量ツールです。

リポジトリ情報:

READMEの抜粋:

/autoresearch — Autonomous Experiment Loop for Claude Code

한글 README

Inspired by karpathy/autoresearch (43.7k stars). Adapted for any project type — not just ML.

An autonomous experiment loop that modifies a single file, runs experiments, and keeps improvements. It never stops until you tell it to.

How It Works

LOOP FOREVER:
  1. Analyze current project state
  2. Generate an improvement idea
  3. Modify the target...