Auto-claude-code-research-in-sleep(睡眠中の自律ML研究)

AI/ML

概要

このリポジトリは、AnthropicのClaude Code向けに設計されたカスタムスキル群を使って、機械学習研究の一部工程を自動化するプロトタイプです。Claude Codeが中心となり、Codexを用いたMCP(cross-model review loop)により複数モデルが互いにレビューとフィードバックを行い、論文や実験のスコアリング、欠点の指摘、実験の起動や結果反映、文章の書き直しを反復します。主に概念実証とワークフローの自動化を目的としています。

GitHub

リポジトリの統計情報

  • スター数: 37
  • フォーク数: 5
  • ウォッチャー数: 37
  • コミット数: 6
  • ファイル数: 4
  • メインの言語: 未指定

主な特徴

  • Claude Codeスキルによる自律的な研究ワークフローのオーケストレーション
  • Codexを使ったクロスモデルレビュー(MCP)で相互評価と改善ループを実現
  • スコア推移を可視化する自動レビューの進捗管理(auto_review_score_curve.png)
  • モジュール化されたskillsディレクトリでスキル拡張が可能な設計

技術的なポイント

本プロジェクトは「モデル同士の相互レビューと反復改善」をワークフローの核に据えています。Claude Codeはワークフローのオーケストレータとして動作し、CodexベースのMCP(multi-/meta-checkpoint process の意図的な利用)を通じて別モデルにレビューや修正案を出させるクロスモデルループを実装します。各反復で生成されるアウトプットはスコアリングされ、auto_review_score_curve.png のように改善の推移を可視化します。実験実行やナラティブ書き換えはスキルとして定義され、skillsディレクトリ内のモジュールを通じて呼び出されます。構成は小規模で概念実証色が強く、実運用にはAPIキー管理や実験環境の整備、ログ・再現性の担保が必要です。拡張性としては、新しいスキルの追加で別モデルや外部ツールとの連携を容易に組み込める設計になっており、エラー処理や安全性チェック(有害生成の防止など)を追加する余地があります。また、コミット数が少ないことから現状はプロトタイプであり、実利用前に設定手順や依存関係の明示的なドキュメント化が望まれます。

プロジェクトの構成

主要なファイルとディレクトリ:

  • README.md: file
  • README_CN.md: file
  • auto_review_score_curve.png: file
  • skills: dir

まとめ

コンセプトは先進的だが現状は試作段階で実運用には整備が必要。

リポジトリ情報:

READMEの抜粋:

Auto-claude-code-research-in-sleep

中文版 README | English

Score Progression

🌙 Let Claude Code do research while you sleep. Wake up to find your paper scored, weaknesses identified, experiments run, and narrative rewritten — autonomously.

Custom Claude Code skills for autonomous ML research workflows. These skills orchestrate cross-model collaboration — Claude Code drives the research …