verl-recipe(verl 用 RL トレーニングレシピ集)
2025/11/25
verl-recipe は、Volcengine の強化学習ライブラリ verl をベースにしたエンドツーエンドの強化学習(RL)トレーニング用サンプル集です。各レシピは再現可能なスクリプト、実装コード、説明ドキュメントを含む標準的なフォルダ構成に従い、verl の特定バージョンとの互換性情報やインストール手順を明示します。開発者はレシピを参照して学習パイプラインの構築や実験の再現、独自アルゴリズムの実装を始めやすくすることを目的としています(約300字)。