rag-chunk — MarkdownをRAG向けに分割・評価するCLIツール
2025/11/15
rag-chunkはMarkdownドキュメントを解析・クリーンアップし、RAG(Retrieval-Augmented Generation)用にチャンク化(固定サイズ、スライディングウィンドウ、段落ベース)して評価できる軽量CLIツールです。リコールベースの評価機能や表/JSON/CSV出力、実践的なサンプルコーパスが同梱され、PyPIで公開されています。ドキュメント前処理やコーパス準備を素早く行いたい開発者や研究者に有用です。