書籍丸ごと翻訳するClaude Codeスキル「translate-book」
概要
Rainman Translate Book(translate-book)は、書籍形式のファイル(PDF/DOCX/EPUB)を対象に、全文を別言語へ翻訳するためのClaude Codeスキルです。ワークフローは原稿を意味のとれるチャンクに分割し、各チャンクを並列にサブエージェント(subagents)へ割り振って同時に翻訳を行い、最終的に順序や章立てを維持したまま結合して出力する設計になっています。既存プロジェクト claude_translater のアイデアを受け継ぎつつ、シェルスクリプトを中心とした実装からClaude Code Skillとして再構築し、エージェント分割や並列化にフォーカスした点が主な改良点です。単純な構成で導入しやすく、書籍翻訳の実験やプロトタイプ実装に向きます。
リポジトリの統計情報
- スター数: 124
- フォーク数: 7
- ウォッチャー数: 124
- コミット数: 8
- ファイル数: 6
- メインの言語: Python
主な特徴
- 書籍(PDF/DOCX/EPUB)を対象にした全文翻訳ワークフローを提供
- チャンク分割とサブエージェントによる並列翻訳でスループットを向上
- Claude Code Skillとして整理され、既存のclaude_translaterから設計をリファクタ
- 軽量なPython構成で導入・拡張が容易
技術的なポイント
translate-book の技術的核は「分割(chunking)」「並列サブエージェント」「結合(merging)」の三段階ワークフローにあります。まず入力ファイル(PDF/DOCX/EPUB)から本文テキストを抽出し、自然な文脈を損なわない単位でチャンクに分割します。チャンク化は翻訳品質に直結するため、段落・見出し・文脈窓を考慮した境界設計が重要です(例えば章見出しを跨がない、文の途中で切らない等)。スキャンPDF等の画像ベースの場合はOCRが必要になる点にも注意が必要です。
次に各チャンクを「サブエージェント」に割り当て、並列で翻訳を実行します。Claude Codeのサブエージェント機能を使うことで、個別チャンクごとに独立したコンテキストを持たせた上で同時実行が可能になり、全体の処理時間を短縮できます。並列度はAPIレート制限やコスト、モデルが扱えるコンテキスト長に応じて調整します。各サブエージェントは翻訳の一貫性を保つために、スタイルガイド(用語集、トーン、固有名詞の処理方針)を共通で受け取り、翻訳結果の整合性を高めます。
最後に翻訳済みチャンクを元の順序・構造に戻して結合します。ここでは目次(TOC)や章番号、図表のキャプションなど構造情報を保持してマッピングする処理が重要です。自動結合の際に段落の連結や改行ルール、フォーマット維持(PDFへの再変換やDOCX出力)などの後処理を行い、読みやすい最終成果物を生成します。エラー処理では再試行や部分的なロールバック、低品質チャンクの再翻訳などを実装すると堅牢です。
実装面ではPythonを用いた軽量構成で、Claudeとのやり取りはCLIやSDKを経由します。元プロジェクトと違ってスクリプト群ではなくスキル設計に整理されているため、サブエージェントの管理・ログ追跡・並列実行制御が明確になっています。注意点として、長文の翻訳では用語の整合性や文体維持が難しくなるため、用語集や先行チャンクの要約コンテキストを補助的に渡す戦略が有効です。また、機密情報や著作権の扱い、翻訳品質の確認フロー(人間によるレビュー)を設計に組み込むことが実運用では重要になります。
プロジェクトの構成
主要なファイルとディレクトリ:
- .gitignore: file
- LICENSE: file
- README.md: file
- README.zh-CN.md: file
- SKILL.md: file
…他 1 ファイル
(リポジトリはシンプルで、スキル定義やREADME類、ライセンスファイルが中心の構成です。実行エントリや依存管理はREADMEやSKILL.mdに記載されている想定です。)
まとめ
Claudeのサブエージェントで並列化した書籍翻訳スキル。プロトタイプや実験に最適。
リポジトリ情報:
- 名前: translate-book
- 説明: Claude Code skill that translates entire books (PDF/DOCX/EPUB) into any language using parallel subagents
- スター数: 124
- 言語: Python
- URL: https://github.com/deusyu/translate-book
- オーナー: deusyu
- アバター: https://avatars.githubusercontent.com/u/42929363?v=4
READMEの抜粋:
Rainman Translate Book
English | 中文
Claude Code skill that translates entire books (PDF/DOCX/EPUB) into any language using parallel subagents.
Inspired by claude_translater. The original project uses shell scripts as its entry point, coordinating the Claude CLI with multiple step scripts to perform chunked translation. This project restructures the workflow as a Claude Code Skill, using subagents to translate chunks in pa…