tax-organizer — 個人税務ドキュメント整理スキル

AI/ML

概要

tax-organizerは、個人やフリーランス/コンサルタントの税務書類管理を自動化するためのClaudeベースのスキル群です。PDFや画像の領収書、W-2や1099といった税務書類、スプレッドシート出力を読み取り、書類の種類を判別して適切なフォルダに並べ替え、命名規則に従ってリネーム。さらに会計処理に有用なCSVレポートを生成して「会計士に渡せる」状態にします。ユーザーはドキュメント群をアップロードしてスキャンを実行するだけで、ビジネスラインの設定や整理フローを対話的に進められる点が特徴です(約300字)。

GitHub

リポジトリの統計情報

  • スター数: 5
  • フォーク数: 1
  • ウォッチャー数: 5
  • コミット数: 2
  • ファイル数: 4
  • メインの言語: Python

主な特徴

  • ドキュメントの自動読み取り(PDF・画像・スプレッドシート)と分類。
  • ビジネスラインの対話的セットアップにより、手作業でのフォルダ作成不要。
  • ファイルの自動リネームと整理、会計用CSVレポートの生成。
  • Claude Codeを活用した処理フローで、自然言語ベースのガイダンスを提供。

技術的なポイント

READMEの記述およびリポジトリ構成から読み取れる要点と、実装上で有効な技術選定について解説します。

まず、このプロジェクトは「Claude skill」として設計されているため、ドキュメント解析や分類の中核にLLM(Claude)を置き、自然言語でのガイダンスや解釈を行う設計です。LLMは「どの書類が何か」「どのビジネスラインに割り当てるか」「どのフィールドをCSVに出力するか」といった高レベルな判断を担います。一方、実際のPDFや画像からのテキスト抽出はOCRやPDFパーシングが必要で、Pythonではpdfplumber、PyPDF2、pytesseract、pdfminer.sixなどが実用的です。抽出後の構造化にはpandasでのテーブル整形や正規表現によるフィールド抽出が有効です。

ファイルの自動リネーム・ソートはメタデータ(日付、金額、ベンダー名、書類種別)に基づくルールエンジンを用いると柔軟です。例えば「YYYY-MM-DD_ベンダー_領収書.pdf」形式で統一するなど、一貫したネーミング規則と衝突検知ロジック(同名ファイルのバージョン付与やインクリメント)を実装すると信頼性が向上します。ビジネスラインのセットアップは対話フローとして設計され、ユーザーの応答からルールやマッピングを保存して以後の自動分類に利用します。

セキュリティとプライバシーも重要です。税務書類は機密性が高いため、ローカル処理が選択肢となり得ます(オンプレミスOCRとローカル保存)。クラウドを利用する場合は暗号化、アクセス制御、ログ管理を整備すべきです。出力CSVは会計ソフトのインポート仕様(フィールド順、フォーマット)に合わせるため、設定でテンプレートを切り替えられると実用的です。

最後に、テストと検証の観点では、多様なフォーマットのサンプル(W-2や1099の各フォーマット、領収書の画像解像度差異)を用意してエンドツーエンドのパイプライン検証を行うことが成功の鍵になります。

(約700字)

プロジェクトの構成

主要なファイルとディレクトリ:

  • LICENSE: file
  • README.md: file
  • SKILL.md: file
  • skills: dir

READMEやSKILL.mdにはセットアップ手順、スキルの振る舞い、ユーザーとの対話フローや期待される入力形式(PDF、CSV、画像)についての記載があり、skillsディレクトリにはClaudeスキルとして動作するためのコードやメタ情報が格納されている想定です。ライブラリ依存や実行例、入力サンプルはREADMEで案内される可能性が高いです。

まとめ

Claudeを活用した税務書類整理のプロトタイプで、実運用向けの拡張性とプライバシー設計が鍵になるリポジトリです(約50字)。

リポジトリ情報:

READMEの抜粋:

Tax Organizer — Setup Guide

Organizes your personal and consultant tax documents (W-2s, 1099s, rental expenses, donations, business trips) and generates ready-to-review CSV reports for your accountant. Powered by Claude Code.


What This Skill Does

  • Reads PDF receipts, invoices, W-2s, 1099s, and spreadsheet exports
  • Scans your documents and guides you through business line setup — no manual folder creation needed
  • Renames and sorts files into the right folders automatically
  • Calcu…