zhtw-mcp — 繁体中文(台湾)向け言語リンター
概要
zhtw-mcp は、繁体中国語(台湾ローカル:zh‑TW)向けに設計された言語リンターで、台湾教育部が定める公的基準に従って語彙、句読点、字形の不一致を検出します。特に、中国大陸(zh‑CN)由来の語や句読点の使い方、簡体字混入、異字体のずれなど「地域差」による誤用を AI アシスタントのコンテキストに入る前に捕捉できるよう、Model Context Protocol(MCP)を用いてアシスタントへプラグインすることを主眼としています。Rust で書かれており、軽量・高速に動作する CLI としても利用可能です。
リポジトリの統計情報
- スター数: 13
- フォーク数: 0
- ウォッチャー数: 13
- コミット数: 5
- ファイル数: 14
- メインの言語: Rust
主な特徴
- 台湾教育部(MoE)の公式基準に基づく語彙・句読点・字形のルールエンジン
- Model Context Protocol(MCP)経由で AI アシスタントに組み込み可能
- Rust 実装で軽量かつ高速、CLI として単体でも利用可能
- 地域差(zh‑CN → zh‑TW)のドリフトを事前に検出・修正提案
技術的なポイント
本プロジェクトは Rust エコシステムを基盤にしたルールベースのリンターです。内部的にはテキストを解析して個々のトークンや句読点、漢字の字形を照合する仕組みを持ち、台湾教育部が定める三つの基準(句読点規則、語彙用法、字形の選択)に基づいた判定ロジックを適用します。MCP 経由で動作するため、AI アシスタントのモデルコンテキストに入る前のチェックポイントとして機能し、メッセージのプレ・フィルタリングや生成物のポストチェックに使えます。Rust の特性を活かし、文字列操作や正規表現、Unicode 正規化(NFKC/NFC 等)を効率的に行い、巨大な入力でも低レイテンシで処理可能です。設計上はライブラリとしての利用と CLI 両方を想定し、Cargo 構成でパッケージ化されています。ルールセットや語彙マッピングは外部の辞書や設定ファイルで拡張可能な形式を想定しており、ローカルカスタマイズや組織別のスタイルに合わせたチューニングが容易です。MCP の導入により、アシスタント側での変換前後の差分警告や自動変換提案(例:簡体字→繁体字、句点の全角/半角統一、語彙の台湾用語への置換)を行えます。依存関係を極力抑えたシンプルな実装で、CI(.github)経由のビルドやテストの自動化も取り入れられる構成です。
プロジェクトの構成
主要なファイルとディレクトリ:
- .github: dir
- .gitignore: file
- Cargo.lock: file
- Cargo.toml: file
- LICENSE: file
…他 9 ファイル
(リポジトリは Rust 製のクレート構成で、Cargo の設定やローカルビルドに必要なファイルが含まれます。実行バイナリやライブラリ、ルール定義・辞書類がソース内に配置されている想定です。)
まとめ
台湾標準に特化した軽量で実用的な繁体字リンター。
リポジトリ情報:
- 名前: zhtw-mcp
- 説明: A linguistic linter for Traditional Chinese (zh-TW)
- スター数: 13
- 言語: Rust
- URL: https://github.com/sysprog21/zhtw-mcp
- オーナー: sysprog21
- アバター: https://avatars.githubusercontent.com/u/22310129?v=4
READMEの抜粋:
zhtw-mcp
A linguistic linter for Traditional Chinese (zh-TW) that enforces Taiwan Ministry of Education (MoE) standards on vocabulary, punctuation, and character shapes. It plugs into AI coding assistants through the Model Context Protocol (MCP) and catches Mainland Chinese (zh-CN) regional drift before it reaches the user.
The tool enforces three official Taiwan standards:
- [Revised Handbook of Punctuation](https://language.moe.gov.tw/001/upload/files/s…