TypeNo — プライバシー重視のmacOS向け音声入力ツール

Tool

概要

TypeNoは「押して話す」だけでテキスト入力を完了できる、極めてシンプルなmacOS用音声入力アプリです。最小限の操作フロー(Controlキーで録音開始・話す・録音終了)により、ユーザーは意識を途切れさせずに音声をテキスト化して任意のアプリに貼り付けられます。特徴は「ローカルでの転写」と「プライバシー重視」の設計で、音声やテキストをクラウドに送信しないことを重視しています。リポジトリはSwiftで書かれ、Package.swiftが含まれているためSwift Package Managerに対応した構成が見て取れます。

GitHub

リポジトリの統計情報

  • スター数: 136
  • フォーク数: 11
  • ウォッチャー数: 136
  • コミット数: 7
  • ファイル数: 10
  • メインの言語: Swift

主な特徴

  • ローカルでの音声転写(プライバシー優先)
  • Controlキーで素早く操作できるシンプルなUX
  • 結果を即座にアクティブなアプリへ貼り付ける自動ペースト機能
  • オープンソースかつ軽量でメンテナンスしやすい設計

技術的なポイント

リポジトリの構成やREADMEの記述から読み取れる技術的な観点を整理します。TypeNoはmacOSネイティブアプリとしてSwiftで実装されており、Package.swiftが存在するため依存管理やビルドにSwift Package Managerが使われる可能性が高いです。Appディレクトリ以下にアプリ本体のソースがまとまっている想定で、UIや操作フローは極めてミニマルに設計されています。ユーザー体験面では「ホットキー押下→録音→ローカル転写→貼り付け」という短いパスを実現することが目的で、低レイテンシ(READMEでは“1秒以内”と表記)を達成するためにオーディオのキャプチャ、転写処理、ペースト操作がシームレスに連携しています。

プライバシー優先という方針は、音声データやテキストを外部のクラウドに送信しないことを意味し、端末内で完結する音声認識ライブラリやオンデバイスモデルを利用しているか、あるいはmacOS組み込みの音声認識API(例:AppleのSpeechフレームワーク)やローカル実行可能な軽量モデルをラップしていると推測されます。ローカル処理の実装では、AVFoundationなどのフレームワークでマイク入力を取得し、取得したPCMデータを認識エンジンに渡す流れが一般的です。認識結果をユーザーが使っているアプリへ渡す処理は、NSPasteboard(クリップボード)に書き込み、CGEventやAppleScript、またはアクセシビリティAPIを用いて貼り付けをトリガーする形が考えられます。

macOSのセキュリティモデル上、マイクや入力監視、アクセシビリティの利用にはユーザーの許可が必要になるため、環境設定や初回起動時の権限ダイアログ、設定方法の案内が重要です。小規模なコードベース(ファイル数が少ない)からは、不要な外部依存を抑え、シンプルに動作することを優先している方針が読み取れます。ライセンスファイルが含まれているため、利用や改変のルールが明確化されています。将来的な拡張としては多言語対応、ホットキーのカスタマイズ、音声認識モデルの選択肢(組み込み/外部)などが考えられますが、現状は「すぐ使える」「速く、ローカルで完結する」ことに重点が置かれています。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file
  • App: dir
  • LICENSE: file
  • Package.swift: file
  • README.md: file

…他 5 ファイル

READMEの抜粋(主要箇所):

  • 「Press Control, speak, done.」というシンプルな操作説明
  • 「ローカルで転写して、結果をペーストする」ことを強調
  • オフィシャルサイト: https://typeno.com

まとめ

プライバシー重視かつ即時性の高い音声入力をシンプルに実現した良質なミニマルアプリ。

リポジトリ情報: