wl-voice — Hyprland向けローカル音声録音&文字起こしツール

Tool

概要

Hyprland向けに設計された「wl-voice」は、音声を録音してローカルで文字起こしを行い、その結果をクリップボードにコピーするための軽量ツールです。バックエンドには Whisper 系モデルの高速実装である Faster Whisper を用い、CPU 環境下でも実用的な推論速度を実現します。インストールはプロジェクトに付属する Makefile を通じて仮想環境を作成し、依存をインストール、PyInstaller でデーモンと CLI の実行可能ファイルを作成してシステムに配置する流れです。動作は完全にローカルで完結し、プライバシーとオフライン利用を重視するユーザー向けの設計になっています。

GitHub

リポジトリの統計情報

  • スター数: 5
  • フォーク数: 0
  • ウォッチャー数: 5
  • コミット数: 7
  • ファイル数: 10
  • メインの言語: Python

主な特徴

  • ローカル完結の音声録音→文字起こしワークフロー(インターネット不要)
  • Faster Whisper を用いた CPU 最適化による高速な推論
  • Hyprland 向けにデーモンと CLI を提供し、クリップボード連携で即時利用可能
  • Makefile を使った仮想環境構築と PyInstaller によるバイナリ配布

技術的なポイント

wl-voice の核は「ローカルで使える実用的な文字起こし体験」をいかに提供するかにあります。大きなポイントは Faster Whisper の採用で、これは Whisper 系モデルをより高速に実行する実装群(最適化されたエンジンや量子化手法、効率的なバッチ処理など)を指し、GPU がない環境や CPU メインのデスクトップでもリアルタイムに近い応答を目指せます。README にあるようにツールはデーモンと CLI を持ち、デーモンが音声キャプチャとモデル推論を担当し、CLI やホットキーから録音開始をトリガーして結果を受け取る想定です。Makefile により仮想環境を自動作成し requirements.txt に基づく依存解決を行うほか、PyInstaller で実行可能ファイルを生成して /usr… 配下に配置することでシステム統合を容易にしています。クリップボードへのコピー機能は Hyprland のキーバインドやスクリプトと組み合わせることで、録音→即貼り付けという高速なユーザーフローを実現します。ローカル実行はプライバシー面の利点が大きく、ネットワーク遅延や外部サービスへの依存を排除する点が本プロジェクトの重要な設計意図です。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file — ビルド生成物や仮想環境などを無視
  • Makefile: file — 仮想環境作成、依存インストール、PyInstaller ビルド、バイナリ配置を自動化
  • README.md: file — インストールと使い方の概要、デモ GIF へのリンク
  • demo.gif: file — 動作イメージ(録音から文字起こし、クリップボードへのコピー)を短く示すアニメーション
  • requirements.txt: file — Python 依存パッケージ一覧(Faster Whisper など)

その他ファイル(計 5 ファイル)

  • デーモン実装スクリプト(サーバー的に動作して録音・推論を行う)
  • CLI 実行スクリプト(ユーザー操作から録音をトリガー)
  • PyInstaller 用の設定や spec ファイル
  • 小さなユーティリティ(クリップボード操作、設定読み込み等)
  • ライセンスやメタ情報ファイル

インストール手順(README 抜粋ベース)

  1. uv(Python パッケージ管理ツール)が必要
  2. make install を実行すると仮想環境作成、依存インストール、PyInstaller ビルド、バイナリの配置が行われる

まとめ

Hyprland 環境でローカルに文字起こしを組み込みたい人向けの実用的なツール群です(約50字)。

リポジトリ情報: