KeywordSpotterSystem — 音声生体認証とウェイクワード検出システム
2026/1/16
SHERPA-ONNX を基盤にした実運用向けの音声認識システム。ウェイクワード(起床語)検出と音声(声紋)認証を統合し、GUI ベースで登録(エンロール)、管理、リアルタイム認識、定量評価まで一貫したワークフローを提供します。ローカルの ONNX モデルを利用してネットワーク不要でプライバシーに配慮した推論を行える点が特徴です。(約300字)
158ページ目 / 632ページ(全7583記事)
2026/1/16
SHERPA-ONNX を基盤にした実運用向けの音声認識システム。ウェイクワード(起床語)検出と音声(声紋)認証を統合し、GUI ベースで登録(エンロール)、管理、リアルタイム認識、定量評価まで一貫したワークフローを提供します。ローカルの ONNX モデルを利用してネットワーク不要でプライバシーに配慮した推論を行える点が特徴です。(約300字)
2026/1/16
Kiro2APIはKiro AI(Kiro IDE)をOpenAI/Claude/Augment Code互換の標準APIサービスに変換するシンプルなツールチェーンです。Claudeの/v1/messagesとOpenAIの/v1/chat/completionsの両プロトコルに対応し、HTTP/HTTPS/SOCKS5のプロキシプール、セッション派生によるIP分離、複数アカウントの負荷分散、自動リトライ、SQLiteによる永続化など実運用に必要な機能を揃えています。シェルスクリプト中心の軽量構成で、簡単にデプロイして既存のKiro環境を外部互換APIとして公開できます。
2026/1/16
Kotlin MultiplatformとCompose Multiplatformを使って作られたLuckin CoffeeのUIクローンです。1つのコードベースからAndroid/iOS/Web/Desktop向けにUIを共通化し、アニメーションやカルーセルなどのモダンなデザイン表現を備えています。UI表現の参考実装やComposeマルチプラットフォーム導入のサンプルとして有用で、プレミアムなビジュアル表現をKotlinで実現することにフォーカスしています。(約300字)
2026/1/16
ライブ配信コマースにおける視聴者のリアルタイムチャットを対象に、トピックモデリングと機械学習を用いて消費者行動パターンを可視化・比較するための実装をまとめたリポジトリ。Python(3.8+)で構築され、データ前処理、特徴量抽出、トピック抽出、モデル比較、分析レポート(analysis.pdf)が同梱されており、実務・研究の両面で利用可能なワークフローを提供することを目的としている(約300字)。
2026/1/16
MirageKitはmacOSをホストとしてウィンドウや仮想ディスプレイをキャプチャし、iPadOS、visionOS、別のmacOSクライアントへピアツーピアで低遅延の映像を送信するSwift製フレームワークです。SwiftUI + Metalの表示コンポーネントを備え、UDPベースのストリーミングと入力転送を組み合わせて、インタラクティブなリモート操作体験を目指します(開発途上で変更の可能性あり)。
2026/1/16
このリポジトリは、PHPアプリケーション向けの再利用可能なライセンス管理フレームワークを提供します。ライセンスキーの生成・検証、ドメイン紐付け(共有防止)、有効期限管理(固定日付または期間指定)、PDO互換のデータベース対応、CLIツールやWebアダプタを備え、導入先の環境に合わせて柔軟に組み合わせて利用できます。小規模プロジェクトから商用配布まで想定された汎用的な実装です。
2026/1/16
C言語で実装されたシンプルなICMP Echo(ping)クライアント。最小限の実装で、makeでビルドし ./ping DEST で指定ホストへICMP Echo Requestを送信する基本的な動作を提供します。学習用やカスタム実装の雛形として利用しやすい構成です。(約300字)
2026/1/16
Pocket Readerは、軽量なローカルTTSモデル「Pocket TTS」を利用してウェブページの本文を読み上げるChrome拡張です。段落単位で音声合成を行い長文でも素早く再生を開始できる設計、8種類の音声選択、記事本文の自動抽出、シンプルな再生コントロールなどを備え、ローカルCPU上で動作するためクラウドへ送信せずに利用できる点が特徴です(拡張+ローカルサーバー構成を想定)。300字程度の簡潔な説明です。
2026/1/16
SlideAgentは、アイデアを入力するだけで自動的に美しいPPT(および複数形式の出力)を生成できるオープンソースのAI駆動プレゼン生成ツールです。TypeScriptで実装されたバックエンド構成を持ち、環境変数(.env.example)による設定や複数エクスポート、オンライン共有のサポートをうたっており、PPTAgent(CAS)をベースにした設計が示されています。手軽にスライド作成を自動化したい開発者やプロダクト担当者向けのスタータープロジェクトです。(約300字)
2026/1/16
このリポジトリは「wonky(崩れた)」SQL文を読みやすく整形するシンプルなツールです。JavaScriptで実装され、ブラウザ上で動作するUI(index.html)と整形ロジック(app.js)を含みます。軽量で導入が簡単なため、ローカルでのクイック整形やサンプル実装の学習用に最適です。ドキュメントを格納するdocsディレクトリも含まれているものの、コミット数・ファイル数は少なく、拡張や堅牢化は今後の課題です。
2026/1/16
stfu は、周囲の音声をマイクで拾って約2秒遅延させて再生するだけのシンプルなブラウザアプリです。作者が空港で大音量のリールを聞く人に遭遇した経験から作られ、音声をそのまま返すことで聞き手の行動を穏やかに変えることを狙います。実装は単一の HTML ファイル中心で、Web ブラウザの音声入力と再生(Web Audio API / getUserMedia 想定)を使う軽量構成。サーバー不要で即座に試せる点が特徴です。
2026/1/16
ターミナル上で株式と暗号資産の価格をリアルタイムに追跡する軽量なTUIアプリケーション。複数のデータプロバイダ(CoinGecko、Yahoo Finance、または組み合わせ)に対応し、履歴チャートやスパークライン表示、Vim風のキーバインドによる操作が可能。Goで実装され、シンプルな設定ファイルでカスタマイズできるため、ローカルで手早く動かして相場監視を行いたい開発者やトレーダーに向くツールです。