多源情報コラボレーティブ推論によるアルツハイマー早期リスクスクリーニング

概要

本リポジトリは、音声データからアルツハイマー病（AD）リスクを早期スクリーニングするためのプロトタイプ実装です。言語情報（テキスト）、準言語（発話特性）、非言語（沈黙や挙動）、古典的音響特徴、eGeMAPSといった多様な特徴量を抽出・統合し、簡易なグラフベースの推論（空間的関連付けに基づく）と機械学習モデル（例：XGBoost バンドル）を組み合わせます。Flaskで構築されたデモUIによりワンクリックで解析が可能、ASRはfaster-whisper（CTranslate2重み）をオプションで利用でき、解釈可能性・再現性・デプロイ性を重視した設計が特徴です。

リポジトリの統計情報

スター数: 4
フォーク数: 0
ウォッチャー数: 4
コミット数: 12
ファイル数: 10
メインの言語: Python

主な特徴

多源（言語・準言語・非言語・古典音響・eGeMAPS）音声特徴量の統合解析。
グラフベースの簡易推論で空間的関連（pathological cascade）をモデル化。
FlaskによるデモUIでワンクリック実行、ASRはfaster-whisperをオプション提供。
ローカルのscikit-learnモデルバンドル（例：XGBoost）を用いた確率融合で高精度を実現（ADReSSo21 Acc≈0.853報告）。

技術的なポイント

本プロジェクトは「解釈可能な三位一体（言語／準言語／非言語）」という設計思想を掲げ、まず各モダリティを分離（decoupling）して特徴を抽出します。次に抽出した特徴間の「空間的関連（spatial association）」をグラフ的に表現し、病態の連鎖（pathological cascade）として推論するパス（decoupling → spatial → grading）を採用しています。音声処理面では古典的なエネルギー・ピッチ・フォルマント等に加え、感情や音色を捉えるeGeMAPSを導入。ASRはfaster-whisper（CTranslate2重み）を利用可能で、ローカルでテキストを得て言語特徴（語彙、構文、沈黙パターン）を抽出します。モデル融合は確率的アンサンブル（ローカルのscikit-learnモデルバンドルとグラフ推論のブレンド）で行い、XGBoostを用いたマルチソース学習でADReSSo21ベンチマークにおいてAcc≥0.80（報告値0.853）を達成。Flaskアプリは軽量で、UI上で各モダリティの寄与やスコア分解を提示し「なぜその判定になったか」を説明することを目指しています。再現性のためにモデルバンドルや依存関係の管理を重視し、臨床・コミュニティ向けスクリーニングとしてデプロイ可能な構成を意識しています。

プロジェクトの構成

主要なファイルとディレクトリ：

LICENSE: file
README.md: file
pycache: dir
app.py: file
config.py: file
model_bundle/: dir（モデルと重みの格納を想定）
requirements.txt: file
utils.py: file
static/: dir（フロントエンド資源）
templates/: dir（Flaskテンプレート） …他 5 ファイル

まとめ

多源音声を統合し解釈性を重視したAD早期スクリーニングの実装例で、実験〜デモ用途に適しています。

リポジトリ情報：

名前: Early-Risk-Screening-for-AD-Based-on-Multi-Source-Information-Collaborative-Reasoning
説明: Goal: Interpretable triad—language/paralanguage/non-verbal; risk via spatial association (pathological cascade); path: decoupling → spatial → grading. Metrics: ADReSSo21 Acc ≥0.80 (0.853; XGBoost+multisource). One-click; optional ASR; interpretable UI. For memory-clinic/community screening; stress interpretability, reproducibility, deployability.
スター数: 4
言語: Python
URL: https://github.com/weizhizhizhi/Early-Risk-Screening-for-AD-Based-on-Multi-Source-Information-Collaborative-Reasoning
オーナー: weizhizhizhi
アバター: https://avatars.githubusercontent.com/u/146227345?v=4