LAOS — 眼科向け補助システム(Laos_System)

AI/ML

概要

LAOS(LLM-based Auxiliary Ophthalmic System)は、医師と患者の対話(音声/テキスト)を入力として受け取り、入院、手術、退院向けの構造化されたJSONドキュメントへ変換する設定可能なエンドツーエンドパイプラインを提供します。専門領域に特化した音声認識とRAG(Retrieval‑Augmented Generation)を組み合わせ、対話の医学的根拠や用語を保持したまま記録化するのが特徴です。さらに「clinical‑semantic」二重評価モデルを導入して、AIの用語理解(semantic)と医学的論理性(clinical)の両面で生成物を評価し、医療品質と安全性の担保を試みています。

GitHub

リポジトリの統計情報

  • スター数: 10
  • フォーク数: 1
  • ウォッチャー数: 10
  • コミット数: 6
  • ファイル数: 2
  • メインの言語: 未指定

主な特徴

  • 臨床対話(音声/テキスト)から入院・手術・退院の構造化JSONを生成するエンドツーエンドパイプライン
  • 専門分野向けの音声認識とRAGを組み合わせたハイブリッド生成アプローチ
  • 「clinical‑semantic」二重評価により用語理解と医学的整合性を同時チェック
  • npj Digital Medicineに採択された研究成果に基づく実装例

技術的なポイント

LAOSの技術スタック自体はリポジトリに詳述されていませんが、READMEと論文採択情報から想定される核心技術は明確です。まず音声→テキスト処理には「領域特化型ASR(自動音声認識)」を用いることで、眼科特有の専門用語や略語の誤認識を低減します。次にRAG(Retrieval‑Augmented Generation)を導入することで、外部のエビデンス(診療ガイドラインや既存カルテ)を検索してLLMの出力を補強し、生成された記録に根拠を付与します。出力は入院、手術、退院など用途別のスキーマ(JSON)にマッピングされ、構造化データとしてEHR連携や二次利用が可能です。

特徴的なのは「clinical‑semantic」二重評価の概念で、semantic側は医師の専門語や文脈を正しく解釈できているか、clinical側は診断・処置情報の医学的整合性や因果関係が保たれているかを別々に評価します。これにより、単なる言語的正しさから一歩進んだ医療品質評価が可能になります。運用面では、プライバシー(PHI)対策、オンプレミス運用やモデル更新のワークフロー、スキーマ検証や単体テストによる品質保証が重要です。実臨床導入を見据えると、LLMのhallucination抑制、RAGによるソース追跡、ヒューマンインザループの承認フローが鍵になります。

プロジェクトの構成

主要なファイルとディレクトリ:

  • LICENSE: file
  • README.md: file

まとめ

臨床対話を根拠付きで構造化する実践的な医療AIパイプライン。

リポジトリ情報:

READMEの抜粋:

LAOS: LLM-based Auxiliary Ophthalmic System

Project Background

Using “specialty voice-to-text and RAG,” LAOS creates a full-cycle, closed loop from doctor-patient dialogue to evidence-based medical records. It also introduces a groundbreaking “clinical-semantic” dual-evaluation model, which allows the AI to understand doctors’ jargon while ensuring the medical logic is perfectly sound. The study is…