MOCR-DB:遺伝的因果解析向けデータ・コードリポジトリ
概要
MOCR-DBは、Mendelian randomization(MR)を中心とした遺伝統計解析用のデータとコードをまとめたリポジトリです。主要なRスクリプトとして、データ準備を行うprepare.r、MR解析用の関数群を含むmr_db.r、そして解析結果を閲覧・操作できるShinyアプリケーションapp.rが配置されています。実データ(処理済みサマリ統計やLDSC結果など)はファイルサイズの関係で外部ホスティングされており、リポジトリは解析パイプラインと可視化インターフェースの核を担います。
リポジトリの統計情報
- スター数: 2
- フォーク数: 0
- ウォッチャー数: 2
- コミット数: 3
- ファイル数: 2
- メインの言語: R
主な特徴
- MR解析に特化したR関数群(mr_db.r)を提供。
- データ前処理パイプライン(prepare.r)で解析前整形を自動化。
- Shinyアプリ(app.r)で解析結果のインタラクティブな可視化・確認が可能。
- 大容量の処理済みデータは外部ホスティングで管理し、リポジトリはコードと軽量メタ情報に集中。
技術的なポイント
MOCR-DBはRベースでMR解析ワークフローの「コード側」を整理している点が肝要です。prepare.rは生のサマリ統計を解析用に整形・フィルタリング・標準化する役割を担う想定で、一般的には変数名の統一、アライメント(エフェクトアリルの整合)、欠損処理、SNPクランピングやLD参照の準備などを行います。mr_db.rはMR固有の前処理(exposure/ outcomeのハーモナイズ、インストルメンタル変数の選択、感度解析の実装)がまとめられており、解析の再現性を高める関数群として機能します。app.rはShinyを用いたフロントエンドで、解析結果(例:MR推定値、LDSCの推定、フォレストプロットやフォルダプロット)を動的に探索できるUIを提供する設計です。処理済みデータを外部でホスティングすることでリポジトリ自体は軽量に保たれ、データ更新や大規模結果の公開運用が容易になります。これら三つのスクリプトを分離することで、データ準備→解析→可視化の流れが明確になり、異なる解析設定や追加データに対する拡張性も確保されます。依存パッケージ管理やドキュメントが整備されていれば、他研究者による再利用・検証がスムーズになります。
プロジェクトの構成
主要なファイルとディレクトリ:
- README.md: file
- code: dir
code/ 配下の主なスクリプト(README抜粋より)
- app.r – Shiny application for the MOCR-DB interface
- mr_db.r – Functions for Mendelian randomization (MR) data processing
- prepare.r – Data preparation and preprocessing pipeline
data/(外部ホスティング)
- 処理済みのMRサマリー結果、LDSCなどの解析結果が外部で管理されている旨の記載あり。
まとめ
MR解析のコード基盤と可視化インターフェースが整った、再現性志向のRリポジトリ。
リポジトリ情報:
- 名前: MOCR-DB
- 説明: Data and code repository for MOCR-DB project
- スター数: 2
- 言語: R
- URL: https://github.com/ChenHW-MR/MOCR-DB
- オーナー: ChenHW-MR
- アバター: https://avatars.githubusercontent.com/u/107980446?v=4
READMEの抜粋:
MOCR-DB: Data and Code Repository
This repository provides the core scripts and processed results used in the construction and analysis of MOCR-DB.
Repository Structure
-
code/- app.r – Shiny application for the MOCR-DB interface
- mr_db.r – Functions for Mendelian randomization (MR) data processing
- prepare.r – Data preparation and preprocessing pipeline
-
data/(hosted externally due to file size)
Processed summary results for MR, LDSC…