cdd2026 — CDD講義用リポジトリ
概要
cdd2026は「CDD(Computational Drug Discovery)」に関連する講義・実習向けのリポジトリで、教育用に整理されたJupyter Notebookを中心に構成されています。READMEには環境構築手順(gitのインストール、venvやcondaの利用方法)や必須ライブラリとしてRDKitやscikit-learnが明記されており、化学構造の取り扱いや機械学習の基礎をローカルで再現できるよう配慮されています。ファイル数は少なめで、講義で用いる最小限の教材セットを提供することを目的としているため、学習の導入として手を付けやすい構成です。
リポジトリの統計情報
- スター数: 9
- フォーク数: 0
- ウォッチャー数: 9
- コミット数: 3
- ファイル数: 4
- メインの言語: Jupyter Notebook
主な特徴
- 教育用途に特化した軽量なJupyter Notebook教材群
- ケモインフォマティクス向けライブラリ(RDKit)と機械学習(scikit-learn)を前提とした構成
- 仮想環境(venv/conda)やGitの導入手順など、初学者向けの環境構築ガイドを収録
- データディレクトリと演習ディレクトリを分離したシンプルなプロジェクト構成
技術的なポイント
このリポジトリは主に「教育と再現性」に主眼を置いた設計がなされています。まず環境依存性の管理について、READMEでvenvおよびcondaの利用が推奨されている点は重要です。RDKitのような化学構造処理ライブラリはバイナリ依存性が強く、プラットフォームごとにインストール手順が異なるため、conda経由でのパッケージ管理(特にconda-forgeチャネルの活用)が一般的です。READMEにLinux用コマンドや仮想環境の作成例があることから、講義参加者がローカルで同一の実行環境を再現しやすい設計になっています。
Notebookベースの教材は、コードと解説を同一ファイルで管理できるため演習用途に適しています。RDKitを用いることで分子のSMILES読み込み、分子記述子(分子量、LogP、トポロジカル指標など)の計算、分子構造の可視化が可能です。scikit-learnはこれらの分子記述子を用いた教師あり学習(回帰や分類)や次元削減、交差検証などの標準的ワークフローを実装する際に利用されます。Notebookにはデータ読み込み→前処理(欠損値処理、標準化、特徴選択)→モデル訓練→評価という流れが意図されているはずで、教育的にはそれぞれのステップで理論と実践を結び付けられる構成が望まれます。
また、データディレクトリとexercisesディレクトリが分かれている点は再現性と保守性の観点で良好です。データを別途管理することでNotebook自体は軽量化され、バージョン管理もしやすくなります。さらに、Gitを前提としたバージョン管理の案内があるため、課題の提出や共同作業のワークフロー(ブランチ運用、コミットの粒度、issue管理等)を講義で導入することも想定できます。
注意点としては、RDKitはインストールや依存関係の問題で初心者が躓きやすい点、Notebookの実行には計算資源(特に大規模なモデルや多数の分子を扱う場合)が必要になる点が挙げられます。教育用としてはサンプルデータを小規模に留め、計算負荷を抑えたレシピを用意することが望ましいでしょう。将来的な拡張として、環境の完全再現を目指す場合はConda環境YAMLやDockerfile、Binder/Google Colab向けのノートブック整備を追加すると利便性が向上します。
全体として、cdd2026は講義や短期演習で化学構造処理と機械学習の基礎を学ぶための良いスタートポイントを提供しており、環境構築や依存関係の明示、Notebook中心の教材配置といった教育的配慮が行き届いています。
プロジェクトの構成
主要なファイルとディレクトリ:
- .gitignore: file
- README.md: file
- data: dir
- exercises: dir
まとめ
教育用途に最適化された軽量なCDD講義用リポジトリです。
リポジトリ情報:
- 名前: cdd2026
- 説明: 説明なし
- スター数: 9
- 言語: Jupyter Notebook
- URL: https://github.com/lich-uct/cdd2026
- オーナー: lich-uct
- アバター: https://avatars.githubusercontent.com/u/19209961?v=4
READMEの抜粋:
cdd2026
Repository for the subject CDD
## Requirements
You will need RDKit, scikit-learn. venv or Conda, Jupyter and Git are also very useful.
### Version control: git
#### Linux
sudo apt install git
#### Windows and Apple
Download and install from [git](https://git-scm.com/downloads)
### Virtual environment
venv or Conda
#### venv
Maybe you will need to install it
python3 -m venv ./venv
#### conda
Linux
wget https://repo.anaconda....