乳がん診断予測アプリケーション

AI/ML

概要

本リポジトリ「Breast-Canser-preidiction-App」は、乳がんの診断を支援するための予測Webアプリケーションを開発したものです。乳がんの腫瘍が悪性(癌)か良性かを判別するタスクに対し、公開乳がんデータセットの診断特徴量を用いてロジスティック回帰モデルをトレーニングしています。ユーザーはStreamlitを通じてインタラクティブに患者の特徴値を入力し、リアルタイムで診断結果を得られます。また、探索的データ解析(EDA)機能により、相関関係や分布などを視覚的に把握できるため、モデルの理解やデータの洞察にも役立つ構成となっています。

GitHub

リポジトリの統計情報

  • スター数: 1
  • フォーク数: 0
  • ウォッチャー数: 1
  • コミット数: 18
  • ファイル数: 6
  • メインの言語: Python

主な特徴

  • ロジスティック回帰モデルによる乳がん良性・悪性予測機能
  • Streamlitベースの使いやすいWebインターフェイス
  • 医療データ入力用のインタラクティブなサイドバーを搭載
  • 探索的データ解析(EDA)機能付きでヒートマップやボックスプロットなど複数の可視化を提供

技術的なポイント

本プロジェクトの技術的な核は、乳がん診断データセットを用いたロジスティック回帰モデルの構築と、Streamlitを活用したWebアプリケーション実装にあります。ロジスティック回帰は二値分類問題に適した手法であり、乳がんの良悪性判定においては解釈性が高く、医療現場での利用に適しています。データセットには腫瘍の半径、質量、テクスチャなど複数の数値的特徴量が含まれており、これらを入力特徴量としてモデルのトレーニングを行います。

EDA機能では、PandasやMatplotlib、SeabornなどのPythonライブラリを用いて多彩なグラフを生成。相関ヒートマップは特徴量間の関連性を視覚化し、ボックスプロットやヒストグラムは各特徴量の分布や外れ値の有無を示します。これにより、ユーザーはデータの性質を深く理解した上でモデルの予測結果を参照可能です。

Streamlitを用いたUIでは、サイドバーに患者の特徴値を入力できるフォームが用意されており、入力後は即座にモデル推論が実行され結果が画面に表示されます。これにより専門知識が少なくとも直感的に診断予測を利用できる点が大きな利点です。

また、requirementsファイルにより依存関係が管理されているため、環境構築も容易であり、教育やプロトタイプ開発に適したリポジトリと言えます。コード自体は比較的シンプルで可読性が高く、データサイエンス初心者の学習教材としても活用できる構成です。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: Git管理対象外ファイル指定
  • EDA: データの探索的解析用スクリプトやノートブックを格納するディレクトリ
  • README.md: プロジェクト概要や使用方法の説明ファイル
  • data.csv: 乳がん診断データセットのCSVファイル
  • requirements: Pythonパッケージの依存関係リスト
  • その他1ファイル: Streamlitアプリ本体など

まとめ

乳がん診断支援を目的としたシンプルかつ実践的な予測アプリ。

リポジトリ情報: