ライフスタイル要因と睡眠の分析
概要
このリポジトリは、実データを使ってライフスタイル要因が睡眠(睡眠時間と睡眠の質)にどう影響するかを解析することを目的としています。データセットには睡眠時間、睡眠の質、ストレスレベル、身体活動量、BMI、既往の睡眠障害などの特徴量が含まれており、Jupyter Notebook上での探索的データ解析(EDA)、相関分析、可視化を中心に分析が行われています。解析結果は睡眠改善に関連する要因の理解やさらなるモデル構築の基礎資料として活用できます。
リポジトリの統計情報
- スター数: 27
- フォーク数: 0
- ウォッチャー数: 27
- コミット数: 3
- ファイル数: 4
- メインの言語: Jupyter Notebook
主な特徴
- Kaggleの「Sleep Health and Lifestyle Dataset」を用いた実データ解析。
- Jupyter Notebookでの探索的データ解析(EDA)と多数の可視化を提供。
- CSVデータと補助スクリプトにより再現可能なワークフローを構成。
- 睡眠時間・睡眠の質とストレス、身体活動、BMIなどの相関を中心に検討。
技術的なポイント
本プロジェクトは典型的なデータ分析ワークフローを踏襲しており、データの読み込みから前処理、可視化、相関解析までがNotebookで一貫して示されています。具体的には、CSVファイルからpandasを用いてデータを読み込み、欠損値の確認・処理、カテゴリ変数や連続変数の基礎集計(平均・分散・分位点)を行うことが想定されます。可視化にはmatplotlibやseabornが使われ、ヒストグラム、箱ひげ図、散布図、ヒートマップ(相関行列)などで変数間の関係性や外れ値を視覚的に把握します。
相関解析では睡眠時間・睡眠の質を目的変数に、ストレスレベルや身体活動、BMI、既往の睡眠障害などを説明変数としてピアソン相関やカテゴリごとの平均比較(グループ化)で影響を評価します。場合によっては単回帰/重回帰分析や簡単な分類(睡眠の質を良/悪に二値化しての予測)を試みることで、どの特徴がより強く関連するかを定量的に示すことができます。lifestyle_factors_affecting_sleep_quality.py の存在から、Notebook外で再利用できる前処理関数や可視化補助関数、あるいはモデル学習用のユーティリティが別ファイルに切り出されている可能性が高く、分析の自動化やスクリプト実行による再現性確保に寄与します。
技術面で注目すべき点は、実データ特有の前処理(欠損値、カテゴリのエンコーディング、スケーリング)や、交絡因子を考慮した解析設計の重要性です。例えばBMIや年齢が睡眠に与える影響はストレスや運動習慣と相互に関連するため、単純な相関だけで因果を主張しない注意が必要です。また、サンプルサイズやデータ分布に応じて統計的検定(t検定、ANOVA、カイ二乗検定など)を適用することで、観察された差や相関の有意性を補強できます。Notebookは探索的解析として十分な出発点を提供しますが、より堅牢な結論を得るには追加の前処理、モデル検証、外部データでの検証が望まれます。
プロジェクトの構成
主要なファイルとディレクトリ:
- Lifestyle_Factors_Affecting_Sleep_Quality.ipynb: file
- README.md: file
- Sleep_health_and_lifestyle_dataset.csv: file
- lifestyle_factors_affecting_sleep_quality.py: file
まとめ
実データを用いた睡眠とライフスタイルの因果関係探索に適した、再現性の高い解析ノートブック群。
リポジトリ情報:
- 名前: Lifestyle-Factors-Sleep-Analysis
- 説明: Analyzing how lifestyle factors affect sleep quality and duration using a real dataset
- スター数: 27
- 言語: Jupyter Notebook
- URL: https://github.com/murjanah-shahul/Lifestyle-Factors-Sleep-Analysis
- オーナー: murjanah-shahul
- アバター: https://avatars.githubusercontent.com/u/174118239?v=4
READMEの抜粋:
Lifestyle-Factors-Sleep-Analysis
Analyzing how lifestyle factors affect sleep quality and duration using a real dataset
Project Overview
This project explores how various lifestyle factors affect sleep quality and sleep duration. Using the Sleep Health and Lifestyle Dataset from Kaggle, we analyzed correlations and patterns in:
- Sleep duration
- Sleep quality
- Stress level
- Physical activity
- BMI
- Sleep disorders
The goal is to understand how these factors influence sleep and identi…