US労働経済:ACSデータによる所得と労働参加の分析
概要
本リポジトリは、UC RiversideのParv Maru氏による「ACS Income and Labor Analysis (2021–2023)」プロジェクトを再現可能な形でまとめたものです。主にRを用いてACSの複数年データを統合し、教育水準、性別、週間労働時間、居住地域などの説明変数が個人の所得や労働参加(就労有無)にどう影響するかを回帰分析および決定木モデルで検証します。出力はRMarkdownから生成されたHTMLレポートとして含まれ、依存パッケージはRequirementsファイルで管理されています。データ前処理、モデル適合、結果の可視化を通して政策的・実務的示唆を得ることを目指しています(約300字)。
リポジトリの統計情報
- スター数: 1
- フォーク数: 0
- ウォッチャー数: 1
- コミット数: 3
- ファイル数: 6
- メインの言語: HTML
主な特徴
- ACSマイクロデータ(2021–2023)を対象とした多変量分析ワークフロー
- RおよびRMarkdownによる再現可能な解析レポート(HTML出力)
- 回帰モデルと決定木を併用した因果的・記述的アプローチ
- 依存パッケージはRequirementsファイルで明示
技術的なポイント
READMEとファイル構成から読み取れる技術的な要点を整理します。まず、解析のコアはRで書かれたRMarkdown(ACS Income Labor Analysis.Rmd)で、データの読み込み・前処理・モデル構築・可視化・レポート生成までを一貫して実行できる設計です。Requirements_ACS_Income_Labor.txtにより必要なRパッケージが管理されているため、再現性の確保や環境構築が容易になります。
手法面では、説明にある通り線形回帰などの従来の統計モデルと、決定木系(分類・回帰木)などの非線形モデルを併用しています。ACSデータを扱う際に重要なポイントとして、サンプル重みの適用、複雑なサンプリングデザインを考慮した推定(層化やクラスタリング)、および複数年データのプール処理が想定されます。解析では特徴量エンジニアリング(教育レベルのカテゴリ化、労働時間帯の設定、地理変数の集計)を通じてモデルの説明力を高め、交差検証や変数重要度の評価でモデルの頑健性を確認することが期待されます。
可視化はRの図表機能(ggplot2等)が用いられ、所得分布、回帰係数の効果サイズ、決定木の分岐や重要変数の可視化により結果を直感的に示します。出力済みのACS Income Labor Analysis.htmlは、解析結果と解釈を分かりやすくまとめた静的レポートで、研究ノートやポリシーブリーフへの転用が容易です。最後に、READMEや追加の説明ファイルにより分析の目的・データソース・基本的な手順が文書化されており、データサイエンスの業務フローを学ぶ教材としても有用です。(約700字)
プロジェクトの構成
主要なファイルとディレクトリ:
- ACS Income Labor Analysis.Rmd: file
- ACS Income Labor Analysis.html: file
- README.md: file
- README_ACS_Income_Labor.md: file
- Requirements_ACS_Income_Labor.txt: file
…他 1 ファイル
まとめ
ACSデータを用いたRベースの再現可能な所得・労働分析ワークフローが簡潔にまとまっています(約50字)。
リポジトリ情報:
- 名前: US-Labor-Economics-ACS-Analysis
- 説明: Data-driven analysis of U.S. Census ACS (2021–2023) microdata using R to uncover how education, gender, hours worked, and geography impact income and labor participation through regression and decision tree models
- スター数: 1
- 言語: HTML
- URL: https://github.com/parvmaru/US-Labor-Economics-ACS-Analysis
- オーナー: parvmaru
- アバター: https://avatars.githubusercontent.com/u/70286925?v=4
READMEの抜粋:
📊 ACS Income and Labor Analysis (2021–2023)
🎓 Author: Parv Maru
Master of Business Analytics, University of California, Riverside
🧾 Overview
This project analyzes U.S. Census American Community Survey (ACS) data (2021–2023) to understand how demographic and socioeconomic variables influence income and labor force participation.
Using R, the analysis applies statistical and machine learning models to uncover key relationships across education, gender, hour…