ベクデル・テスト解析と可視化

Data

概要

本リポジトリは、映画におけるジェンダー表現を評価する指標「Bechdel Test」を題材に、データ分析と可視化を行う教育的プロジェクトです。Bechdel.csv というデータセットをもとに、Jupyter Notebook(Bechdel_analysis.ipynb)でデータのクリーニング、集計、年代別・カテゴリ別の可視化を実施します。プロジェクト提案書(A3_ Project Proposal.pdf 等)も同梱されており、分析の目的や手順が明示されています。可視化は観測トレンドの発見に重点を置き、映画における女性の描かれ方が時代とともにどう変化したかを直感的に伝えます。

GitHub

リポジトリの統計情報

  • スター数: 18
  • フォーク数: 0
  • ウォッチャー数: 18
  • コミット数: 5
  • ファイル数: 16
  • メインの言語: Jupyter Notebook

主な特徴

  • Bechdel.csv を用いた実データの分析(映画ごとのBechdelカテゴリを含む)
  • Jupyter Notebook によるデータ前処理、探索的データ解析(EDA)、および可視化
  • 提案書(A3_ Project Proposal.pdf 等)を含み、プロジェクト背景や目的が明瞭
  • 教育用途に適した構成で、分析の流れを追いやすい

技術的なポイント

このプロジェクトは主にJupyter Notebookベースで完結しており、再現性の高いインタラクティブな解析環境が提供されています。データは CSV 形式(Bechdel.csv)で管理され、pandas を用いた読み込み・欠損値処理・型変換・集計(groupby、pivot)を経て、年代別の合格率やカテゴリ分布を算出します。可視化は matplotlib / seaborn、あるいはplotly等のライブラリを想定したプロット(棒グラフ、折れ線、積み上げ面グラフなど)で時系列トレンドやカテゴリ別割合を視覚化しており、色分けや注釈を使って読み手に分かりやすく提示しています。

技術的に注目すべき点は、Bechdelテスト特有のカテゴリ設計(登場する女性キャラクター数、女性同士の会話の有無、会話内容の主題など)をどのようにデータ化しているか、また年代やジャンルごとのバイアスをどう扱うかです。データ前処理では、年代情報の正規化(日付形式・欠損処理)、文字エンコーディング(UTF-8)やカテゴリ変数の適切な型設定が重要になります。小規模リポジトリのため requirements.txt や環境構築手順が明示されていない点は改善余地がありますが、Notebook自体がステップを追って処理を示しているため、分析手順の学習や再利用は容易です。

拡張案として、データパイプライン化(Notebookからモジュール化したスクリプトへの分離)、DockerやBinderを使った環境の固定、インタラクティブなダッシュボード化(Dash / Streamlit)や統計的検定の導入(年代差の有意性検定など)を挙げられます。また、メタデータ(ジャンル、制作国、興行収入など)を結合すれば、より多面的な分析が可能です。現状のコミット数・ファイル数からはプロトタイプ的な完成度と読み取れ、教育・学習用途に最適なサンプルプロジェクトと言えます。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file
  • A3_ Project Proposal.pdf: file
  • A3_Final Project Proposal Instructions.pdf: file
  • Bechdel.csv: file
  • Bechdel_analysis.ipynb: file

…他 11 ファイル

まとめ

Bechdelテストを理解しやすく可視化する、教育的価値の高い解析ノートブック集です。

リポジトリ情報:

READMEの抜粋:

🎬 Bechdel Test Analysis & Visualization

📌 Project Overview

This project analyzes gender representation in movies using the Bechdel Test, a widely used metric to evaluate how women are portrayed in films. Through data analysis and visualization, the project explores how movies perform across different Bechdel Test categories over time.

The visualizations clearly show trends such as:

  • Movies with fewer than two female characters
  • Movies where **female characters do no…