YouTube Shorts & TikTok 2025 — EDAインサイト

Data

概要

本リポジトリは「YouTube Shorts & TikTok Trends 2025 — EDA Tutorial」と題された、短尺動画プラットフォーム(YouTube Shorts と TikTok)の2025年におけるトレンド解析を目的とした教材的プロジェクトです。Jupyter Notebook形式のチュートリアルでは、データの読み込み、欠損値処理、特徴抽出、集計・可視化を通じて、人気クリエイター、頻出ハッシュタグ、プラットフォーム別の視聴傾向などを探索します。初心者がEDAの基本と短尺動画領域で有効な分析手法を学べる構成になっており、requirements.txt により環境再現性も確保できます。

GitHub

リポジトリの統計情報

  • スター数: 1
  • フォーク数: 0
  • ウォッチャー数: 1
  • コミット数: 3
  • ファイル数: 5
  • メインの言語: Jupyter Notebook

主な特徴

  • Jupyter Notebookベースの段階的なEDAチュートリアル(初心者向け)
  • クリエイター、ハッシュタグ、プラットフォーム比較にフォーカスした可視化と集計
  • 実行環境を揃えるためのrequirements.txtを付属
  • 再現可能なワークフローと説明付きの解析セル

技術的なポイント

ノートブックは典型的なEDAワークフローを踏襲しています。まずpandasでCSV等のデータを読み込み、データ型の確認と欠損値処理(drop/補完や日時型への変換)を行います。投稿日時から週・月・時間帯を抽出して時間的トレンドを可視化し、プラットフォーム(YouTube Shorts vs TikTok)ごとの視聴数・いいね・コメントの分布差を箱ひげ図やヒストグラムで比較する、という手法が中心です。クリエイター単位では集約(groupby)によりトップクリエイターを抽出し、成長率やエンゲージメント率(いいね/視聴など)の指標を算出してランキング化します。ハッシュタグ分析では頻度集計、共出現(バイグラム的な扱い)やワードクラウドで人気トピックを可視化するアプローチが紹介されています。可視化はmatplotlib/seaborn系を想定したプロットがメインで、インタラクティブ分析を行う場合はplotlyへの置換が容易な構成です。データの偏りやサンプリングバイアス、外れ値の扱いについても言及があり、簡易的なフィルタリングやスケーリングによって解釈性を高める工夫がされています。requirements.txtにより依存パッケージを固定でき、Notebookはチュートリアル形式なのでセルごとに実行しながら学べます。改善点としては、時系列予測やクラスタリング、ネットワーク分析(クリエイター間のコラボ関係)などを追加すれば洞察の深掘りが可能です。

プロジェクトの構成

主要なファイルとディレクトリ:

  • LICENSE.txt: file
  • README.md: file
  • gitignore.txt: file
  • requirements.txt: file
  • youtube-shorts-tiktok-2025-eda-insights.ipynb: file

まとめ

短尺動画トレンドのEDA入門として実用的で再現性のあるノートブック教材です。

リポジトリ情報:

READMEの抜粋:

🎬 YouTube Shorts & TikTok Trends 2025 — EDA Tutorial


📌 Project Overview

This project explores short-form video trends on YouTube Shorts and TikTok during 2025.

The notebook is designed as a beginner-friendly tutorial for Exploratory Data Analysis (EDA). It walks through how to load, clean, and explore the dataset while building visual insights into creators, hashtags, platforms, and audience behaviors.


📊 Dataset

File: youtube_shorts_tikt...