Bilibili AI Summary(B站動画の字幕自動要約)
概要
BilibiliAISummaryは、Bilibili(哔哩哔哩)動画の字幕を取得してAIで自動的に要約し、読みやすいMarkdown形式の要約レポートを生成するツールです。主にPythonで実装され、yt-dlpを使った字幕ダウンロードと、ユーザが指定するAI APIへのリクエストを組み合わせています。利用にはPython 3.11.13と、ブラウザから抽出したcookies.txtが必要で、これによりログインが必要な字幕も取得可能です。CLIベースで手軽に実行でき、生成される要約は構造化されているためレビューやアーカイブ用途に適しています(約300字)。
リポジトリの統計情報
- スター数: 2
- フォーク数: 0
- ウォッチャー数: 2
- コミット数: 2
- ファイル数: 11
- メインの言語: Python
主な特徴
- yt-dlpを使ってBilibiliの字幕(cc/srt等)を自動ダウンロード
- ユーザー指定のAI APIに字幕を送信し、要点抽出・要約を実行
- 出力は構造化されたMarkdownドキュメントとして生成
- ローカルのcookies.txtを使い、ログイン必須のコンテンツにも対応
技術的なポイント
このプロジェクトはシンプルかつ実用的なパイプライン設計が特徴です。まずyt-dlpを外部コマンドとして利用し、Bilibiliから字幕ファイルを取得します。Bilibiliは一部のコンテンツでログインが必要になるため、ブラウザからエクスポートしたcookies.txtを使って認証情報を渡す設計になっており、これによりユーザのセッション情報を安全に利用して字幕を取得できます。取得した字幕はテキストに整形された後、AI APIへ送信されますが、ここでの工夫点は「字幕の長さとトークン制限」を考慮した分割処理や、要約プロンプトのテンプレート化が想定されていることです。AI側は要点抽出/箇条書き化/セクション分けなどの構造化指示を受け取り、結果をMarkdown形式で返すことで、そのままレポートとして保存や共有が可能です。実装はPython 3.11で要求される型やモジュールを前提にしており、依存はrequirements.txtで管理。セキュリティ面ではcookiesファイルをローカル運用に限定することでトークン漏えいリスクを低減し、AIキーやエンドポイントは環境変数(.env)で管理する設計が推奨されます。CLIでの実行と設定ファイルの組み合わせにより、手動操作と自動化の両方に適したワークフローを提供します。(約700字)
プロジェクトの構成
主要なファイルとディレクトリ:
- .env.example: file
- .gitattributes: file
- .gitignore: file
- LICENSE: file
- README.md: file
…他 6 ファイル
リポジトリは小規模で、依存関係や設定方法をREADMEにまとめており、環境を整えればすぐに字幕取得→要約生成のワークフローを試せます。
使い方の流れ(要点)
- リポジトリをクローンして依存をインストール(pip install -r requirements.txt)。
- ブラウザからcookies.txtをエクスポートし、プロジェクトに用意する(yt-dlpでの抽出案内あり)。
- .env にAI APIキーやエンドポイントを設定。
- スクリプトを実行するとyt-dlpが字幕を取得し、AIに送信、Markdownの要約を生成。
開発上の注意点
- Bilibiliの仕様変更でyt-dlpのオプションやcookiesの扱いが変わる可能性があるため、yt-dlpは最新に保つ必要があります。
- AI APIの利用に伴う料金やレート制限、トークン使用量の管理はユーザー側で行う必要があります。
- 字幕の品質(自動生成字幕の誤りや時間コードの不一致)は要約品質に影響するため、事前処理(ノイズ除去)が有用です。
まとめ
Bilibili動画の字幕を手早くAIで要約し、Markdownで出力する実用的なツールです(約50字)。
リポジトリ情報:
- 名前: BilibiliAISummary
- 説明: 让AI帮你快速总结B站视频
- スター数: 2
- 言語: Python
- URL: https://github.com/fan3838abd/BilibiliAISummary
- オーナー: fan3838abd
- アバター: https://avatars.githubusercontent.com/u/201993031?v=4
READMEの抜粋:
Bilibili AI Summary
使用AI自动总结Bilibili视频字幕的工具。
功能特性
- 使用
yt-dlp下载Bilibili视频字幕 - 调用AI API对字幕进行智能总结
- 生成结构化的Markdown文档
环境要求
- Python 3.11.13
- cookies.txt 文件(用于访问Bilibili)
安装
- 克隆项目
git clone <repository-url>
cd BilibiliAISummary
- 安装依赖
pip install -r requirements.txt
-
准备cookies文件
程序需要cookies文件来访问Bilibili视频字幕。获取方法如下:
方法一:从浏览器提取(推荐)
- 在Firefox浏览器中登录Bilibili网站
- 使用yt-dlp从浏览器提取cookies:
yt-dlp --list-sub...