VideoHub(動画転写ツール)

Tool

概要

VideoHubは、多プラットフォームの動画を対象にダウンロードから音声転写、双語字幕生成、字幕埋め込み、要約生成までの一連処理を行えるデスクトップアプリです。PyQt6でモダンなGUIを提供し、OpenAI Whisper等の音声認識エンジンを組み合わせることで高精度な文字起こしを実現します。単発の動画処理に加え、バッチ処理やスケジューリング機能を備え、定期的な動画収集・処理の自動化も可能です。Chrome拡張やローカルのAPIサーバーを通じて他ツールとの連携も想定されています。GitHub

リポジトリの統計情報

  • スター数: 3
  • フォーク数: 0
  • ウォッチャー数: 3
  • コミット数: 8
  • ファイル数: 17
  • メインの言語: Python

主な特徴

  • マルチプラットフォーム対応の動画/音声ダウンロード(YouTube、X、抖音、Bilibili等)
  • OpenAI Whisperベースの高精度な音声転写と双語字幕(.srt/.vtt/.ass)生成
  • 字幕を動画へ直接埋め込む機能とバッチ・スケジュール処理による自動化
  • Chrome拡張・ローカルAPIサーバーによる外部連携サポート

技術的なポイント

VideoHubはPyQt6を用いたデスクトップGUIを中核に、ダウンロード・音声処理・字幕生成・要約というパイプラインをPythonで統合しています。動画取得には外部ツール(一般的にはyt-dlp相当)や独自ラッパーを想定しており、ffmpegでのコンテナ/コーデック処理を組み合わせることで音声抽出や字幕埋め込みを行います。音声認識にはOpenAI Whisperを採用しており、ローカルモデルかAPI利用かを切り替えられる設計になっています。字幕出力は.srt/.vtt/.assなど複数フォーマットに対応し、二言語(原文+翻訳)での同期表示が可能。要約やコンテンツ解析には大規模言語モデル(LLM)を利用するフローがREADMEに示されており、トランスクリプトを元に要約生成やキーワード抽出を行うことで二次的なメタデータを自動生成します。運用面ではバッチ処理やアイドル時スケジューリング機能を提供し、フォルダ監視や定期ジョブでの継続処理を想定。構成管理には.envファイルを用いることでAPIキーや動作設定を外部化し、chrome_extensionディレクトリやapi_server.pyを用いてブラウザ連携やローカルAPI提供を行い、他ツールやワークフローからの呼び出しも可能です。全体はモジュール化されており、ダウンロード/前処理/転写/字幕生成/埋め込み/要約の各ステップを分離しているため、個別の拡張や外部サービス差替えがしやすい点も特徴です。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .env: file
  • README.md: file
  • pycache: dir
  • api_server.py: file
  • chrome_extension: dir

…他 12 ファイル

まとめ

デスクトップで動画→文字起こし→字幕生成を自動化する総合ツール。軽快なワークフロー構築に向く。

リポジトリ情報:

READMEの抜粋:

视频转录工具 (Video Hub)

这是一个功能强大的桌面应用程序,使用 PyQt6 构建现代化图形界面,支持 YouTube、Twitter/X、抖音、Bilibili 等多平台视频内容的智能处理。提供视频下载、语音转录、双语字幕生成、内容摘要等完整工作流,并配备闲时调度、批量处理等高级功能。

✨ 核心功能

🎬 多平台视频处理

  • 🎥 平台支持: YouTube、Twitter/X、抖音、Bilibili 等主流视频平台
  • 智能下载: 支持视频/音频下载,可选择完整视频或仅音频模式
  • 精准转录: 基于 OpenAI Whisper 的高质量语音转录技术
  • 多格式字幕: 生成 .srt、.vtt、.ass 等多种格式的双语字幕文件
  • 字幕嵌入: 支持将字幕直接嵌入到视频文件中
  • 内容摘要: 利用 LLM(支持 Op…