Open CLAW 知識蒸留器

AI/ML

概要

Open CLAW Knowledge Distiller(龍蝦知識蒸留器、通称 kd)は、動画コンテンツを短時間で「構造化された知識記事」へ変換するためのツールセットです。CLI ベースでローカル環境にインストールして利用でき、YouTube/Bilibili/Facebook の動画をダウンロード→音声抽出→Qwen3‑ASR MLXでの音声認識→テキスト分割→AIによる要約・章立てというパイプラインで処理します。MCP(Message/Control Protocol)サーバーを通して Claude Code や Open CLAW エージェントと連携できるため、自動化された知識化ワークフローの一部として組み込めます。プライバシー重視で外部APIに依存しないローカル処理を前提としている点が大きな利点です。

GitHub

リポジトリの統計情報

  • スター数: 27
  • フォーク数: 5
  • ウォッチャー数: 27
  • コミット数: 18
  • ファイル数: 8
  • メインの言語: Python

主な特徴

  • 動画 → 構造化記事へ自動変換するエンドツーエンドのパイプラインを提供
  • Qwen3‑ASR MLX によるローカル音声認識で外部API不要、プライバシー確保
  • CLI と MCP サーバーでエージェント(Claude Code / Open CLAW)と統合可能
  • YouTube、Bilibili、Facebook に対応し多言語の動画ソースを処理可能

技術的なポイント

このプロジェクトは「ローカルで完結する知識抽出」を軸に設計されています。まず動画の取得と音声抽出を行い、その音声を Qwen3‑ASR MLX などのローカルASRモデルでテキスト化することで、通信コストや外部サービス依存を排除しています。得られた文字起こしは時間軸やトピックごとにセグメント化され、各セグメントに対してLLMベースの要約・見出し生成を適用することで、章立てや要点抽出を自動化します。MCPサーバーは、エージェント間の制御と対話を仲介し、Claude Code や Open CLAW のようなエージェントが生成プロセスに介入してレビューや追記、メタデータ付与を行えるようにします。Pythonベースの設計はスクリプト化と拡張性に優れており、pyproject.toml を用いたパッケージ管理やAGENTS.mdでのエージェント定義により、独自エージェントの追加や出力フォーマットのカスタムが容易です。一方で、高精度のASRや大規模な要約モデルをローカルで運用するにはGPUや適切なリソースが必要であり、実運用時はモデル選定・ハードウェア準備が重要です。開発段階のリポジトリであるため、拡張や安定化の余地があり、エンドユーザー向けのGUIやクラウド同期など将来的な改善ポイントも見込まれます。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file
  • AGENTS.md: file
  • README.md: file
  • REDDIT_POST.md: file
  • pyproject.toml: file

…他 3 ファイル

まとめ

ローカル完結で動画を知識化する実用的なプロトタイプで、プライバシー重視の自動要約ワークフローを試せる点が魅力です(約50字)。

リポジトリ情報:

READMEの抜粋:

Open CLAW Knowledge Distiller 🦞📚

龙虾知识蒸馏器 · 龍蝦知識蒸餾器

English · 繁體中文 · 简体中文

Turn YouTube, Bilibili, and Facebook videos into structured knowledge articles in seconds — locally, for free. 秒速将 YouTube、Bilibili、Facebook 视频转化为结构化知识文章 — 本地运行,完全免费。


English

What is Open CLAW Knowledge Distiller?

Open CLAW Knowledge Distiller(龍蝦知識蒸餾器kd)is an open-source CLI tool and MCP server built for the Open CLAW AI agent eco…