Fabricate — GitHubペルソナ生成ツール

Tool

概要

Fabricateは、AI生成コードを用いて合成的なGitHub活動を作り出す研究用ツールです。複数のリポジトリを自動作成し、言語やプロジェクト規模を変えたコードを生成、さらに設定可能な期間にわたる多様なコミット履歴をシミュレートします。これにより、レポジトリ解析や可視化ツール、行動解析アルゴリズムの検証に使える合成データセットを簡単に構築できます。READMEでは「Anthropi…」と記載があり、AIモデルを用いたコード生成が核になっている点と、実験的・倫理的な利用上の注意が強調されています。

GitHub

リポジトリの統計情報

  • スター数: 8
  • フォーク数: 0
  • ウォッチャー数: 8
  • コミット数: 2
  • ファイル数: 7
  • メインの言語: Python

主な特徴

  • AIモデルを用いた複数リポジトリの自動生成(コード+構成)
  • 設定可能な期間・頻度でのコミット履歴のシミュレーション
  • 複数プログラミング言語やプロジェクト規模への対応
  • 研究利用を想定した実験的設計と倫理的注意喚起

技術的なポイント

FabricateはPythonベースで、プログラム的にリポジトリ構造とファイル群を生成し、疑似的なコミット履歴を作ることで「リアルに見える」GitHub活動を再現する設計です。READMEにあるように生成されるコードはAnthropic系のAIモデル(READMEの一部が切れているため明示は限定的)を利用していることが示唆され、モデルへのプロンプト設計やテンプレート化された出力フォーマットが重要になります。時間的なコミットパターンは設定に従って生成され、コミットメッセージやタイムスタンプの多様化によって自然な履歴を作ります。実装面では、ファイル作成→git add→git commitのような一連のGit操作を自動化する仕組み(Gitコマンド呼び出しやライブラリ利用)が想定され、言語ごとのビルドファイルやREADME、ライセンスなどのメタファイルも自動生成される設計が考えられます。研究用途の合成データという性質上、再現性・パラメータの可視化・ログ出力が重要で、どのようなプロンプトとシードでどのような出力が得られたかを追跡できる機能が求められます。最後に、README中でも注意喚起されている通り、偽のアカウントや悪意ある目的での利用を避けるための倫理ガイドラインや利用制限の設置が技術設計上の重要なポイントです。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file
  • LICENSE: file
  • README.md: file
  • fabricate: dir
  • main.py: file

…他 2 ファイル

まとめ

研究向け合成データ作成のプロトタイプとして有用だが、倫理的配慮が必須。

リポジトリ情報:

READMEの抜粋:

🎭 Fabricate

An experimental research tool for fabricating GitHub personas with AI-generated repositories

⚠️ This is an experimental/research project. Use responsibly and ethically.

Overview

Fabricate creates synthetic GitHub activity by generating:

  • Multiple repositories with realistic code
  • Varied commit histories spanning configurable time periods
  • Code across different programming languages
  • Projects of varying complexity and scope

All code is generated using Anthropi…