TRUMP CODE — トランプ・コード(川普密碼)

AI/ML

概要

TRUMP CODE(トランプ・コード)は、トランプ氏の発言(Tweets/Posts 等)とS&P 500 の株価データを組み合わせ、「どのような発信パターンが市場変動と関連するか」を brute-force(総当たり)で探索・検証する研究プロジェクトの実装リポジトリです。リポジトリ内では約31.5M(3150万)のモデルを生成して評価し、そのうち50,872 の「生存」ルール(条件を満たし有意な成績を残したもの)を抽出・記録しています。データや生存ルールは JSON 等で保存され、Pythonベースの解析パイプラインで再現が可能です。

GitHub

リポジトリの統計情報

  • スター数: 5
  • フォーク数: 3
  • ウォッチャー数: 5
  • コミット数: 30
  • ファイル数: 48
  • メインの言語: Python

主な特徴

  • 大規模な総当たり検証(約31.5Mモデル)によるルール発見とフィルタリング
  • 発言(テキスト)と株価(数値)を結び付ける独自ルール群(316の特徴を含む)
  • 検索結果・生存ルールを data/surviving_rules.json のような形式で公開
  • 再現性を考慮したリポジトリ構成(FIXSPEC.md、.githooks 等)

技術的なポイント

本プロジェクトは「テキスト発信(主にトランプの投稿)」と「金融時系列(S&P 500)」という異種データを結合してルールベースで検証する点が核心です。実装は Python を中心にしており、データ前処理(テキストの正規化、トークン抽出、発言特徴の算出)→ルールジェネレーション(条件組合せの総当たり)→バックテスト(シグナルに基づく収益性評価)→フィルタリング(有意なルールを抽出)というパイプラインで進行します。ルールは「特定ワードやフレーズの出現」「時間窓」「価格変動閾値」など複数の条件を組み合わせる設計が想定され、316の特徴や指標を基に数千万モデルを生成できるようルール空間を設計しています。出力は JSON(例: data/surviving_rules.json)で保存され、解析・可視化やさらなる統計検定に使える形式になっています。README のバッジ類からはテスト規模や生存ルール数などの集計結果が即座に参照でき、FIXSPEC.md による仕様固定や .githooks によるコミット品質維持といった再現性確保のための工夫も見えます。外部ライブラリについて明示的な記述はリポジトリ内で確認が必要ですが、一般的には pandas/numpy 等のデータ処理、バックテスト用の手作りロジック、JSON 入出力を主体とした軽量な構成が想定されます。解析対象が金融データであるため、テスト期間の選定、過学習対策(ルールの過剰フィッティング回避)、多重比較問題への対処(有意性補正や検証セットの分離)といった統計的配慮が重要なポイントになります。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .githooks: dir
  • .gitignore: file
  • FIXSPEC.md: file
  • LICENSE: file
  • README.md: file

…他 43 ファイル

まとめ

大規模なルール探索で発信と言語パターンと株価の関連を明示的に検証する、再現性重視の実験用リポジトリ。

リポジトリ情報:

READMEの抜粋:

🔐 TRUMP CODE

川普密碼 ・ トランプ・コード

Brute-force cryptanalysis of presidential communications × stock market.

Models Tested Surviving Rules [![Features](https://img.shields.io/badge/Features-316-2