ICLR スコア解析ツール (iclr-score)

Data

概要

iclr-score は OpenReview(例:ICLR)上の投稿・レビュー(スコア)データを取得し、集計・解析・可視化するための軽量なコマンドラインツール兼ライブラリです。CLI(python -m iclr_score またはインストール後の iclr-score コマンド)で一連のワークフローを実行できるほか、src/iclr_score 配下のモジュールをノートブックやスクリプトから直接利用して柔軟に処理を組み合わせられます。設計方針として、認証情報や実データはリポジトリに含めず、環境変数や引数で渡すことでゼロセンシティブ情報(機密情報)ポリシーを守っています。合成データのサンプルのみが同梱されています。

GitHub

リポジトリの統計情報

  • スター数: 5
  • フォーク数: 1
  • ウォッチャー数: 5
  • コミット数: 3
  • ファイル数: 6
  • メインの言語: Python

主な特徴

  • 統一された CLI:投稿取得・レビュー取得・統計・プロット・Primary Area解析などのサブコマンドを提供。
  • 機密情報を含まない設計:access token や cookie はコードに埋め込まず引数/環境変数で供給。
  • モジュール化:OpenReview クライアントや集計・描画関数はライブラリとして単独利用可能。
  • 動作が軽量:Python パッケージとして pip install -e . による開発インストールに対応。

技術的なポイント

iclr-score は実用的かつ最小限の構成で OpenReview データに対する ETL(取得→処理→可視化)を実現することを目的としています。中心となるのは src/iclr_score 配下のモジュール群で、ここに OpenReview API へのインタフェース(クライアント)、レビューや投稿を取得するヘルパー、集計(平均、分布、分位、ブートストラップなどの基礎統計)、および可視化用の関数群が実装されています。CLI は python -m iclr_score またはインストール後のグローバルコマンド iclr-score をエントリポイントとしており、サブコマンド設計により個別タスク(fetch-submissions, fetch-reviews, stats, plot, primary-area-analysis 等)を独立して実行できます。

セキュリティ面の配慮として、リポジトリには access token や cookie 等の実データを含めず、必要な認証情報はコマンド引数または環境変数で渡す仕組みとなっている点が重要です。これにより公開リポジトリでの機密漏洩リスクを低減し、CI や共有スクリプトでの運用が容易になります。README にある合成サンプルは実行例や開発中の検証に使えるダミーデータです。

実装上の注意点としては、OpenReview は API レート制限や認証周りの変動があり得るため、クライアントはエラーハンドリング(再試行、バックオフ)、タイムアウト、ページネーションの堅牢な実装が望まれます。本リポジトリは基本機能を提供する軽量実装なので、運用用途ではキャッシュ(ローカル保存)、差分取得、認証情報管理(Vault 連携等)やログの整備、そして大規模データを扱う際のメモリ効率向上(ストリーミング処理、チャンク処理)を追加することで実用性が高まります。

可視化はおそらく matplotlib / seaborn 系のシンプルなプロット関数を用いており、評価スコアの分布、レビュアー間のバイアス、Primary Area ごとのスコア傾向などを描けます。これらは学術会議のメタ解析やレビュープロセスの透明化、プログラム委員会の意思決定支援に役立ちます。一方で、本格的な統計解析(混合効果モデル、傾向スコアマッチング等)はユーザーがノートブックで拡張することを想定しており、ライブラリはそのためのデータ整形と基礎集計を提供する役割に留まっています。

最後にパッケージング面では pyproject.toml を用いたモダンなビルド構成に見え、Python 3.10+ を推奨しています。小規模リポジトリであるため、CI、単体テスト、型ヒントやドキュメントの強化を行うと採用・拡張性が高まります。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file
  • .python-version: file
  • README.md: file
  • pyproject.toml: file
  • src: dir

…他 1 ファイル

まとめ

OpenReview データの収集と基本解析を素早く始められる実用的なツール群。拡張性が高く運用用途にも適応可能。

リポジトリ情報:

READMEの抜粋:

iclr-score

用于抓取并分析 OpenReview(例如 ICLR)评分数据的命令行工具集。

特性

  • 统一 CLIpython -m iclr_score ... 或安装后直接用 iclr-score,包含投稿抓取、评分抓取、统计、绘图、Primary Area 分析等子命令。
  • 零敏感信息:不再硬编码 access token、cookie 或真实数据,所有凭据通过参数 / 环境变量提供,仓库内仅保留合成示例。
  • 模块化实现src/iclr_score/ 暴露了 OpenReview 客户端与统计/绘制函数,可单独在 notebook 或脚本中复用。

快速上手

  1. 安装依赖(推荐 Python 3.10+):

    pip install -e .
    # 或者使用 uv
    uv pip install -e .
  2. 提供 OpenReview 凭据(至少需要 access token):