AD-DINOv3 — DINOv3を活用したゼロショット異常検知フレームワーク
概要
AD-DINOv3は、DINOv3の強力な視覚表現をゼロショット異常検知タスクに適用するための拡張フレームワークです。中心となるアイデアは、①ドメインアライメントのための軽量アダプタを導入して事前学習済みの表現を対象ドメインに適応させること、②CLSトークン(グローバル表現)とパッチトークン(局所表現)間で双方向の補正を行うAnomaly-Aware Calibration Module(AACM)を組み込み、異常に敏感な表現を作ることです。これにより異常サンプルの事前ラベルがなくても検出性能を向上させることを目指します。
リポジトリの統計情報
- スター数: 7
- フォーク数: 0
- ウォッチャー数: 7
- コミット数: 4
- ファイル数: 2
- メインの言語: 未指定
主な特徴
- DINOv3をベースにゼロショット異常検知へ適用する初の試みを提案
- ドメインアライメント用の軽量アダプタにより低コストで適応可能
- CLSトークンとパッチトークン間の相互補正を行うAnomaly-Aware Calibration Module(AACM)
- 事前学習済み表現を活かし、追加データや大規模再学習を抑えた設計
技術的なポイント
DINOv3は自己教師あり学習により得られた視覚表現(Transformerベース)を用いるため、強力な一般化能力を持ちますが、ドメインシフトや微細な異常検出にはそのままでは最適でないことがあります。本研究の技術的核は「軽量アダプタ」と「AACM」の組合せにあります。軽量アダプタはTransformerの各層や一部に挿入される小さなモジュールで、全パラメータを凍結したままターゲットドメインに対する微調整を可能にします。これにより計算コストと過学習リスクを抑えつつ表現を局所最適化できます。AACMはCLS(グローバル)とパッチ(ローカル)表現の間で双方向の情報伝搬と補正を行い、局所的に異常なパッチがグローバル表現に与える影響を強調または抑制します。結果として、異常が局所的に発生した場合でもCLS表現とパッチ表現の整合性から異常スコアを導出しやすくなります。これらは事前学習済みDINOv3の重みを活かしつつ、追加の異常ラベルを要求しない「ゼロショット」設定での実用性を高める設計になっています。実験により複数のデータセットで有望な挙動が示された旨がREADMEで示されていますが、詳細な評価指標やトレーニング手順はリポジトリの今後の展開で追記が期待されます。
プロジェクトの構成
主要なファイルとディレクトリ:
- AD-DINOv3.png: file
- README.md: file
まとめ
DINOv3を低コストで異常検知に適応する実用的な第一歩。
リポジトリ情報:
- 名前: AD-DINOv3
- 説明: 説明なし
- スター数: 7
- 言語: null
- URL: https://github.com/Kaisor-Yuan/AD-DINOv3
- オーナー: Kaisor-Yuan
- アバター: https://avatars.githubusercontent.com/u/106362217?v=4
READMEの抜粋:
AD-DINOv3
AD-DINOv3: Enhancing DINOv3 for Zero-Shot Anomaly Detection with Anomaly-Aware Calibration
We present AD-DINOv3, the first framework to adapt DINOv3 for zero-shot anomaly detection. By introducing lightweight adapters for domain alignment and an Anomaly-Aware Calibration Module (AACM) that enables interactive calibration between the CLS token and patch tokens, AD-DINOv3 achieves stronger anomaly-aware representations. Extensive experiments on eig…