11日前

PhysAug:単一ドメイン拡張型オブジェクト検出のための物理的ガイダンスと周波数ベースのデータ拡張

Xiaoran Xu, Jiangang Yang, Wenhui Shi, Siyuan Ding, Luqing Luo, Jian Liu
PhysAug:単一ドメイン拡張型オブジェクト検出のための物理的ガイダンスと周波数ベースのデータ拡張
要約

単一ドメイン一般化物体検出(Single-Domain Generalized Object Detection, S-DGOD)は、物体検出器を活用して、一つのソースドメインで学習を行うことで、さまざまな未観測のターゲットドメインにおいても堅牢な性能を発揮することを目指している。従来のS-DGOD手法は、視覚的変換の組み合わせを含むデータ拡張戦略に依存することが多い。しかし、現実世界の事前知識が欠如しているため、データ拡張は訓練データ分布の多様性を十分に促進できないという課題がある。この問題に対処するため、本研究では物理モデルに基づく非理想画像条件を想定したデータ拡張手法「PhysAug」を提案する。大気光学の原理を基に、普遍的な摂動モデルを構築し、PhysAugの基盤としている。視覚的摂動は通常、光と大気中の微粒子との相互作用によって生じるため、画像の周波数スペクトルを用いて訓練中に現実世界の変動をシミュレートする。このアプローチにより、検出器がドメイン不変な表現を学習する能力が向上し、さまざまな設定下での一般化性能が強化される。ネットワークアーキテクチャや損失関数を変更せずに、本手法は複数のS-DGODデータセットにおいて最先端の手法を顕著に上回っている。特に、DWDおよびCityscapes-Cにおいてベースライン比でそれぞれ7.3%および7.2%の大幅な性能向上を達成し、現実世界における高い一般化能力を示している。

PhysAug:単一ドメイン拡張型オブジェクト検出のための物理的ガイダンスと周波数ベースのデータ拡張 | 最新論文 | HyperAI超神経