11日前

マルチタスクAETによる直交接線正則化を用いた暗黒物体検出

Ziteng Cui, Guo-Jun Qi, Lin Gu, Shaodi You, Zenghui Zhang, Tatsuya Harada
マルチタスクAETによる直交接線正則化を用いた暗黒物体検出
要約

暗い環境は光子の不足と不適切なノイズのため、コンピュータビジョンアルゴリズムにとって大きな課題となる。暗環境における物体検出の性能向上を目的として、本研究では、照明条件の変化に伴う内在的パターンを探索可能な新しいマルチタスク自己符号化変換(Multitask Auto Encoding Transformation, MAET)モデルを提案する。MAETは自己教師学習の枠組みのもとで、物理的ノイズモデルおよび画像信号処理(Image Signal Processing, ISP)を考慮した現実的な照明劣化変換を符号化・復号することで、内在的な視覚構造を学習する。この表現に基づき、バウンディングボックスの座標とクラスラベルを復号することで物体検出タスクを実現する。2つのタスク間の過剰な混同を回避するため、MAETは直交接線正則性(orthogonal tangent regularity)を導入し、物体特徴と劣化特徴を分離する。これにより、各タスクの出力における接線間の直交性を最大化することで、マルチタスク予測を幾何学的に定式化したパラメトリック多様体(parametric manifold)が構築される。本フレームワークは、主流の物体検出アーキテクチャに基づいて実装可能であり、VOCやCOCOといった通常の物体検出データセットを用いてエンド・トゥ・エンドで直接学習可能である。合成データおよび実世界データを用いた実験において、最先端の性能を達成した。コードは以下のURLから公開されている:https://github.com/cuiziteng/MAET。

マルチタスクAETによる直交接線正則化を用いた暗黒物体検出 | 最新論文 | HyperAI超神経