3ヶ月前
点を軸に射影する:点-軸表現を用いた方向付きオブジェクト検出
Zeyang Zhao, Qilong Xue, Yuhang He, Yifan Bai, Xing Wei, Yihong Gong

要約
本稿では、方向付き物体検出に向けた「点-軸表現(point-axis representation)」を提案する。この表現は、空間的広がりと形状の明示、および方向性の定義という二つの主要な要素(点と軸)を用いることで、高い柔軟性と幾何学的に直感的な特性を備えている。1)点は物体の空間的範囲および輪郭を定義し、詳細な形状情報を提供する。2)軸は物体の主方向性を定義し、正確な検出に不可欠な方向情報(オイエンテーション情報)を提供する。点-軸表現は位置と回転を分離することで、従来のバウンディングボックスベースのアプローチで頻発する損失関数の不連続性問題を解決する。さらに、追加のアノテーションを導入せずに効果的な最適化を実現するため、点集合学習を監視するための「マックス投影損失(max-projection loss)」と、頑健な軸表現学習を促進する「クロス軸損失(cross-axis loss)」を提案する。また、この表現を活用して、DETRフレームワークを自然に統合した「Oriented DETRモデル」を構築し、点-軸の高精度な予測とエンド・ツー・エンド検出を実現する。実験結果から、方向付き物体検出タスクにおいて顕著な性能向上が確認された。