17日前

ダイナミックヘッド:アテンションを用いたオブジェクト検出ヘッドの統合

Xiyang Dai, Yinpeng Chen, Bin Xiao, Dongdong Chen, Mengchen Liu, Lu Yuan, Lei Zhang
ダイナミックヘッド:アテンションを用いたオブジェクト検出ヘッドの統合
要約

オブジェクト検出における局在化(localization)と分類(classification)の複雑な統合問題は、さまざまな手法の発展を促進してきました。従来の研究では、オブジェクト検出ヘッドの性能向上に向けた多様なアプローチが試みられてきましたが、それらは統一的な視点を提示できていませんでした。本論文では、アテンション(attention)を活用した新たな動的ヘッドフレームワークを提案し、オブジェクト検出ヘッドの統一を実現します。本手法は、スケール認識性を確保するための特徴レベル間の複数の自己アテンション(self-attention)の連携、空間認識性を高めるための空間的位置間の自己アテンション、およびタスク認識性を強化するための出力チャネル内の自己アテンションを一貫して統合することで、計算負荷を増加させることなく、オブジェクト検出ヘッドの表現能力を顕著に向上させます。さらに実験により、COCOベンチマーク上で本手法の有効性と効率性が実証されています。標準的なResNeXt-101-DCNバックボーンを用いることで、既存の代表的なオブジェクト検出器を大幅に上回り、54.0 APという新たな最先端性能を達成しました。さらに、最新のTransformerベースのバックボーンと追加データを用いることで、COCOベンチマークの最高記録を60.6 APまで引き上げることに成功しました。本研究のコードは、https://github.com/microsoft/DynamicHead にて公開される予定です。

ダイナミックヘッド:アテンションを用いたオブジェクト検出ヘッドの統合 | 最新論文 | HyperAI超神経