16日前

可変DETR:エンドツーエンド物体検出のための可変トランスフォーマー

Xizhou Zhu, Weijie Su, Lewei Lu, Bin Li, Xiaogang Wang, Jifeng Dai
可変DETR:エンドツーエンド物体検出のための可変トランスフォーマー
要約

近年、オブジェクト検出において多数の手動設計されたコンポーネントを不要にするよう提案されたDETRは、優れた性能を示している。しかし、Transformerのアテンションモジュールが画像特徴マップの処理において制限を受けるため、収束が遅く、特徴の空間分解能が限定されているという課題を抱えている。これらの問題を緩和するために、参照点の周囲に限定された少数の重要なサンプリングポイントにのみ注目するアテンションモジュールを採用したDeformable DETRを提案する。Deformable DETRは、訓練エポック数を10分の1に抑えた状態で、DETRよりも優れた性能(特に小物体に対して顕著)を達成できる。COCOベンチマーク上での広範な実験により、本手法の有効性が実証された。コードは https://github.com/fundamentalvision/Deformable-DETR にて公開されている。

可変DETR:エンドツーエンド物体検出のための可変トランスフォーマー | 最新論文 | HyperAI超神経