2ヶ月前

グリッドR-CNN

Xin Lu; Buyu Li; Yuxin Yue; Quanquan Li; Junjie Yan
グリッドR-CNN
要約

本論文では、Grid R-CNNと名付けられた新しい物体検出フレームワークを提案します。このフレームワークは、正確な物体検出のためのグリッドガイダンス位置特定メカニズムを採用しています。従来の回帰ベースの手法とは異なり、Grid R-CNNは空間情報を明示的に捉え、完全畳み込みアーキテクチャの位置感度特性を享受しています。2つの独立した点だけを使用するのではなく、より多くの手がかりをエンコードし、特定の点の予測精度が低い影響を軽減するために、多点監督式フォーミュレーションを設計しました。グリッド内の点の相関性を最大限に活用するために、近傍グリッドポイントの特徴マップを融合する2段階情報融合戦略を提案します。グリッドガイダンス位置特定アプローチは、最先端の検出フレームワークに容易に拡張できます。Grid R-CNNは高品質な物体位置特定を実現しており、実験結果ではCOCOベンチマークにおいてRes50バックボーンとFPNアーキテクチャを使用したFaster R-CNNと比較してIoU=0.8で4.1% AP向上、IoU=0.9で10.0% AP向上を達成しています。注:- "AP" は "Average Precision" の略です。- "IoU" は "Intersection over Union" の略です。- "FPN" は "Feature Pyramid Network" の略です。

グリッドR-CNN | 最新論文 | HyperAI超神経