13日前

ベータR-CNN:別の視点から歩行者検出を考察する

Zixuan Xu, Banghuai Li, Ye Yuan, Anhong Dang
ベータR-CNN:別の視点から歩行者検出を考察する
要約

最近、歩行者検出において顕著な進展が見られつつあるが、遮蔽や混雑したシーンにおいて高い性能を達成することは依然として困難である。その主な原因は、広く用いられている歩行者の表現方法、すなわち2次元軸平行バウンディングボックス(axis-aligned bounding box)に起因する。この表現法は、物体の概略的な位置とサイズしか記述できず、ボックス内部を均一な分布としてモデル化するため、遮蔽や混雑した状況下ではノイズが大きく、歩行者同士を区別することが困難となる。この問題を解消するため、本研究では2次元ベータ分布に基づく新たな表現法「ベータ表現(Beta Representation)」を提案する。この表現法は、全身ボックスと可視ボックスの関係を明示的に構築することで、歩行者をより精緻に描写し、視覚的質量の中心に注目して各ピクセルに異なる確率値を割り当てることで、視覚的重心を強調する。その結果、新たなNMS戦略「ベータNMS(BetaNMS)」を導入することで、混雑したシーンにおける高度に重複するインスタンスの区別が大幅に改善された。さらに、ベータ表現の潜在能力を最大限に引き出すために、ベータヘッド(BetaHead)およびベータマスク(BetaMask)を搭載した新規パイプライン「ベータR-CNN(Beta R-CNN)」を提案し、遮蔽や混雑した状況下でも高い検出性能を実現した。

ベータR-CNN:別の視点から歩行者検出を考察する | 最新論文 | HyperAI超神経