2ヶ月前

全方位シーンテキスト検出におけるシーケンシャルフリーのボックス離散化

Yuliang Liu; Sheng Zhang; Lianwen Jin; Lele Xie; Yaqiang Wu; Zhepeng Wang
全方位シーンテキスト検出におけるシーケンシャルフリーのボックス離散化
要約

野生のシーンテキストは、高い変動特性を有することが一般的です。テキストインスタンスの位置特定には四角形バウンディングボックスを使用することがほぼ不可欠となっています。しかし、最近の研究では、シーンテキスト検出のために四角形バウンディングボックスを導入すると、ラベル混乱問題が生じることが明らかになっています。この問題はしばしば見落とされ、検出性能に大幅な悪影響を与える可能性があります。本論文では、この問題に対処するために、新しい手法であるSequential-free Box Discretization(SBD)を提案します。SBDはバウンディングボックスを主要エッジ(KE)に離散化し、より効果的な方法を導き出すことで検出性能の向上を目指します。実験結果は、提案手法がICDAR 2015、MLT、MSRA-TD500などの多くの人気のあるシーンテキストベンチマークで最先端の手法を上回ることを示しています。アブレーションスタディでも、Mask R-CNNフレームワークにSBDを単純に統合するだけで検出性能が大幅に向上することを確認しました。さらに、一般物体データセットHRSC2016(多方向船隻)での実験では、提案手法が最近の最先端手法よりも大きく優れていることが示され、その強力な汎化能力が証明されました。ソースコード: https://github.com/Yuliang-Liu/Box_Discretization_Network

全方位シーンテキスト検出におけるシーケンシャルフリーのボックス離散化 | 最新論文 | HyperAI超神経