2ヶ月前

多方向テキストの検出に向けたコーナーベースの領域提案

Linjie Deng; Yanxiang Gong; Yi Lin; Jingwen Shuai; Xiaoguang Tu; Yuefei Zhang; Zheng Ma; Mei Xie
多方向テキストの検出に向けたコーナーベースの領域提案
要約

従来のシーンテキスト検出手法は、通常、手動で定義されたスライディングウィンドウに依存しています。本研究では、テキスト形状に関する事前知識なしで多方向テキストを検出する直感的な二段階領域ベースの方法を提案します。第一段階では、デフォルトのアンカーをシフトする代わりに、コーナーを検出して連結することで、テキストインスタンスの可能な位置を推定します。四角形の候補は幾何学的に適応可能であり、これにより当手法はさまざまなアスペクト比と向きのテキストに対応できます。第二段階では、Dual-RoI Pooling(デュアルRoIプーリング)と呼ばれる新しいプーリング層を設計し、領域ごとのサブネットワーク内にデータ拡張を組み込むことで、これらの候補に対するより堅牢な分類と回帰を実現します。公開ベンチマークでの実験結果は、提案手法が最先端の手法と同等の性能を達成できることを確認しています。コードは https://github.com/xhzdeng/crpn で公開されています。

多方向テキストの検出に向けたコーナーベースの領域提案 | 最新論文 | HyperAI超神経