2ヶ月前

多方向シーンテキスト検出におけるコーナー局在化と領域セグメンテーション

Lyu, Pengyuan ; Yao, Cong ; Wu, Wenhao ; Yan, Shuicheng ; Bai, Xiang
多方向シーンテキスト検出におけるコーナー局在化と領域セグメンテーション
要約

以前の最先端の深層学習に基づくシーンテキスト検出方法は、おおよそ2つのカテゴリーに分類される可以说。第一カテゴリーは、シーンテキストを一般的な物体の一種として扱い、一般的な物体検出のパラダイムに従ってテキストボックスの位置を回帰することでシーンテキストを局所化しますが、任意の向きと大きなアスペクト比を持つシーンテキストに対処するのに苦労しています。第二カテゴリーは、直接テキスト領域をセグメンテーションしますが、主に複雑な後処理が必要です。本論文では、これらの2種類の方法のアイデアを組み合わせつつ、それらの欠点を回避する方法を提案します。我々は、テキストバウンディングボックスのコーナーポイントを局所化し、相対的な位置でテキスト領域をセグメンテーションすることによってシーンテキストを検出することを提案します。推論段階では、サンプリングとコーナーポイントのグループ化により候補ボックスが生成され、さらにセグメンテーションマップによってスコアリングされ、NMS(Non-Maximum Suppression)によって抑制されます。既存の方法と比較して、我々の方法は自然に向き付けられた長いテキストに対応でき、複雑な後処理も必要ありません。ICDAR2013, ICDAR2015, MSRA-TD500, MLT, COCO-Text 上での実験結果から、提案されたアルゴリズムは精度と効率性においてより良いまたは同等の結果を得ていることが示されました。VGG16 をベースとしている場合、ICDAR2015 で F値 84.3% および MSRA-TD500 で F値 81.5% を達成しています。