Command Palette
Search for a command to run...
形状頑健なシーンテキスト検出のためのスライドラインポイント回帰
形状頑健なシーンテキスト検出のためのスライドラインポイント回帰
Zhu Yixing Du Jun
概要
従来のテキスト検出手法は、主に四角形のテキストに焦点を当てている。本研究では、自然シーンにおける任意形状のテキストを検出するため、スライディングラインポイント回帰(Sliding Line Point Regression, SLPR)と呼ばれる新たな手法を提案する。SLPRは、テキストラインの輪郭上に複数の点を回帰し、その点を用いてテキストの輪郭を描画する。提案手法であるSLPRは、Faster R-CNNやR-FCNなど、多くの物体検出アーキテクチャに適応可能である。具体的には、まず領域提案ネットワーク(RPN)を用いてテキストを含む最小の矩形ボックスを生成し、その後、垂直および水平方向のスライディングラインを用いて、テキスト輪郭上の点を等長的に回帰する。情報を効果的に活用し、冗長性を低減するため、ターゲット点のx座標またはy座標を矩形ボックスの位置から計算し、残りの一方の座標のみを回帰する。これにより、システムのパラメータ数を削減するとともに、より規則的な多角形を生成する点の出現を抑制できる。本手法は、従来のICDAR2015インシデントシーンテキストベンチマークおよびカーブテキスト検出データセットCTW1500において、競争力ある結果を達成した。