
要約
従来のテキスト検出方法は主に四角形のテキストに焦点を当てています。本研究では、自然環境における任意形状のテキストを検出するために、スライディングラインポイント回帰(SLPR)という新しい手法を提案します。SLPRは、テキスト行の縁にある複数の点を回帰し、これらの点を利用してテキストの輪郭を描きます。提案するSLPRは、Faster R-CNNやR-FCNなどの多くの物体検出アーキテクチャに適応することができます。具体的には、まず領域提案ネットワーク(RPN)を使用して、テキストを含む最小の矩形ボックスを生成します。その後、垂直および水平方向にスライドする線を利用して、テキストの縁にある点を等間隔で回帰します。情報の有効活用と冗長性の削減のために、矩形ボックスの位置から目標点のx座標またはy座標を計算し、残りのy座標またはx座標のみを回帰します。これによりシステムのパラメータ数を削減するとともに、より規則的な多角形となる点も制約できます。当手法は伝統的なICDAR2015偶発的シーンテキストベンチマークおよび曲線テキスト検出データセットCTW1500において競争力のある結果を得ました。