HyperAIHyperAI

Command Palette

Search for a command to run...

形状頑健なシーンテキスト検出のためのスライドラインポイント回帰

Zhu Yixing Du Jun

概要

従来のテキスト検出手法は、主に四角形のテキストに焦点を当てている。本研究では、自然シーンにおける任意形状のテキストを検出するため、スライディングラインポイント回帰(Sliding Line Point Regression, SLPR)と呼ばれる新たな手法を提案する。SLPRは、テキストラインの輪郭上に複数の点を回帰し、その点を用いてテキストの輪郭を描画する。提案手法であるSLPRは、Faster R-CNNやR-FCNなど、多くの物体検出アーキテクチャに適応可能である。具体的には、まず領域提案ネットワーク(RPN)を用いてテキストを含む最小の矩形ボックスを生成し、その後、垂直および水平方向のスライディングラインを用いて、テキスト輪郭上の点を等長的に回帰する。情報を効果的に活用し、冗長性を低減するため、ターゲット点のx座標またはy座標を矩形ボックスの位置から計算し、残りの一方の座標のみを回帰する。これにより、システムのパラメータ数を削減するとともに、より規則的な多角形を生成する点の出現を抑制できる。本手法は、従来のICDAR2015インシデントシーンテキストベンチマークおよびカーブテキスト検出データセットCTW1500において、競争力ある結果を達成した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
形状頑健なシーンテキスト検出のためのスライドラインポイント回帰 | 記事 | HyperAI超神経