HyperAIHyperAI

Command Palette

Search for a command to run...

多方向テキストの検出に向けたコーナーベースの領域提案

Linjie Deng Yanxiang Gong Yi Lin Jingwen Shuai Xiaoguang Tu Yuefei Zhang Zheng Ma Mei Xie

概要

従来のシーンテキスト検出手法は、通常、手動で定義されたスライディングウィンドウに依存しています。本研究では、テキスト形状に関する事前知識なしで多方向テキストを検出する直感的な二段階領域ベースの方法を提案します。第一段階では、デフォルトのアンカーをシフトする代わりに、コーナーを検出して連結することで、テキストインスタンスの可能な位置を推定します。四角形の候補は幾何学的に適応可能であり、これにより当手法はさまざまなアスペクト比と向きのテキストに対応できます。第二段階では、Dual-RoI Pooling(デュアルRoIプーリング)と呼ばれる新しいプーリング層を設計し、領域ごとのサブネットワーク内にデータ拡張を組み込むことで、これらの候補に対するより堅牢な分類と回帰を実現します。公開ベンチマークでの実験結果は、提案手法が最先端の手法と同等の性能を達成できることを確認しています。コードは https://github.com/xhzdeng/crpn で公開されています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています