2ヶ月前

EAST: 高効率かつ高精度なシーンテキスト検出器

Zhou, Xinyu ; Yao, Cong ; Wen, He ; Wang, Yuzhi ; Zhou, Shuchang ; He, Weiran ; Liang, Jiajun
EAST: 高効率かつ高精度なシーンテキスト検出器
要約

以前のシーンテキスト検出手法は、さまざまなベンチマークにおいて有望な性能を達成しています。しかし、これらの手法は、深層ニューラルネットワークモデルを用いていても、困難なシナリオではしばしば不十分な結果に終わります。これは、全体的な性能がパイプライン内の複数の段階とコンポーネントの相互作用によって決定されるためです。本研究では、単純でありながら強力なパイプラインを提案します。このパイプラインは、単一のニューラルネットワークを使用して、フル画像から任意の向きや四角形形状の単語やテキスト行を直接予測し、不要な中間ステップ(例:候補の集約や単語分割)を排除します。当該パイプラインの単純さにより、損失関数やニューラルネットワークアーキテクチャの設計に集中することができるようになりました。ICDAR 2015, COCO-Text, MSRA-TD500などの標準データセットにおける実験結果は、提案されたアルゴリズムが精度と効率性の両面で最先端の手法を大幅に上回ることを示しています。特にICDAR 2015データセットにおいては、提案されたアルゴリズムが720p解像度で13.2fpsでF値0.7820を達成しました。

EAST: 高効率かつ高精度なシーンテキスト検出器 | 最新論文 | HyperAI超神経