HyperAIHyperAI

Command Palette

Search for a command to run...

FOTS: 統一ネットワークを用いた高速向き付きテキスト検出

Xuebo Liu Ding Liang Shi Yan Dagui Chen Yu Qiao Junjie Yan

概要

偶発的なシーンテキスト検出は、文書分析コミュニティにおいて最も困難かつ価値のある課題の一つとされています。既存の多くの手法では、テキスト検出と認識を別々のタスクとして扱っています。本研究では、これらの補完的なタスク間で計算と視覚情報を共有する統一されたエンドツーエンド学習可能なFast Oriented Text Spotting (FOTS) ネットワークを提案します。特に、RoIRotateを導入することで、検出と認識の間に畳み込み特徴量を共有します。畳み込み共有戦略のおかげで、我々のFOTSはベースラインのテキスト検出ネットワークに比べて計算負荷がほとんど増加せず、共同訓練方法によりより汎用的な特徴を学習し、この手法が2段階の手法よりも優れた性能を示すことを可能にしています。ICDAR 2015、ICDAR 2017 MLT、およびICDAR 2013データセットでの実験結果は、提案手法が現行の最先端手法を大幅に上回ることを示しており、さらに初めて実時間向き付きテキストスポットティングシステムを開発できました。このシステムはICDAR 2015テキストスポットティングタスクでこれまでの最先端結果を5%以上上回りつつ、22.6 fps(フレーム毎秒)という速度を維持しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
FOTS: 統一ネットワークを用いた高速向き付きテキスト検出 | 記事 | HyperAI超神経