HyperAIHyperAI

Command Palette

Search for a command to run...

監督付きピラミッドコンテキストネットワークを用いたシーンテキスト検出

Enze Xie extsuperscript1,3,*, Yuhang Zang extsuperscript2,3,*, Shuai Shao extsuperscript3, Gang Yu extsuperscript3, Cong Yao extsuperscript3, Guangyao Li extsuperscript1 extsuperscript†

概要

近年、深層学習に基づくシーンテキスト検出手法は著しい成果を上げています。しかし、自然なシーンの多様性と複雑さのため、実世界環境で撮影された画像に適用される場合、従来の最先端テキスト検出手法でも多くの偽陽性が発生する可能性があります。この問題に対処するために、本論文ではMask R-CNNに主に着想を得て、特徴ピラミッドネットワーク(Feature Pyramid Network: FPN)とインスタンスセグメンテーションを基盤とする効果的なシーンテキスト検出モデルを提案します。我々は、テキスト領域を正確に特定しながら偽陽性を抑制する監督付きピラミッドコンテクストネットワーク(Supervised Pyramid Context Network: SPCNET)を提案します。意味情報のガイダンスとFPNの共有により、SPCNETは僅かな追加計算量で大幅な性能向上を達成しています。標準データセットでの実験結果から、我々のSPCNETが現行の最先端手法を明確に上回ることが示されています。具体的には、ICDAR2013でF値92.1%、ICDAR2015で87.2%、ICDAR2017 MLTで74.1%、Total-Textで82.9%という成績を達成しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
監督付きピラミッドコンテキストネットワークを用いたシーンテキスト検出 | 記事 | HyperAI超神経